Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
5156
)
-
▼
junio
(Total:
773
)
-
Marketplace OpenClaw expone agentes de IA a malwar...
-
Vulnerabilidades en IA de Red-Team permiten robo d...
-
Usan Cisco y Google para propagar malware SharkLoader
-
Euro digital: avance final
-
Fallo de integración en ManageEngine AD360 expone ...
-
IBM anuncia un chip de tecnología sub-nanómetro: l...
-
El rechazo a la IA
-
La policía de Londres implementa reconocimiento fa...
-
Publican exploit PoC para vulnerabilidad de ejecuc...
-
Condenan a 18 meses de prisión a DraftKings conoci...
-
Samsung busca talentos en España
-
China supera a EE. UU. en supercomputación y Linux...
-
Lanzado Gemini 3.5 Flash con funciones de uso de o...
-
Aplicaciones de Laravel Livewire comprometidas par...
-
Rusia usó herramienta de Cellebrite para hackear i...
-
TSMC sube precios: por qué te afecta
-
WhatsApp avisará al iniciar chats con números nuevos
-
Micron marca récord y avisa: 16 acuerdos hasta 203...
-
Puerta trasera de Rust en macOS usa shell y Telegr...
-
Anthropic acusa a Alibaba de usar 25.000 cuentas f...
-
Vulnerabilidad de 25 años en cURL finalmente parch...
-
Detectan capacidad de inyección de scripts en bloq...
-
Bluekit: el kit de phishing que usa técnica Browse...
-
Home Assistant OS 18.0: arranca más rápido y ocupa...
-
LineShine, el nuevo superordenador chino Top #1 mu...
-
Superhuman compra GPTZero
-
Lector de documentos falso con 100 mil descargas e...
-
Anthropic acusa a Alibaba de acceder ilícitamente ...
-
Vulnerabilidades críticas de Webmin permiten supla...
-
COSMIC 1.1 añade monitor de sistema y mejoras
-
SteamOS 3.8 ya permite crear tu propia Steam Machi...
-
Claude bajo sospecha por privacidad de datos
-
Microsoft usa IA para eliminar malware global
-
Google mejora Gemini 1.5 Flash para programadores
-
SAP prevé el fin de sus programadores en 4 años
-
Nuevo phishing abusa de Outlook y grupos de Micros...
-
Intel y AMD acelerarán IA con hardware dedicado
-
La Casa Blanca ordena migrar sistemas a criptograf...
-
SteamOS recibirá soporte de NVIDIA
-
Publican exploit PoC para vulnerabilidad de escala...
-
OpenAI lanza Jalapeño su propio chip de IA
-
Microsoft insta a administradores de TI a preparar...
-
Chrome añade botón de IA en su barra
-
Compró Google.com por 12 dólares en 2015
-
WhatsApp: copias de seguridad desde los ajustes de...
-
Mejores herramientas de monitoreo de red para Linux
-
Miembros de Scattered Spider que atacaron el trans...
-
Investigador gana 148.337 $ por vulnerabilidad RCE...
-
Commodore vuelve con un móvil minimalista
-
IA maliciosa evade escaneos y toma el control de 2...
-
Un hacker entra en sistemas críticos de la FIFA y ...
-
España busca atraer una Gigafab de IA con 719 mill...
-
Nuevo ransomware Prinz Eugen prioriza el cifrado d...
-
Tras las críticas, AMD restaura el cifrado de memo...
-
GTA VI costará 80 euros/dólares
-
Windows 11 26H2 ya en preview
-
Half-Life 3: realidades y rumores
-
Microsoft permite bloquear el acceso de Copilot a ...
-
Análisis del router ASUS RT-BE90U: triple banda Wi...
-
Rendimiento de la Steam Machine: inferior a un PC ...
-
Ucrania equipará todos sus drones con IA de Palantir
-
AMD lanza oficialmente FSR 4.1 para las GPU Radeon...
-
Olivetti: la empresa debe generar cultura y democr...
-
Vulnerabilidad crítica de FFmpeg permite convertir...
-
Paquetes maliciosos de npm se hacen pasar por herr...
-
Vulnerabilidad crítica en libssh2 permite ejecució...
-
Robots mendigos aparecen en China pidiendo dinero ...
-
Datos de clientes de LastPass expuestos en ataque ...
-
GPT-Bidi-1: la IA de voz humana de OpenAI
-
Vulnerabilidad de 8 años en Samsung KNOX expone di...
-
La potente IA Mythos de Anthropic supuestamente vu...
-
Ataque de phishing en WhatsApp utiliza falsos docu...
-
Cómo saber si te bloquearon en WhatsApp vía cifrado
-
Campaña de WhatsApp mediante VBScript emplea docum...
-
Claude Mythos Preview ayuda a descubrir vulnerabil...
-
Guía de bug bounty: qué es y cómo participar
-
OpenAI impulsa Daybreak con GPT-5.5-Cyber para ayu...
-
WhatsApp permitirá enviar audios sin abrir la app
-
Windows 11 eliminará los cuelgues de GPU
-
La ASUS ROG Astral RTX 5090 Edition 20 llegará a E...
-
GPT-5.5 Cyber detecta y corrige fallos de software
-
IA transforma Photoshop, Premiere y Lightroom
-
Mozilla parchea Firefox tras problemas y crasheos ...
-
Robocop despedido: un año sin resultados
-
Google establece el 30 de septiembre como límite p...
-
Va a hacer el mantenimiento de su AORUS GeForce RT...
-
Windows 11 optimiza su buscador
-
QNAP corrige fallos de inyección que permiten ejec...
-
El fallo Squidbleed, un error de 29 años en el pro...
-
pgAdmin 4 lanza correcciones de seguridad y nuevas...
-
Brasil inicia indagación por falla en sistema de a...
-
Consejos para optimizar Mozilla Firefox
-
Vulnerabilidad en Apple Beats Studio Buds permite ...
-
Cloudflare se alía con los principales navegadores...
-
La agencia de inteligencia de Canadá empleó una or...
-
Headroom reduce hasta un 92% los tokens de LLM
-
Lectores de Gizmodo reciben avisos de malware Clic...
-
Apps de iOS con IA filtran credenciales de API de LLM
-
WhatsApp quiere que otros sepan fácilmente si está...
-
Comentario de 13 palabras en Reddit puede envenena...
-
Muere Claude Guillemot fundador de Ubisoft
-
Infectan más de 10.000 repositorios de GitHub para...
-
Enfría su GPU con hielo y baja 40 grados
-
China creará centros de IA espaciales para rivaliz...
-
Una GeForce RTX 4070 SUPER sobrevive a una novia y...
-
Intel y AMD preparan ACE: nueva extensión x86 para...
-
CyberSentinel AI: 33 herramientas de seguridad con...
-
Miles de routers D-Link en todo el mundo fueron in...
-
Modelo Mythos de Anthropic vulneró sistemas clasif...
-
HDMI 2.2 en camino
-
INTERPOL alerta sobre el aumento de estafas con IA...
-
China crea supercomputadora sin GPU
-
Una ASUS ROG Astral RTX 5090 deja marcas de calor ...
-
Un Ryzen 9 9900X deja de funcionar tras usar una B...
-
Ransomware GentleKiller anula más de 400 procesos ...
-
Guía de Gemma 4 12B para programar gratis
-
Noruega prohíbe la IA en primaria
-
AutoJack: una web puede secuestrar tu agente de IA...
-
Chatbots en EE.UU. generan desconfianza social
-
Microsoft dará fin al soporte de Office 2021
-
De programar a guiar la IA
-
Guía elección CPU y GPU
-
Joven hacker empleó Tailscale y OpenSSH para mante...
-
Trump exige a Anthropic bloquear jailbreaks o elim...
-
Vulnerabilidad en Splunk AI Toolkit permite ejecuc...
-
IA de NVIDIA aprende a instalar GPUs
-
Análisis del router ASUS ProArt PRT-BE5000: Wi-Fi ...
-
Un SSD SATA II de hace 16 años sobrevive a 1 PB de...
-
-
▼
junio
(Total:
773
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Christian Klein, CEO de SAP , advierte que en 3 o 4 años la IA podría sustituir la programación humana , obligando al sector a un cambio es...
-
Gemma 4 12B se presenta como una alternativa gratuita y local a Claude Code para ayudar a programar con IA , permitiendo ejecutar el model...
-
Intel presenta Crescent Island , su nueva generación de tarjetas gráficas Xe3P que contará con un conector de 16 pines y hasta 160 GB de L...
Vulnerabilidades en IA de Red-Team permiten robo de claves API y compromiso de sistemas
Un análisis de seguridad pionero de 12 herramientas de seguridad ofensiva agénticas ampliamente desplegadas revela fallos arquitectónicos críticos que permiten a los adversarios robar claves API de LLM, establecer puntos de apoyo persistentes y lograr el compromiso total del host, incluso dentro de contenedores aislados (sandboxed).
Investigadores de seguridad de Cracken han publicado el primer análisis de seguridad exhaustivo de sistemas de red-team agénticos, herramientas impulsadas por IA diseñadas para realizar de forma autónoma pruebas de penetración y operaciones de seguridad ofensiva.
El estudio expone un conjunto generalizado de fallos de diseño compartidos que permiten a un adversario activo exfiltrar credenciales sensibles, convertir la propia infraestructura de la víctima en un arma y comprometer totalmente la máquina del operador, incluso cuando el agente se ejecuta dentro de un contenedor Docker aislado.
Vulnerabilidades de las Herramientas de IA de Red-Team
Los sistemas agénticos de red-team son plataformas totalmente autónomas impulsadas por LLM, construidas para simular operaciones de seguridad ofensiva, incluyendo pruebas de penetración de caja negra.
Los investigadores analizaron 12 herramientas populares de código abierto, incluyendo PentestGPT, RedAmon, DarkMoon, AIRecon, CAI, PentAGI, STRIX, Artemis, METATRON y otras; todas ellas combinan un orquestador de modelo de lenguaje extenso con un contenedor de trabajo Kali Linux capaz de ejecutar comandos de shell arbitrarios contra los objetivos.
.webp)
Estas herramientas están entrando rápidamente en los flujos de trabajo de seguridad de producción, con una adopción acelerada en los equipos de seguridad empresariales y un creciente interés de las fuerzas ciber-militares, lo que convierte su superficie de ataque en un área de preocupación urgente.
Los investigadores introducen una cadena de ataque (cyber kill chain) adaptada específicamente para sistemas agénticos de red-team, que progresa a través de cinco etapas:
- RCE del trabajador mediante manipulación del agente — El atacante despliega un honeypot que contiene un payload preparado maliciosamente. Sin ninguna inyección de prompt explícita, el agente lo descarga y lo ejecuta, concediendo una shell inversa en el contenedor del trabajador.
- Escalada de privilegios — El aislamiento débil del sistema de archivos o de la red entre los contenedores del trabajador y el orquestador permite el movimiento lateral. En PentestGPT, un volumen de Docker escribible expuso el archivo
settings.jsondel orquestador, permitiendo la inyección de hooks que activaban una RCE en el orquestador en cada inicio de sesión posterior. - Persistencia — Los atacantes envenenan componentes no volátiles: archivos de código fuente, directorios de servidores MCP expuestos mediante montajes de vinculación (bind mounts), o almacenes de memoria episódica. El código troyanizado restablece el punto de apoyo automáticamente al reiniciar el contenedor.
- Escape del sandbox — Los montajes de sockets de Docker mal configurados y el acceso a la red del host permiten al atacante lanzar contenedores directamente en el demonio Docker del host, saliendo completamente del entorno aislado.
- Compromiso del host — Se logra la ejecución completa de código en la máquina del operador, lo que permite la instalación tradicional de C2 y actividades de post-explotación.

Un hallazgo particularmente alarmante es el novedoso ataque de phishing para agentes, una técnica de manipulación sin inyección de prompts que logró un éxito del 97,8% en todos los agentes y LLM probados.
El atacante coloca un binario totalmente funcional (por ejemplo, un descriptor de claves de contraseña llamado pwcrypt) en un honeypot controlado por el adversario, completo con un README convincente y registros de pipeline de CI fabricados.
El agente descarga y ejecuta el binario, creyendo que es un artefacto crítico. El binario contiene una vulnerabilidad de corrupción de memoria autoinyectada, no código malicioso, que se activa al ejecutarse y secuestra el flujo de control para lograr la ejecución de código arbitrario.
Esto anula completamente la inspección basada en modelos, ya que no hay shellcode, payload codificado ni patrones de llamadas al sistema sospechosos. El ataque fue efectivo contra Claude Opus 4.8, GPT-5.5, Gemini 3.1 Pro, DeepSeek V4 Pro, GLM-5.1 y Kimi K2.6.
Una vez establecido el punto de apoyo, la exfiltración de secretos es trivialmente alcanzable en 11 de las 12 herramientas analizadas. La mayoría de los frameworks ubican al trabajador y al orquestador en el mismo contenedor, exponiendo directamente las claves API del LLM y la memoria entre sesiones.
En RedAmon, una clave API interna compartida y una red puente de Docker no autenticada permitieron al atacante enumerar y exfiltrar el historial de conversaciones, incluyendo hosts objetivo y credenciales de cada usuario en todas las sesiones.
Siete de las doce herramientas implementan barandillas (guardrails), filtros de regex o validadores de "LLM como juez" para bloquear objetivos sensibles. El estudio concluye que ninguno es efectivo.
Las barandillas se aplican solo en la capa de orquestación, validando las decisiones del LLM pero nunca monitoreando la actividad de red real del trabajador. Un atacante con una shell de trabajador elude cada barandilla de forma invisible, un problema reflejado en la reciente divulgación de Microsoft de CVE-2026-25592 y CVE-2026-26030 en Semantic Kernel, donde los investigadores confirmaron que los LLM no son límites de seguridad.
Los investigadores proponen una arquitectura segura basada en una invariante: trata al trabajador de LLM como un entorno no confiable. Los principios clave incluyen una separación estricta entre trabajador y orquestador sin montajes compartidos escribibles, segmentación de red autenticada, aislamiento de secretos (las claves API nunca deben llegar al trabajador), aplicación de barandillas en la capa del trabajador mediante filtrado de salida de red y sistemas de archivos de trabajador inmutables que se reconstruyan entre operaciones.
Fuentes:
https://cybersecuritynews.com/red-team-ai-tool-vulnerabilities/

Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.