Blog elhacker.NET: T3MP3ST: Framework que convierte agentes de IA en cazadores de bugs 0-day

T3MP3ST: Framework que convierte agentes de IA en cazadores de bugs 0-day

Sunday, July 5, 2026 | Posted by el-brujo | Edit Post

Se ha lanzado T3MP3ST, un nuevo marco de seguridad de código abierto desarrollado por el investigador elder-plinius. Esta herramienta permite transformar agentes de codificación de IA de propósito general (como Claude Code, Codex de OpenAI y Hermes) en operadores autónomos de red-teaming. T3MP3ST funciona como una capa de orquestación multi-agente que no requiere nuevas claves de API ni infraestructura en la nube, convirtiendo a estos agentes en cazadores de vulnerabilidades 0-day.

Un marco de seguridad de código abierto recién lanzado llamado T3MP3ST está convirtiendo a los agentes de codificación de IA de propósito general como Claude Code, Codex de OpenAI y Hermes en operadores autónomos de red-teaming sin requerir nuevas claves de API, infraestructura en la nube o facturación adicional.

Creado por el investigador elder-plinius, T3MP3ST actúa como una capa de orquestación multiagente en lugar de lanzar su propio modelo, coordinando múltiples instancias de agentes a través de una cadena de ataque que va desde el reconocimiento hasta la explotación y el informe.

Tú diriges el marco hacia un objetivo autorizado a través de una interfaz web llamada "War Room" o mediante la línea de comandos (CLI), y el agente de codificación de IA que ya se está ejecutando en tu máquina se convierte en el cerebro operativo que impulsa la misión.

El marco se describe como "guerra sin claves", ya que aprovecha las sesiones de agentes existentes en lugar de exigir claves de proveedor independientes, y aplica una contención del alcance de salida para que las herramientas en red rechacen automáticamente tocar hosts públicos fuera del alcance.

Marco de Seguridad T3MP3ST

T3MP3ST afirma tener una puntuación pass@1 del 90,1% en la suite XBEN de 104 desafíos de XBOW, un benchmark de caja negra que la propia XBOW reporta en aproximadamente un 85%, donde cada solución se califica contra un oráculo de banderas comprometido que un comando "verify-claims" recomputa a petición para garantizar la reproducibilidad. En Cybench, un benchmark académico de 40 tareas, el bucle ReAct de agente único del marco logró 23/40 soluciones sin pistas.

Más notablemente, en un conjunto reservado de 10 CVE reales revelados en 2026 en siete lenguajes de programación, un solo agente localizó 8 de las 10 vulnerabilidades en el archivo, línea y clasificación CWE exactos, mientras que el paquete de herramientas más amplio detectó los 10 resultados. Los desarrolladores consideran que esto es orientativo dado el pequeño tamaño de la muestra, pero significativo porque los errores son posteriores al corte de entrenamiento del modelo, descartando así la memorización.

El diseño del marco mapea una cadena de ataque de 8 operadores (Reconocimiento, Escáner, Explotador, Infiltrador, Exfiltrador, Fantasma, Coordinador y Analista) sobre las tácticas de MITRE ATT&CK y la Cyber Kill Chain, aunque actualmente solo el motor de reconocimiento y el bucle de explotación de agente único están probados y estables, y pueden clonarse desde GitHub.

Los operadores posteriores ejecutan el mismo bucle de razonamiento respaldado por herramientas que el de reconocimiento, pero siguen clasificados como experimentales, ya que la explotación coordinada de enjambre de extremo a extremo aún no ha sido validada a escala.

Dominio	Estado
Apps web (suite XBEN)	Estable, probado
Desafíos CTF (Cybench)	Estable, probado
OSS Embebido/OT/Robótica	Pipeline estable, divulgación coordinada
Código fuente (caja blanca)	Experimental, ingesta solo Python
Smart contracts (DeFi)	Experimental, solo reproducción
Cloud, móvil, AD, RE binario	Hoja de ruta/en desarrollo

Investigadores de seguridad en plataformas como la comunidad blueteamsec de Reddit han señalado este lanzamiento como notable para el red-teaming autónomo, siguiéndolo junto con el impulso general de la industria hacia las herramientas de seguridad impulsadas por IA.

Esto sigue a desarrollos relacionados como el modelo Mythos de Anthropic, que XBOW evaluó por separado como una mejora sustancial en la generación guiada por vulnerabilidades y el análisis de seguridad del código fuente, reduciendo los falsos negativos en un 42% en benchmarks de explotación comparables.

Los desarrolladores destacan que T3MP3ST es estrictamente para pruebas autorizadas, investigación y educación, lanzado bajo la licencia AGPL-3.0 sin garantía. El uso no autorizado contra sistemas sin permiso explícito por escrito sigue siendo ilegal en la mayoría de las jurisdicciones, y la responsabilidad de mantenerse dentro de los límites legales y las reglas de enfrentamiento recae enteramente en ti como operador.

Fuentes:
https://cybersecuritynews.com/t3mp3st-security-framework/

Labels: automatización , ciberseguridad , framework , hacking , inteligencia artificial , vulnerabilidad

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Labels

Entradas populares

T3MP3ST: Framework que convierte agentes de IA en cazadores de bugs 0-day

Marco de Seguridad T3MP3ST

0 comments :

Post a Comment