Blog elhacker.NET: Pentest Agent Suite: framework de bug bounty para Claude Code y 6 herramientas de IA

Pentest Agent Suite: framework de bug bounty para Claude Code y 6 herramientas de IA

lunes, 25 de mayo de 2026 | Publicado por el-brujo | Editar entrada

Se ha lanzado en código abierto Pentest Agent Suite, un marco de trabajo totalmente autónomo para la búsqueda de errores (bug-bounty). Esta herramienta ofrece 50 agentes de seguridad especializados, 26 comandos de barra y 19 herramientas de CLI. Además, es compatible con siete plataformas principales de codificación por IA, incluyendo Claude Code, OpenAI Codex, Google Gemini, Cursor, Windsurf, VS Code Copilot y OpenClaw. El proyecto fue publicado en GitHub por el investigador H-mmer.

Se ha liberado como código abierto un framework de bug-bounty totalmente autónomo llamado Pentest Agent Suite, que ofrece 50 agentes de seguridad especializados, 26 comandos de barra (slash commands), 19 herramientas de CLI y un instalador compatible con múltiples IDE en siete de las principales plataformas de codificación con IA: Claude Code, OpenAI Codex, Google Gemini, Cursor, Windsurf, VS Code Copilot y OpenClaw.

El proyecto, publicado en GitHub por el investigador H-mmer, se presenta como una plataforma de seguridad cohesiva con memoria persistente, integración en vivo con plataformas de bug-bounty y un motor de búsqueda semántica de reportes respaldado por FAISS, que los agentes consultan en tiempo real para encontrar antecedentes antes de probar una clase de vulnerabilidad.

Pentest Agent Suite se organiza en tres capas: 50 agentes especializados, una infraestructura de MCP (Model Context Protocol) de servidor dual y una biblioteca de reglas exhaustiva.

El servidor MCP de plataformas de recompensas integra 16 programas —incluyendo HackerOne (API completa), Bugcrowd, Intigriti, Immunefi y YesWeHack— exponiendo siete herramientas: list_platforms, get_program_scope, sync_program, draft_report y submit_report.

El servidor MCP de búsqueda de reportes detecta automáticamente tres modos: búsqueda semántica FAISS, búsqueda de palabras clave SQLite y un respaldo local sin dependencias que consulta el archivo rules/payloads.md adjunto —con 2,605 líneas que abarcan patrones de ataque XSS, SSRF, SQLi, IDOR, OAuth, SSTI, JWT, LFI, contaminación de prototipos, NoSQLi y DeFi.

Framework Pentest Agent Suite

La característica estrella del framework es la Puerta de las 7 Preguntas, un flujo de validación ejecutado por el agente validator en cada hallazgo; el primer "NO" dispara un veredicto automático de KILL (eliminar), DOWNGRADE (bajar categoría) o CHAIN REQUIRED (cadena requerida).

Ningún hallazgo puede llegar a /submit sin un /validate PASS y una puntuación de /quality de 7 o superior, impuesta por puertas estrictas en los comandos /report y /submit.

El comando /autopilot implementa un motor anti-profundidad superficial que exige una codificación apilada de múltiples capas en cada intento de payload y se niega a declarar que una superficie de ataque ha sido agotada hasta que se complete una matriz de agotamiento total —configurable mediante los modos de punto de control --paranoid, --normal o --yolo.

Un archivo brain.py persistente rastrea cada endpoint por objetivo, aplica una lógica de interruptor (5 respuestas consecutivas 403/429 activan un retroceso automático de 60 segundos) y sincroniza el conocimiento entre diferentes compromisos mediante una diferenciación incremental basada en hashes.

El instalador (python3 -m tools.installer) genera formatos de configuración nativos para cada herramienta soportada y los escribe en los directorios correspondientes del IDE.

Los IDE que no tienen soporte nativo para subagentes, como Cursor, Windsurf y OpenClaw, reciben el contenido traducido a archivos de habilidades y reglas, eliminando la prosa específica de Claude y reescribiendo las variables de ruta a referencias absolutas.

Objetivo	Formato de Configuración	Alcance
Claude Code	`.claude/agents/*.md`	Global + Proyecto
OpenAI Codex	`.codex/agents/*.toml`	Global + Proyecto
Google Gemini	`.gemini/agents/*.md`	Global + Proyecto
Cursor	`.cursor/skills/` (traducción de habilidades)	Global + Proyecto
Windsurf	`.windsurf/rules/*.md` (≤12 KiB/archivo)	Global + Proyecto
VS Code Copilot	`.github/agents/*.agent.md` (≤30 KiB)	Proyecto + Global-MCP
OpenClaw	`~/.openclaw/workspace/AGENTS.md`	Global + Proyecto

50 Agentes en Cinco Vías

La lista de agentes incluye 19 especialistas en debilidades de HackerOne (xss-hunter, sqli-hunter, ssrf-hunter, rce-hunter, oauth-hunter, llm-ai-hunter), un flujo de trabajo SAST de 8 agentes, agentes de infraestructura y reconocimiento (cloud-recon, js-analyzer, graphql-audit, waf-profiler), y un web3-auditor para patrones de Solidity y DeFi.

Cinco habilidades de metodología profunda acompañan a los cazadores —cada una destilada de cientos de reportes reales pagados— incluyendo hunt-rce (RSC CVE-2025-55182, runc Leaky Vessels, BentoML pickle), hunt-xss (DOMPurify mXSS, n8n MCP OAuth XSS GHSA-537j-gqpc-p7fq), y hunt-llm-ai (alineado con el OWASP LLM Top 10 v2025 y el Agentic AI Top 10).

El seguimiento de costes se realiza mediante ganchos de CC: el evento SubagentStop activa cost_hook.py, registrando el nombre del agente y el coste de la sesión en cost-tracking.json, con el gasto en vivo visible en la línea de estado.

Un gancho de alcance PreToolUse (scope_hook.py) coteja cada comando de Bash con scope.yaml utilizando patrones exactos y comodines, bloqueando la ejecución fuera de alcance antes de que se dispare la llamada a la herramienta. La puntuación CVSS se aplica programáticamente: cvss_version_guard.py exige CVSS 3.1 para HackerOne y CVSS 4.0 para todas las demás plataformas.

Inicio Rápido

bashexport HACKERONE_USERNAME=tu_usuario HACKERONE_TOKEN=tu_token
uv run python3 tools/scaffold.py hackerone tesla
cd ~/bounties/hackerone-tesla && claude
/hunt tesla.com

Los requisitos incluyen Python 3.10+, uv y herramientas de reconocimiento estándar: nmap, httpx, subfinder, nuclei, ffuf, katana y sqlmap.

El framework está disponible en GitHub y tiene una licencia exclusiva para pruebas de seguridad autorizadas bajo divulgación responsable. Una utilidad rag-builder/ adjunta puede construir índices locales de reportes FAISS a partir de una lista semilla de 146 repositorios que cubren archivos de CTF, reportes de bug-bounty y colecciones de payloads; todas las operaciones destructivas están restringidas tras un flag explícito de --execute.

Fuentes:
https://cybersecuritynews.com/pentest-agent-suite/

Etiquetas: automatización , bug bounty , ciberseguridad , inteligencia artificial , pentesting , software

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Etiquetas

Entradas populares