Blog elhacker.NET: Agente de IA OpenClaw filtra credenciales en simulación de phishing

Agente de IA OpenClaw filtra credenciales en simulación de phishing

miércoles, 10 de junio de 2026 | Publicado por el-brujo | Editar entrada

Los agentes de IA se están integrando en la gestión de bandejas de entrada empresariales para clasificar mensajes y responder correos. Sin embargo, investigadores han confirmado que estos agentes pueden ser engañados, en ocasiones con mayor facilidad que los humanos. Una nueva simulación de phishing demostró que el agente de IA OpenClaw filtró credenciales confidenciales, evidenciando la vulnerabilidad de estas herramientas ante ataques de ingeniería social.

Los agentes de IA se están convirtiendo en una parte fundamental de cómo las empresas gestionan sus bandejas de entrada, clasificando mensajes, recuperando archivos e incluso respondiendo correos electrónicos en nombre de los empleados. Lo que los investigadores han confirmado ahora es que estos agentes pueden ser engañados al igual que los humanos y, a veces, con mayor facilidad.

Una nueva simulación de phishing ha demostrado que un agente de IA llamado OpenClaw puede ser manipulado para filtrar credenciales sensibles con un solo correo electrónico convincente.

En pruebas controladas, el agente reenvió claves AWS IAM, contraseñas de bases de datos y acceso SSH a una dirección de Gmail externa, lo que plantea preocupaciones inmediatas sobre cómo los agentes de IA gestionan la confianza y la identidad.

Investigadores de Varonis Threat Labs diseñaron el experimento para comprobar si las técnicas de phishing que llevan tiempo dirigidas a los humanos también funcionarían con los agentes de IA.

Sometieron a un agente OpenClaw llamado Pinchy a cuatro simulaciones de phishing bajo dos perfiles: una configuración de productividad general y otra más estricta y consciente de la seguridad.

Varonis afirmó en un informe que los resultados fueron alarmantes. La configuración del laboratorio reflejaba la bandeja de entrada de una empresa real, sembrada con credenciales falsas de AWS, exportaciones de CRM, conversaciones internas e invitaciones de calendario.

El objetivo era ver cómo respondía el agente ante solicitudes que parecían totalmente rutinarias. Lo que los investigadores descubrieron fue que OpenClaw tenía más dificultades con la manipulación social que con el engaño técnico.

Podía identificar páginas de inicio de sesión falsas y avisos de OAuth sospechosos, pero un correo electrónico escrito de manera informal por un colega falso fue suficiente para saltarse sus defensas por completo.

El agente de IA OpenClaw filtra credenciales sensibles

En la primera prueba, y la más grave, llegó un correo falso de un atacante que se hacía pasar por un líder de equipo llamado Dan.

El mensaje afirmaba que había una emergencia de producción y pedía al agente que compartiera las credenciales del entorno de pruebas (staging). El correo provenía de una cuenta de Gmail externa, no de una dirección corporativa verificada.

El agente registró la bandeja de entrada, encontró las credenciales y las reenvió en texto plano. La respuesta incluía claves de acceso AWS IAM, cadenas de conexión de bases de datos y detalles de SSH con información del host interno.

OpenClaw lab architecture used in the test deployment (Source - Varonis) — Arquitectura de laboratorio de OpenClaw utilizada en el despliegue de prueba (Fuente – Varonis)

Esto ocurrió incluso bajo el perfil Estricto, que indicaba explícitamente al agente que debía verificar las identidades del remitente antes de actuar ante solicitudes sensibles.

El propio rastro de razonamiento del agente reconoció el error posteriormente. Comprendió que la política existía y que la había violado. En el momento, la urgencia de la emergencia simulada simplemente anuló el paso de verificación.

Una segunda prueba adoptó un enfoque más suave. Un atacante envió un mensaje redactado de manera informal solicitando la exportación de clientes más reciente, alegando que estaba trabajando remotamente en una presentación.

El agente accedió sin ninguna verificación, reenviando un conjunto de datos con 247 clientes corporativos y aproximadamente 1,28 millones de dólares en ingresos recurrentes mensuales.

Phishing de agentes frente a defensas técnicas

No todas las pruebas terminaron en fracaso. Cuando los investigadores introdujeron un enlace falso de canje de tarjetas regalo y una pantalla de consentimiento de OAuth maliciosa, el agente mostró un juicio mucho más sólido.

Inspeccionó las URL de redireccionamiento, señaló destinos sospechosos y detuvo el flujo de OAuth antes de que se concediera cualquier consentimiento.

Ese contraste resalta dónde son fuertes los agentes de IA y dónde fallan. El phishing técnico, incluyendo páginas de inicio de sesión falsas y enlaces maliciosos, se gestionó de forma fiable. El phishing social, donde una solicitud simplemente suena como si viniera de un colega de confianza, se gestionó deficientemente.

Forwarded credentials (left) and the agent's reasoning trace afterwards (right) (Source - Varonis) — Credenciales reenviadas (izquierda) y el rastro de razonamiento del agente posteriormente (derecha) (Fuente – Varonis)

Los investigadores notaron una diferencia entre los dos modelos de IA probados. GPT-5.4 mantuvo una postura más estricta en torno al intercambio de datos sensibles, mientras que Gemini 3.1 Pro estuvo más dispuesto a interactuar con contenido sospechoso antes de mostrar preocupación. Ambos modelos siguieron siendo igualmente vulnerables a la manipulación del contexto social.

Para cerrar estas brechas, los investigadores recomendaron tratar el archivo de configuración del agente como un control de seguridad formal en lugar de un simple documento de configuración básica.

También aconsejaron bloquear el envío de correos electrónicos salientes de los agentes a direcciones desconocidas y requerir la aprobación humana para cualquier acción que implique credenciales o enrutamiento externo. Limitar el acceso a los datos de un agente en función de dónde se origine la solicitud añade una capa de defensa significativa.

Los hallazgos dejan una cosa clara: los agentes de IA se comportan como un empleado nuevo con acceso total al sistema pero sin instinto organizativo. Eso es exactamente lo que los hace útiles, y exactamente lo que los convierte en un objetivo.

Fuentes:
https://cybersecuritynews.com/openclaw-ai-agent-leaks-sensitive-credentials/

Etiquetas: agente , ciberseguridad , filtración , inteligencia artificial , phishing , vulnerabilidad

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Etiquetas

Entradas populares

Agente de IA OpenClaw filtra credenciales en simulación de phishing

El agente de IA OpenClaw filtra credenciales sensibles

Phishing de agentes frente a defensas técnicas

0 comentarios :

Publicar un comentario