Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
5280
)
-
▼
junio
(Total:
896
)
-
Base de datos de vulnerabilidades de GitHub alcanz...
-
Explotan vulnerabilidad crítica de Oracle E-Busine...
-
Vulnerabilidades de Synology MailPlus Server permi...
-
Microsoft advierte que las descripciones manipulad...
-
Gemini supera a ChatGPT con imágenes gratis para t...
-
Claude Science acelera el descubrimiento científico
-
IA de Google crea imágenes en 4 segundos
-
Kodi 22 Piers llega a beta
-
Meta pierde juicio por impacto de redes en menores
-
Vulnerabilidad crítica en Gemini CLI permite ejecu...
-
Vulnerabilidades de WolfSSL exponen miles de millo...
-
Vulnerabilidad RCE de Microsoft 365 explotada con ...
-
Publicado PoC de fallo en NTLM que permite acceso ...
-
Vulnerabilidades críticas de Dell Wyse permiten ej...
-
Roban sesiones de WhatsApp Web para estafas a dire...
-
Publicado PoC de vulnerabilidad RCE en Splunk Secu...
-
Vulnerabilidad crítica en Kemp LoadMaster permite ...
-
Extensión maliciosa de Perplexity para Chrome inte...
-
Kali Linux 2026.2: GNOME 50 y Plasma 6.6
-
Bing Search de ‘ManageEngine OpManager’ distribuye...
-
Vulnerabilidad de Oracle E-Business Suite CVE-2026...
-
ISPs exigen cuentas a Tebas por bloqueos IPTV
-
Microsoft crea un filtro de seguridad para evitar ...
-
Desarrolladores de Mozilla logran instalar malware...
-
Elon time: el retraso de Musk hacia Marte
-
Mod hace que el Steam Controller vuelva solo a su ...
-
Akrites: nuevo frente contra ataques de IA al códi...
-
Gemini permite buscar una app que haga algo especí...
-
Organic Maps: La alternativa a Google Maps que res...
-
Microsoft elimina 119 extensiones de Edge que ocul...
-
Chrome se integra mejor con Wallet para autocomple...
-
Cae masivamente la piratería de fútbol online
-
EE. UU. incauta cientos de dominios de streaming i...
-
OpenAI lanza GPT 5.6 y promete mayor seguridad
-
Turla, vinculado a Rusia, usa infraestructura comp...
-
Los drivers AMD Adrenalin en Windows 10 siguen pre...
-
La UE encarece compras en AliExpress, Shein y Temu
-
ClawHub Skills expone agentes de IA a puertas tras...
-
Dron sigue a F1 a 300 km/h
-
The New York Times demanda a Microsoft y OpenAI po...
-
Mageia 10: distro Linux sucesora de Mandriva
-
Demandan a Samsung, SK Hynix y Micron por los prec...
-
WhatsApp implementará nombres de usuario para prot...
-
Netflix endurece el control de cuentas compartidas
-
Senador acusa a Tim Cook de priorizar beneficios s...
-
IA china Zhipu igualaría a Claude Mythos en detecc...
-
CachyOS lanza Hyprland Noctalia y Shelly para AUR
-
Nissan advierte que un hackeo a Oracle PeopleSoft ...
-
Hacienda de España usará IA israelí para potenciar...
-
Agentes míticos generados por LLM permiten herrami...
-
Usan RemotePC y PowerShell para desplegar el ranso...
-
EEUU condiciona el lanzamiento de GPT-5.6 Sol
-
PowerPoint busca presentaciones perfectas
-
CNMC podría encarecer el despliegue de fibra de op...
-
OpenAI lanzó GPT-5.6 Sol con acceso limitado y pro...
-
Crea un Windows portátil con Windows To Go
-
Paquetes de Go y npm comprometidos utilizan tareas...
-
RedAmon: IA que encadena reconocimiento, explotaci...
-
Consiguen hacer funcionar Windows 11 en un PC de l...
-
Casi cien drones caen en un show aéreo en Australia
-
El nuevo malware SharkLoader despliega Cobalt Stri...
-
Windows 11: nueva recuperación de pago
-
El FBI advierte que rusos buscan las claves de rec...
-
Nuevo ataque de secuestro de buckets redirige dato...
-
Ucrania denuncia que el servicio de inteligencia r...
-
Xbox Series S iguala precio de PS5
-
IP Crawl, la colección de webcams abiertas que no ...
-
Chrome cifrará tus pestañas abiertas
-
Una guía para elegir el mejor DNS público; práctic...
-
Trump bloquea el acceso a GPT-5.6
-
Amazon: IA de Mythos afecta a Fable 5 en AWS
-
OpenAI presenta GPT-5.6 Sol con acceso restringido...
-
Se prevé otro gran aumento de precio de la memoria...
-
Eustella: el chatbot europeo frente a ChatGPT
-
Las placas Z990 tendrán 3 conectores de 8 pines pa...
-
75 juegos PC: pocos requisitos y buenos gráficos
-
Nobel de Medicina arremete contra Elon Musk y su p...
-
La IA aumenta la desigualdad laboral
-
Medios demandan a Microsoft y OpenAI por IA
-
Ford falla con IA y recontrata ingenieros
-
Fallo en Amazon Q permitía ejecutar código y robar...
-
Stremio 5 ya disponible para Linux
-
STIM Machine, así es el PC que imita la forma de l...
-
Nuevo exploit de Linux permite acceso root al sistema
-
Vulnerabilidad crítica en python.org permitía fals...
-
Hackeo en Leroy Merlin: miles de clientes expuestos
-
Activa la VPN de Firefox
-
LastPass sufre nueva filtración de datos
-
FortiBleed: el ataque a firewalls FortiGate que ro...
-
Mythos detecta Squidbleed, una fuga de memoria que...
-
Anthropic lanza Claude Tag: el compañero de IA lle...
-
Habilidad fraudulenta de agentes de IA supera esca...
-
GitHub actualiza actions/checkout para bloquear pa...
-
Casi la mitad de las apps de LG y Samsung venden t...
-
CISA advierte de vulnerabilidad explotada en Ubiqu...
-
Usan Velociraptor, Cloudflare, Zoho y VS Code para...
-
Nueva navaja suiza para hackers en GitHub
-
Operadora japonesa expone 14,2 millones de credenc...
-
SteamOS llegará a todos los PC
-
Las RTX 50 de análisis se empiezan a quemar: Club3...
-
El Departamento de Justicia incauta cuenta de Huio...
-
Claude Fable 5 escribió código del kernel de Windo...
-
Wikipedia expulsa permanentemente a su cofundador ...
-
Kit de phishing AWS AiTM roba credenciales y MFA e...
-
Shai-Hulud roba credenciales de desarrolladores
-
Caducó certificado de Secure Boot de Windows: mile...
-
Algoritmo suizo que quitará el carné por no respet...
-
Backdoor Mistic se autodestruye y se vincula a un ...
-
Polonia desmantela banda de SIM-swapping responsab...
-
CISA advierte sobre vulnerabilidad de Cisco Unifie...
-
Los navegadores más raros probados
-
Iberia estrena su acceso gratuito a Internet vía S...
-
El CEO de Epic Games dice que las herramientas de ...
-
Google detalla STOCKSTAY, la nueva puerta trasera ...
-
10 webs de eBooks gratis y legales
-
Fallo de seguridad en Apache Tomcat Tribes
-
Firma china de ciberseguridad asegura haber creado...
-
Nuevo exploit de COW en Linux permite acceso root ...
-
Qualcomm Dragonfly C1000: así es la CPU con más de...
-
OpenAI retrasaría ChatGPT 5.6 por pedido de Trump
-
Windows 10 tendrá soporte hasta 2027
-
Extensión maliciosa de Edge ejecuta código en sist...
-
Marketplace OpenClaw expone agentes de IA a malwar...
-
Vulnerabilidades en IA de Red-Team permiten robo d...
-
Usan Cisco y Google para propagar malware SharkLoader
-
Campaña de LokiBot roba credenciales con JScript, ...
-
Euro digital: avance final
-
Fallo de integración en ManageEngine AD360 expone ...
-
-
▼
junio
(Total:
896
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
seguridad
(
1447
)
vulnerabilidad
(
1337
)
hardware
(
781
)
software
(
733
)
Malware
(
707
)
google
(
696
)
privacidad
(
609
)
Windows
(
521
)
ransomware
(
487
)
android
(
436
)
cve
(
365
)
linux
(
344
)
exploit
(
311
)
tutorial
(
299
)
manual
(
281
)
nvidia
(
274
)
hacking
(
229
)
WhatsApp
(
173
)
ssd
(
163
)
Wifi
(
131
)
ddos
(
128
)
app
(
122
)
twitter
(
120
)
cifrado
(
119
)
programación
(
102
)
herramientas
(
80
)
youtube
(
79
)
Networking
(
73
)
firefox
(
72
)
sysadmin
(
71
)
firmware
(
64
)
office
(
62
)
adobe
(
59
)
Kernel
(
49
)
hack
(
48
)
antivirus
(
46
)
javascript
(
45
)
apache
(
43
)
juegos
(
42
)
contraseñas
(
39
)
multimedia
(
35
)
cms
(
34
)
eventos
(
32
)
flash
(
32
)
MAC
(
30
)
anonymous
(
28
)
ssl
(
24
)
Forense
(
20
)
conferencia
(
20
)
SeguridadWireless
(
17
)
documental
(
17
)
Debugger
(
14
)
Rootkit
(
14
)
lizard squad
(
14
)
auditoría
(
13
)
metasploit
(
13
)
técnicas hacking
(
13
)
Virtualización
(
11
)
delitos
(
11
)
reversing
(
10
)
adamo
(
9
)
Ehn-Dev
(
7
)
MAC Adress
(
6
)
antimalware
(
6
)
oclHashcat
(
5
)
Entradas populares
-
Selección de 75 juegos para PC con pocos requisitos y buenos gráficos, ideales para disfrutar en equipos antiguos sin necesidad de actuali...
-
Han logrado ejecutar Windows 11 en un PC antiguo con memoria DDR1, Core 2 Quad y gráfica AGP , superando las restricciones de hardware del ...
-
Diez sitios web permiten conseguir eBooks gratuitos de forma legal como complemento ideal para los lectores de libros electrónicos.
Microsoft advierte que las descripciones manipuladas de herramientas MCP podrían provocar fugas de datos en agentes de IA
martes, 30 de junio de 2026
|
Publicado por
el-brujo
|
Editar entrada
Investigaciones de Microsoft revelan que los agentes de IA pueden ser manipulados mediante descripciones de herramientas "envenenadas" para robar datos corporativos sin activar alarmas. El ataque ocurre cuando instrucciones maliciosas se ocultan en el texto descriptivo de una herramienta aprobada, engañando al agente para que ejecute acciones ilegítimas. Para mitigarlo, se recomienda supervisar los cambios en las descripciones, limitar los permisos de los agentes y requerir aprobación humana para acciones críticas.
Una nueva investigación de Microsoft muestra cómo los atacantes pueden secuestrar agentes de IA que actúan en nombre de un usuario, utilizando nada más que una descripción de herramienta envenenada para lograr que el agente entregue silenciosamente datos de la empresa a un tercero.
El truco es que el agente nunca rompe ninguna regla. Cada paso parece rutinario, por lo que en una configuración predeterminada no saltaría ninguna alarma.
El trabajo proviene de Microsoft Incident Response y su equipo de investigación de seguridad Defender, y llega justo cuando las empresas empiezan a permitir que la IA haga más que leer y resumir.
Hasta hace poco, el riesgo de la IA en el lugar de trabajo se centraba principalmente en lo que un modelo leía y escribía. Un documento envenenado podía sesgar una respuesta, y ahí terminaba la mayoría de las veces.
Los agentes son diferentes. Microsoft 365 Copilot puede enviar correos electrónicos, crear archivos y cambiar calendarios. Los agentes personalizados creados en Copilot Studio o Azure AI Foundry pueden acceder a sistemas empresariales y ejecutar tareas de varios pasos por su cuenta.
El mismo truco de inyección que sesga un resumen ahora desencadena una acción. Contra un lector, un ataque cambia la salida. Contra un agente, cambia lo que el software hace realmente.
Estos agentes acceden a los sistemas empresariales a través de MCP, el Model Context Protocol, un protocolo abierto que permite a una IA llamar a herramientas externas de la misma manera que una aplicación llama a una API. Microsoft lo define como la parte de la cadena de suministro de IA agentica que más rápido crece, lo que lo convierte en una superficie de ataque en expansión.
Cada herramienta MCP incluye una descripción: unas pocas líneas de texto plano que le dicen al agente qué hace la herramienta y cuándo usarla. El agente lee ese texto para decidir cómo actuar. Esa es la debilidad total. La descripción son solo palabras, y las palabras pueden transportar instrucciones.
Microsoft lo explica en este enlace con un ejemplo de factura, creado para mostrar el patrón en lugar de reportar a una víctima real. Un equipo de finanzas implementa un agente para gestionar facturas de proveedores. Se conecta a tres herramientas, incluido un servicio de "enriquecimiento de facturas" de terceros que fue aprobado para su uso pero que nunca pasó por una revisión de seguridad real.
Entonces, el atacante actualiza esa herramienta de terceros. El nombre y el resumen visible siguen siendo los mismos. Enterrada en la descripción, disfrazada de notas de formato, hay una orden oculta: toma las últimas treinta facturas impagadas y adjúntalas a la siguiente llamada. MCP detecta los cambios de descripción sobre la marcha. En configuraciones sin un disparador de reaprobación, la versión envenenada entra en funcionamiento sin revisión adicional.
Después de eso, un analista hace una pregunta rutinaria sobre un proveedor. El agente sigue la orden oculta, recopila las facturas y las envía como parte de una solicitud que parece normal. La herramienta devuelve una respuesta limpia y copia silenciosamente los datos robados a un servidor que el atacante controla. El analista no ve nada extraño.
Cada movimiento que hace el agente es legítimo por sí solo. La herramienta fue aprobada. La consulta de datos se ejecutó con los propios permisos del analista. La llamada saliente fue a un servidor que estaba permitido cuando se añadió. La debilidad no está en ningún sistema concreto. Vive en lo que Microsoft llama "el límite de confianza entre ellos".
El problema más profundo es que MCP mezcla instrucciones y datos en el mismo lugar. La descripción de una herramienta vive en la memoria de trabajo del agente justo al lado de sus órdenes reales, por lo que editar esa descripción puede guiar al agente con la misma eficacia que reescribir su prompt del sistema.
El agente no tiene una forma fiable de distinguir una instrucción honesta de una maliciosa introducida por quien mantiene la herramienta. Microsoft señala que esto no es un error del propio Copilot. Es una brecha de confianza que se abre al conectar herramientas externas.
El consejo de Microsoft, en términos sencillos:
* Trata cada herramienta conectada como parte de tu cadena de suministro. Mantén una lista de editores de herramientas aprobados, desactiva "permitir todo" y deja que un agente use solo las herramientas específicas que necesite.
* Trata la descripción de una herramienta como un prompt del sistema. Revisa los cambios de la misma forma que revisarías un cambio de código y analiza el texto en busca de comandos que no deberían estar en un campo de ayuda.
* Pon a un humano frente a las acciones riesgosas. Cualquier cosa que mueva dinero, comparta datos fuera de la empresa o cambie cuentas debería requerir la aprobación de una persona.
* Dale a cada agente su propia identidad y vigila lo que hace. Registra sus acciones, establece una línea base de lo que es normal y marca nuevos endpoints, extracciones de datos más grandes o consultas extrañas.
* Aplica la menor agencia, no solo el menor privilegio. Incluso un agente con permisos bajos puede causar un daño real si se le permite actuar sin controles.
Microsoft asocia sus propios productos a cada paso, incluyendo Prompt Shields, Purview DLP, Entra Agent ID, Defender for Cloud y Sentinel, pero los principios se mantienen independientemente de la infraestructura que utilices.
Esta clase de ataque tiene un historial. Invariant Labs denominó "envenenamiento de herramientas" en abril de 2025, con una prueba de concepto en este enlace que ocultó instrucciones en la descripción de una herramienta de calculadora y logró que el editor Cursor leyera la clave SSH privada de un usuario y la enviara. El desarrollador Simon Willison profundizó en ello pocos días después.
El mismo grupo mostró más tarde un truco relacionado: un problema malicioso de GitHub podría secuestrar un agente conectado al servidor MCP de GitHub y extraer datos de repositorios privados. Las herramientas allí eran confiables y no habían sido tocadas; las instrucciones maliciosas viajaron en los datos que el agente leyó.
OWASP cita ahora este caso como un ejemplo de vulnerabilidades de la cadena de suministro agentica en su Top 10 para aplicaciones agenticas de diciembre de 2025.
Ya ha ocurrido un fallo de cadena de suministro relacionado en el mundo real. En septiembre de 2025, investigadores de Koi Security encontraron un paquete npm llamado postmark-mcp. Había imitado una herramienta de correo electrónico legítima durante quince versiones limpias antes de que la versión 1.0.16 introdujera una línea que enviaba secretamente una copia oculta (BCC) de cada correo que el agente enviaba a un atacante.
Los académicos también han empezado a medir el problema. El benchmark MCPTox publicado en agosto de 2025, probó descripciones de herramientas envenenadas contra 45 servidores MCP reales y 20 modelos de IA líderes. Encontró que el ataque era ampliamente efectivo, con una tasa de éxito de hasta el 72,8 por ciento, y los modelos casi nunca se negaron.
El hilo conductor es el que Microsoft está recalcando ahora: la IA que puede actuar es tan confiable como las herramientas que permites que toque, y ahora mismo esas herramientas son fáciles de envenenar y difíciles de vigilar.
Fuente:
THN
Una nueva investigación de Microsoft muestra cómo los atacantes pueden secuestrar agentes de IA que actúan en nombre de un usuario, utilizando nada más que una descripción de herramienta envenenada para lograr que el agente entregue silenciosamente datos de la empresa a un tercero.
El truco es que el agente nunca rompe ninguna regla. Cada paso parece rutinario, por lo que en una configuración predeterminada no saltaría ninguna alarma.
El trabajo proviene de Microsoft Incident Response y su equipo de investigación de seguridad Defender, y llega justo cuando las empresas empiezan a permitir que la IA haga más que leer y resumir.
Qué cambia cuando un agente puede actuar
Hasta hace poco, el riesgo de la IA en el lugar de trabajo se centraba principalmente en lo que un modelo leía y escribía. Un documento envenenado podía sesgar una respuesta, y ahí terminaba la mayoría de las veces.
Los agentes son diferentes. Microsoft 365 Copilot puede enviar correos electrónicos, crear archivos y cambiar calendarios. Los agentes personalizados creados en Copilot Studio o Azure AI Foundry pueden acceder a sistemas empresariales y ejecutar tareas de varios pasos por su cuenta.
El mismo truco de inyección que sesga un resumen ahora desencadena una acción. Contra un lector, un ataque cambia la salida. Contra un agente, cambia lo que el software hace realmente.
Estos agentes acceden a los sistemas empresariales a través de MCP, el Model Context Protocol, un protocolo abierto que permite a una IA llamar a herramientas externas de la misma manera que una aplicación llama a una API. Microsoft lo define como la parte de la cadena de suministro de IA agentica que más rápido crece, lo que lo convierte en una superficie de ataque en expansión.
Cómo funciona el ataque
Cada herramienta MCP incluye una descripción: unas pocas líneas de texto plano que le dicen al agente qué hace la herramienta y cuándo usarla. El agente lee ese texto para decidir cómo actuar. Esa es la debilidad total. La descripción son solo palabras, y las palabras pueden transportar instrucciones.
Microsoft lo explica en este enlace con un ejemplo de factura, creado para mostrar el patrón en lugar de reportar a una víctima real. Un equipo de finanzas implementa un agente para gestionar facturas de proveedores. Se conecta a tres herramientas, incluido un servicio de "enriquecimiento de facturas" de terceros que fue aprobado para su uso pero que nunca pasó por una revisión de seguridad real.
Entonces, el atacante actualiza esa herramienta de terceros. El nombre y el resumen visible siguen siendo los mismos. Enterrada en la descripción, disfrazada de notas de formato, hay una orden oculta: toma las últimas treinta facturas impagadas y adjúntalas a la siguiente llamada. MCP detecta los cambios de descripción sobre la marcha. En configuraciones sin un disparador de reaprobación, la versión envenenada entra en funcionamiento sin revisión adicional.
Después de eso, un analista hace una pregunta rutinaria sobre un proveedor. El agente sigue la orden oculta, recopila las facturas y las envía como parte de una solicitud que parece normal. La herramienta devuelve una respuesta limpia y copia silenciosamente los datos robados a un servidor que el atacante controla. El analista no ve nada extraño.
Cada movimiento que hace el agente es legítimo por sí solo. La herramienta fue aprobada. La consulta de datos se ejecutó con los propios permisos del analista. La llamada saliente fue a un servidor que estaba permitido cuando se añadió. La debilidad no está en ningún sistema concreto. Vive en lo que Microsoft llama "el límite de confianza entre ellos".
El problema más profundo es que MCP mezcla instrucciones y datos en el mismo lugar. La descripción de una herramienta vive en la memoria de trabajo del agente justo al lado de sus órdenes reales, por lo que editar esa descripción puede guiar al agente con la misma eficacia que reescribir su prompt del sistema.
El agente no tiene una forma fiable de distinguir una instrucción honesta de una maliciosa introducida por quien mantiene la herramienta. Microsoft señala que esto no es un error del propio Copilot. Es una brecha de confianza que se abre al conectar herramientas externas.
Qué deberían hacer los defensores
El consejo de Microsoft, en términos sencillos:
* Trata cada herramienta conectada como parte de tu cadena de suministro. Mantén una lista de editores de herramientas aprobados, desactiva "permitir todo" y deja que un agente use solo las herramientas específicas que necesite.
* Trata la descripción de una herramienta como un prompt del sistema. Revisa los cambios de la misma forma que revisarías un cambio de código y analiza el texto en busca de comandos que no deberían estar en un campo de ayuda.
* Pon a un humano frente a las acciones riesgosas. Cualquier cosa que mueva dinero, comparta datos fuera de la empresa o cambie cuentas debería requerir la aprobación de una persona.
* Dale a cada agente su propia identidad y vigila lo que hace. Registra sus acciones, establece una línea base de lo que es normal y marca nuevos endpoints, extracciones de datos más grandes o consultas extrañas.
* Aplica la menor agencia, no solo el menor privilegio. Incluso un agente con permisos bajos puede causar un daño real si se le permite actuar sin controles.
Microsoft asocia sus propios productos a cada paso, incluyendo Prompt Shields, Purview DLP, Entra Agent ID, Defender for Cloud y Sentinel, pero los principios se mantienen independientemente de la infraestructura que utilices.
No es una teoría: cómo hemos llegado aquí
Esta clase de ataque tiene un historial. Invariant Labs denominó "envenenamiento de herramientas" en abril de 2025, con una prueba de concepto en este enlace que ocultó instrucciones en la descripción de una herramienta de calculadora y logró que el editor Cursor leyera la clave SSH privada de un usuario y la enviara. El desarrollador Simon Willison profundizó en ello pocos días después.
El mismo grupo mostró más tarde un truco relacionado: un problema malicioso de GitHub podría secuestrar un agente conectado al servidor MCP de GitHub y extraer datos de repositorios privados. Las herramientas allí eran confiables y no habían sido tocadas; las instrucciones maliciosas viajaron en los datos que el agente leyó.
OWASP cita ahora este caso como un ejemplo de vulnerabilidades de la cadena de suministro agentica en su Top 10 para aplicaciones agenticas de diciembre de 2025.
Ya ha ocurrido un fallo de cadena de suministro relacionado en el mundo real. En septiembre de 2025, investigadores de Koi Security encontraron un paquete npm llamado postmark-mcp. Había imitado una herramienta de correo electrónico legítima durante quince versiones limpias antes de que la versión 1.0.16 introdujera una línea que enviaba secretamente una copia oculta (BCC) de cada correo que el agente enviaba a un atacante.
Los académicos también han empezado a medir el problema. El benchmark MCPTox publicado en agosto de 2025, probó descripciones de herramientas envenenadas contra 45 servidores MCP reales y 20 modelos de IA líderes. Encontró que el ataque era ampliamente efectivo, con una tasa de éxito de hasta el 72,8 por ciento, y los modelos casi nunca se negaron.
El hilo conductor es el que Microsoft está recalcando ahora: la IA que puede actuar es tan confiable como las herramientas que permites que toque, y ahora mismo esas herramientas son fáciles de envenenar y difíciles de vigilar.
Fuente:
THN
Enviar por correo electrónico
Escribe un blog
Compartir en X
Compartir con Facebook
Compartir en Pinterest

Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.