Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
5195
)
-
▼
junio
(Total:
812
)
-
Vulnerabilidad crítica en python.org permitía fals...
-
Hackeo en Leroy Merlin: miles de clientes expuestos
-
Activa la VPN de Firefox
-
LastPass sufre nueva filtración de datos
-
FortiBleed: el ataque a firewalls FortiGate que ro...
-
Mythos detecta Squidbleed, una fuga de memoria que...
-
Anthropic lanza Claude Tag: el compañero de IA lle...
-
Habilidad fraudulenta de agentes de IA supera esca...
-
GitHub actualiza actions/checkout para bloquear pa...
-
Casi la mitad de las apps de LG y Samsung venden t...
-
CISA advierte de vulnerabilidad explotada en Ubiqu...
-
Usan Velociraptor, Cloudflare, Zoho y VS Code para...
-
Nueva navaja suiza para hackers en GitHub
-
Operadora japonesa expone 14,2 millones de credenc...
-
SteamOS llegará a todos los PC
-
Las RTX 50 de análisis se empiezan a quemar: Club3...
-
El Departamento de Justicia incauta cuenta de Huio...
-
Claude Fable 5 escribió código del kernel de Windo...
-
Wikipedia expulsa permanentemente a su cofundador ...
-
Kit de phishing AWS AiTM roba credenciales y MFA e...
-
Shai-Hulud roba credenciales de desarrolladores
-
Caducó certificado de Secure Boot de Windows: mile...
-
Algoritmo suizo que quitará el carné por no respet...
-
Backdoor Mistic se autodestruye y se vincula a un ...
-
Polonia desmantela banda de SIM-swapping responsab...
-
CISA advierte sobre vulnerabilidad de Cisco Unifie...
-
Los navegadores más raros probados
-
Iberia estrena su acceso gratuito a Internet vía S...
-
El CEO de Epic Games dice que las herramientas de ...
-
Google detalla STOCKSTAY, la nueva puerta trasera ...
-
10 webs de eBooks gratis y legales
-
Fallo de seguridad en Apache Tomcat Tribes
-
Firma china de ciberseguridad asegura haber creado...
-
Nuevo exploit de COW en Linux permite acceso root ...
-
Qualcomm Dragonfly C1000: así es la CPU con más de...
-
OpenAI retrasaría ChatGPT 5.6 por pedido de Trump
-
Windows 10 tendrá soporte hasta 2027
-
Extensión maliciosa de Edge ejecuta código en sist...
-
Marketplace OpenClaw expone agentes de IA a malwar...
-
Vulnerabilidades en IA de Red-Team permiten robo d...
-
Usan Cisco y Google para propagar malware SharkLoader
-
Campaña de LokiBot roba credenciales con JScript, ...
-
Euro digital: avance final
-
Fallo de integración en ManageEngine AD360 expone ...
-
IBM anuncia un chip de tecnología sub-nanómetro: l...
-
El rechazo a la IA
-
La policía de Londres implementa reconocimiento fa...
-
Publican exploit PoC para vulnerabilidad de ejecuc...
-
Condenan a 18 meses de prisión a DraftKings conoci...
-
Samsung busca talentos en España
-
China supera a EE. UU. en supercomputación y Linux...
-
Lanzado Gemini 3.5 Flash con funciones de uso de o...
-
Aplicaciones de Laravel Livewire comprometidas par...
-
Rusia usó herramienta de Cellebrite para hackear i...
-
TSMC sube precios: por qué te afecta
-
WhatsApp avisará al iniciar chats con números nuevos
-
Micron marca récord y avisa: 16 acuerdos hasta 203...
-
Puerta trasera de Rust en macOS usa shell y Telegr...
-
Anthropic acusa a Alibaba de usar 25.000 cuentas f...
-
Vulnerabilidad de 25 años en cURL finalmente parch...
-
Detectan capacidad de inyección de scripts en bloq...
-
Bluekit: el kit de phishing que usa técnica Browse...
-
Home Assistant OS 18.0: arranca más rápido y ocupa...
-
LineShine, el nuevo superordenador chino Top #1 mu...
-
Superhuman compra GPTZero
-
Lector de documentos falso con 100 mil descargas e...
-
Anthropic acusa a Alibaba de acceder ilícitamente ...
-
Vulnerabilidades críticas de Webmin permiten supla...
-
COSMIC 1.1 añade monitor de sistema y mejoras
-
SteamOS 3.8 ya permite crear tu propia Steam Machi...
-
Claude bajo sospecha por privacidad de datos
-
Microsoft usa IA para eliminar malware global
-
Google mejora Gemini 1.5 Flash para programadores
-
SAP prevé el fin de sus programadores en 4 años
-
Nuevo phishing abusa de Outlook y grupos de Micros...
-
Intel y AMD acelerarán IA con hardware dedicado
-
La Casa Blanca ordena migrar sistemas a criptograf...
-
SteamOS recibirá soporte de NVIDIA
-
Publican exploit PoC para vulnerabilidad de escala...
-
OpenAI lanza Jalapeño su propio chip de IA
-
Microsoft insta a administradores de TI a preparar...
-
Chrome añade botón de IA en su barra
-
Compró Google.com por 12 dólares en 2015
-
WhatsApp: copias de seguridad desde los ajustes de...
-
Mejores herramientas de monitoreo de red para Linux
-
Miembros de Scattered Spider que atacaron el trans...
-
Investigador gana 148.337 $ por vulnerabilidad RCE...
-
Commodore vuelve con un móvil minimalista
-
IA maliciosa evade escaneos y toma el control de 2...
-
Un hacker entra en sistemas críticos de la FIFA y ...
-
España busca atraer una Gigafab de IA con 719 mill...
-
Nuevo ransomware Prinz Eugen prioriza el cifrado d...
-
Tras las críticas, AMD restaura el cifrado de memo...
-
GTA VI costará 80 euros/dólares
-
Windows 11 26H2 ya en preview
-
Half-Life 3: realidades y rumores
-
Microsoft permite bloquear el acceso de Copilot a ...
-
Análisis del router ASUS RT-BE90U: triple banda Wi...
-
Rendimiento de la Steam Machine: inferior a un PC ...
-
Ucrania equipará todos sus drones con IA de Palantir
-
AMD lanza oficialmente FSR 4.1 para las GPU Radeon...
-
Olivetti: la empresa debe generar cultura y democr...
-
Vulnerabilidad crítica de FFmpeg permite convertir...
-
Paquetes maliciosos de npm se hacen pasar por herr...
-
Vulnerabilidad crítica en libssh2 permite ejecució...
-
Robots mendigos aparecen en China pidiendo dinero ...
-
Datos de clientes de LastPass expuestos en ataque ...
-
GPT-Bidi-1: la IA de voz humana de OpenAI
-
Vulnerabilidad de 8 años en Samsung KNOX expone di...
-
La potente IA Mythos de Anthropic supuestamente vu...
-
Ataque de phishing en WhatsApp utiliza falsos docu...
-
Cómo saber si te bloquearon en WhatsApp vía cifrado
-
Campaña de WhatsApp mediante VBScript emplea docum...
-
Claude Mythos Preview ayuda a descubrir vulnerabil...
-
Guía de bug bounty: qué es y cómo participar
-
OpenAI impulsa Daybreak con GPT-5.5-Cyber para ayu...
-
WhatsApp permitirá enviar audios sin abrir la app
-
Windows 11 eliminará los cuelgues de GPU
-
La ASUS ROG Astral RTX 5090 Edition 20 llegará a E...
-
GPT-5.5 Cyber detecta y corrige fallos de software
-
IA transforma Photoshop, Premiere y Lightroom
-
Mozilla parchea Firefox tras problemas y crasheos ...
-
Robocop despedido: un año sin resultados
-
Google establece el 30 de septiembre como límite p...
-
Va a hacer el mantenimiento de su AORUS GeForce RT...
-
Windows 11 optimiza su buscador
-
QNAP corrige fallos de inyección que permiten ejec...
-
El fallo Squidbleed, un error de 29 años en el pro...
-
-
▼
junio
(Total:
812
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
seguridad
(
1426
)
vulnerabilidad
(
1318
)
hardware
(
772
)
Malware
(
707
)
software
(
706
)
google
(
690
)
privacidad
(
603
)
Windows
(
521
)
ransomware
(
485
)
android
(
434
)
cve
(
364
)
linux
(
338
)
exploit
(
300
)
tutorial
(
299
)
manual
(
281
)
nvidia
(
274
)
hacking
(
226
)
WhatsApp
(
173
)
ssd
(
163
)
Wifi
(
131
)
ddos
(
128
)
app
(
122
)
twitter
(
120
)
cifrado
(
118
)
programación
(
101
)
herramientas
(
80
)
youtube
(
79
)
Networking
(
73
)
firefox
(
72
)
sysadmin
(
71
)
firmware
(
64
)
office
(
62
)
adobe
(
59
)
Kernel
(
49
)
hack
(
48
)
antivirus
(
46
)
javascript
(
45
)
apache
(
43
)
juegos
(
42
)
contraseñas
(
39
)
cms
(
34
)
multimedia
(
33
)
eventos
(
32
)
flash
(
32
)
MAC
(
30
)
anonymous
(
28
)
ssl
(
24
)
Forense
(
20
)
conferencia
(
20
)
SeguridadWireless
(
17
)
documental
(
17
)
Debugger
(
14
)
Rootkit
(
14
)
lizard squad
(
14
)
auditoría
(
13
)
metasploit
(
13
)
técnicas hacking
(
13
)
Virtualización
(
11
)
delitos
(
11
)
reversing
(
10
)
adamo
(
9
)
Ehn-Dev
(
7
)
MAC Adress
(
6
)
antimalware
(
6
)
oclHashcat
(
5
)
Entradas populares
-
Resumen: Un estudio revela que el Wi-Fi con buena señal consume menos batería que el 4G o 5G, mientras que el 5G puede agotar más la bater...
-
Gemma 4 12B se presenta como una alternativa gratuita y local a Claude Code para ayudar a programar con IA , permitiendo ejecutar el model...
-
Intel presenta Crescent Island , su nueva generación de tarjetas gráficas Xe3P que contará con un conector de 16 pines y hasta 160 GB de L...
Habilidad fraudulenta de agentes de IA supera escaneos de seguridad y alcanzaría a 26.000 agentes
sábado, 27 de junio de 2026
|
Publicado por
el-brujo
|
Editar entrada
La empresa de seguridad AIR demostró que es posible engañar a los escáneres de seguridad y usuarios mediante la creación de habilidades de IA falsas. Al utilizar enlaces externos que cambian después de la revisión, lograron infectar aproximadamente 26,000 agentes sin ser detectados. El experimento advierte que confiar solo en escaneos iniciales o reputación en GitHub es insuficiente para prevenir ataques.
La firma de seguridad AIR creó una habilidad de agente de IA falsa, la lanzó a través de un mercado de habilidades popular y un anuncio de Instagram, y afirma que llegó a aproximadamente 26.000 agentes, incluyendo algunos en cuentas corporativas.
Todos los escáneres de seguridad de habilidades que la firma probó la marcaron como segura. La carga útil era inofensiva por diseño: recolectaba la dirección de correo electrónico del usuario y nada más.
El objetivo era demostrar que ninguna de las señales en las que la gente se apoya para confiar en una habilidad la detectó: ni los escáneres, ni las estrellas de GitHub, ni la reputación de código abierto.
Una habilidad es un conjunto de instrucciones que un agente carga en su propio contexto y sigue con aproximadamente la autoridad de un comando de usuario. Esa confianza es el problema central, y es la razón por la cual existen las herramientas de escaneo de habilidades.
La habilidad, llamada brand-landingpage, pretendía crear una página de aterrizaje utilizando la herramienta de diseño Stitch de Google, dirigida específicamente a usuarios no técnicos.
Para que pareciera creíble, AIR buscó dos señales de confianza: estrellas de GitHub y un veredicto limpio del escáner. Para las estrellas, abrió una solicitud de extracción (pull request) en un repositorio de mercado de habilidades con alrededor de 36.000 estrellas y 156 habilidades.
La solicitud de extracción fue fusionada después de unos días, por lo que la habilidad heredó el recuento del repositorio. Luego lanzó un anuncio de Instagram dirigido a especialistas en marketing, vendedores y diseñadores, quienes la instalaron y la pusieron a trabajar.
Los escáneres que AIR probó analizan el paquete que les entregas: el archivo SKILL.md y los archivos que se envían con él. Se trata del de Cisco, el de NVIDIA y los integrados en skills.sh.
La habilidad de AIR [enlace] no llevaba instrucciones de configuración propias. Le indicaba al agente que instalara el "Stitch SDK" siguiendo la documentación en un enlace externo, stitch-design.ai, un dominio que AIR controla, no Google (el Stitch real está en stitch.withgoogle.com).
Al principio, el enlace llevaba a la documentación genuina de Stitch, por lo que los escáneres, al ver un paquete limpio que apuntaba a una página de configuración plausible, le dieron el visto bueno. La página que el agente realmente buscaría y seguiría estaba fuera del escaneo.
Una vez que la habilidad se instaló ampliamente, AIR cambió la página detrás de ese enlace. La nueva versión le indicaba al agente que descargara y ejecutara un script.
En la demostración, solo enviaba la dirección del usuario de vuelta a AIR, que es como la firma contó los agentes a los que llegó. Un operador real podría haber usado ese acceso para leer archivos, mover datos o atacar sistemas internos, limitado solo por lo que el agente pudiera alcanzar.
AIR no es la primera en mostrar esto. Tres semanas antes, Trail of Bits evadió el detector de habilidades maliciosas de ClawHub, el escáner de Cisco y los tres escáneres integrados en skills.sh. Su conclusión fue tajante: un escáner revisa un paquete fijo, mientras que un atacante puede seguir ajustando la carga útil hasta que pase la prueba.
Campañas reales han usado el mismo truco durante meses, manteniendo la habilidad enviada limpia y alojando la carga útil en un sitio que el agente solo obtiene al instalar.
El problema es estructural: el escaneo ocurre una vez, pero la página a la que una habilidad dirige al agente puede ser reescrita en cualquier momento posterior. La propia documentación de Anthropic ya advierte que las habilidades que obtienen URLs externas son arriesgadas precisamente por esta razón, ya que el contenido puede cambiar después de que la habilidad sea vetada.
Una investigación independiente este año [enlace] encontró que los escáneres a menudo no coinciden, porque cada uno juzga una habilidad de forma aislada, ciegos a sus enlaces externos y a lo que cambia después de la revisión.
La lectura para los defensores es la misma a la que llegan los investigadores, ahora con un ejemplo más claro. Trata las habilidades como software, no como texto. Examina a dónde apunta una habilidad, no solo lo que viene dentro de ella.
La mayoría de estos complementos se instalaron sin revisión, por lo que tu primera tarea es encontrar qué se está ejecutando ya. Dirige las nuevas habilidades a través de una única fuente que tú controles y vuelve a revisarlas cuando algo cambie, porque un resultado limpio al instalar no se mantiene limpio si la habilidad se conecta a un enlace que alguien más puede editar.
Fija las versiones. Limita a los agentes al menor privilegio posible. Asume que cualquier instrucción externa que un agente obtenga se ejecuta con el acceso del agente.
Las cifras de escala provienen solo de AIR y merecen una lectura escéptica. La firma está lanzando un mercado de habilidades gestionado y cierra el informe promocionándolo, por lo que el número de 26.000, el detalle de las cuentas corporativas y la afirmación de que podría haber tomado el control total de cada agente son propios de la empresa y no han sido confirmados independientemente.
Lo que sí se sostiene es el método. Los escáneres mencionados realmente juzgan solo el paquete enviado, el punto ciego de los enlaces externos es real y ha sido demostrado independientemente, y las señales de confianza que AIR tomó prestadas —estrellas y un escaneo limpio— son exactamente las que el ecosistema todavía trata como pruebas.
El experimento no expone un nuevo error, sino que alinea cada señal de confianza débil alrededor de las habilidades de los agentes en una sola ejecución: estrellas que se pueden tomar prestadas, un escaneo que lee una captura instantánea y un enlace que puede ser reescrito después de que la verificación sea aprobada.
Ya sea que la cifra real sea 26.000 o una fracción de ella, la brecha por la que transita es una que los defensores aún no han cerrado.
Fuente:
THN
La firma de seguridad AIR creó una habilidad de agente de IA falsa, la lanzó a través de un mercado de habilidades popular y un anuncio de Instagram, y afirma que llegó a aproximadamente 26.000 agentes, incluyendo algunos en cuentas corporativas.
Todos los escáneres de seguridad de habilidades que la firma probó la marcaron como segura. La carga útil era inofensiva por diseño: recolectaba la dirección de correo electrónico del usuario y nada más.
El objetivo era demostrar que ninguna de las señales en las que la gente se apoya para confiar en una habilidad la detectó: ni los escáneres, ni las estrellas de GitHub, ni la reputación de código abierto.
Una habilidad es un conjunto de instrucciones que un agente carga en su propio contexto y sigue con aproximadamente la autoridad de un comando de usuario. Esa confianza es el problema central, y es la razón por la cual existen las herramientas de escaneo de habilidades.
La habilidad, llamada brand-landingpage, pretendía crear una página de aterrizaje utilizando la herramienta de diseño Stitch de Google, dirigida específicamente a usuarios no técnicos.
Para que pareciera creíble, AIR buscó dos señales de confianza: estrellas de GitHub y un veredicto limpio del escáner. Para las estrellas, abrió una solicitud de extracción (pull request) en un repositorio de mercado de habilidades con alrededor de 36.000 estrellas y 156 habilidades.
La solicitud de extracción fue fusionada después de unos días, por lo que la habilidad heredó el recuento del repositorio. Luego lanzó un anuncio de Instagram dirigido a especialistas en marketing, vendedores y diseñadores, quienes la instalaron y la pusieron a trabajar.
Por qué los escáneres no lo detectaron
Los escáneres que AIR probó analizan el paquete que les entregas: el archivo SKILL.md y los archivos que se envían con él. Se trata del de Cisco, el de NVIDIA y los integrados en skills.sh.
La habilidad de AIR [enlace] no llevaba instrucciones de configuración propias. Le indicaba al agente que instalara el "Stitch SDK" siguiendo la documentación en un enlace externo, stitch-design.ai, un dominio que AIR controla, no Google (el Stitch real está en stitch.withgoogle.com).
Al principio, el enlace llevaba a la documentación genuina de Stitch, por lo que los escáneres, al ver un paquete limpio que apuntaba a una página de configuración plausible, le dieron el visto bueno. La página que el agente realmente buscaría y seguiría estaba fuera del escaneo.
Una vez que la habilidad se instaló ampliamente, AIR cambió la página detrás de ese enlace. La nueva versión le indicaba al agente que descargara y ejecutara un script.
En la demostración, solo enviaba la dirección del usuario de vuelta a AIR, que es como la firma contó los agentes a los que llegó. Un operador real podría haber usado ese acceso para leer archivos, mover datos o atacar sistemas internos, limitado solo por lo que el agente pudiera alcanzar.
AIR no es la primera en mostrar esto. Tres semanas antes, Trail of Bits evadió el detector de habilidades maliciosas de ClawHub, el escáner de Cisco y los tres escáneres integrados en skills.sh. Su conclusión fue tajante: un escáner revisa un paquete fijo, mientras que un atacante puede seguir ajustando la carga útil hasta que pase la prueba.
Campañas reales han usado el mismo truco durante meses, manteniendo la habilidad enviada limpia y alojando la carga útil en un sitio que el agente solo obtiene al instalar.
El problema es estructural: el escaneo ocurre una vez, pero la página a la que una habilidad dirige al agente puede ser reescrita en cualquier momento posterior. La propia documentación de Anthropic ya advierte que las habilidades que obtienen URLs externas son arriesgadas precisamente por esta razón, ya que el contenido puede cambiar después de que la habilidad sea vetada.
Una investigación independiente este año [enlace] encontró que los escáneres a menudo no coinciden, porque cada uno juzga una habilidad de forma aislada, ciegos a sus enlaces externos y a lo que cambia después de la revisión.
Qué hacer
La lectura para los defensores es la misma a la que llegan los investigadores, ahora con un ejemplo más claro. Trata las habilidades como software, no como texto. Examina a dónde apunta una habilidad, no solo lo que viene dentro de ella.
La mayoría de estos complementos se instalaron sin revisión, por lo que tu primera tarea es encontrar qué se está ejecutando ya. Dirige las nuevas habilidades a través de una única fuente que tú controles y vuelve a revisarlas cuando algo cambie, porque un resultado limpio al instalar no se mantiene limpio si la habilidad se conecta a un enlace que alguien más puede editar.
Fija las versiones. Limita a los agentes al menor privilegio posible. Asume que cualquier instrucción externa que un agente obtenga se ejecuta con el acceso del agente.
Las cifras de escala provienen solo de AIR y merecen una lectura escéptica. La firma está lanzando un mercado de habilidades gestionado y cierra el informe promocionándolo, por lo que el número de 26.000, el detalle de las cuentas corporativas y la afirmación de que podría haber tomado el control total de cada agente son propios de la empresa y no han sido confirmados independientemente.
Lo que sí se sostiene es el método. Los escáneres mencionados realmente juzgan solo el paquete enviado, el punto ciego de los enlaces externos es real y ha sido demostrado independientemente, y las señales de confianza que AIR tomó prestadas —estrellas y un escaneo limpio— son exactamente las que el ecosistema todavía trata como pruebas.
El experimento no expone un nuevo error, sino que alinea cada señal de confianza débil alrededor de las habilidades de los agentes en una sola ejecución: estrellas que se pueden tomar prestadas, un escaneo que lee una captura instantánea y un enlace que puede ser reescrito después de que la verificación sea aprobada.
Ya sea que la cifra real sea 26.000 o una fracción de ella, la brecha por la que transita es una que los defensores aún no han cerrado.
Fuente:
THN
Enviar por correo electrónico
Escribe un blog
Compartir en X
Compartir con Facebook
Compartir en Pinterest

Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.