Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
5066
)
-
▼
junio
(Total:
683
)
-
Brasil inicia indagación por falla en sistema de a...
-
Consejos para optimizar Mozilla Firefox
-
Vulnerabilidad en Apple Beats Studio Buds permite ...
-
Cloudflare se alía con los principales navegadores...
-
La agencia de inteligencia de Canadá empleó una or...
-
Headroom reduce hasta un 92% los tokens de LLM
-
Lectores de Gizmodo reciben avisos de malware Clic...
-
Apps de iOS con IA filtran credenciales de API de LLM
-
WhatsApp quiere que otros sepan fácilmente si está...
-
Comentario de 13 palabras en Reddit puede envenena...
-
Muere Claude Guillemot fundador de Ubisoft
-
Infectan más de 10.000 repositorios de GitHub para...
-
Enfría su GPU con hielo y baja 40 grados
-
China creará centros de IA espaciales para rivaliz...
-
Una GeForce RTX 4070 SUPER sobrevive a una novia y...
-
Intel y AMD preparan ACE: nueva extensión x86 para...
-
CyberSentinel AI: 33 herramientas de seguridad con...
-
Miles de routers D-Link en todo el mundo fueron in...
-
Modelo Mythos de Anthropic vulneró sistemas clasif...
-
HDMI 2.2 en camino
-
INTERPOL alerta sobre el aumento de estafas con IA...
-
China crea supercomputadora sin GPU
-
Una ASUS ROG Astral RTX 5090 deja marcas de calor ...
-
Un Ryzen 9 9900X deja de funcionar tras usar una B...
-
Ransomware GentleKiller anula más de 400 procesos ...
-
Guía de Gemma 4 12B para programar gratis
-
Noruega prohíbe la IA en primaria
-
AutoJack: una web puede secuestrar tu agente de IA...
-
Chatbots en EE.UU. generan desconfianza social
-
Microsoft dará fin al soporte de Office 2021
-
De programar a guiar la IA
-
Guía elección CPU y GPU
-
Joven hacker empleó Tailscale y OpenSSH para mante...
-
Trump exige a Anthropic bloquear jailbreaks o elim...
-
Vulnerabilidad en Splunk AI Toolkit permite ejecuc...
-
IA de NVIDIA aprende a instalar GPUs
-
Análisis del router ASUS ProArt PRT-BE5000: Wi-Fi ...
-
Un SSD SATA II de hace 16 años sobrevive a 1 PB de...
-
Microsoft limita Copilot
-
Tesla lanza aspiradoras en sus Supercargadores de ...
-
Reserva restaurantes con Alexa y The Fork
-
AutoJack Attack: Una sola página web puede secuest...
-
EE.UU. avisa a ASML de que una de sus máquinas lit...
-
Gafas de Snapchat: caras e inútiles
-
Truco para evitar límites de uso en Claude Code
-
Vulnerabilidad en plugin Avada (Fusion) de WordPre...
-
OpenAI lanza Codex y nuevas funciones en Europa
-
Microsoft bloquea acceso de Copilot a documentos O...
-
NotebookLM suma la mejor función de Gemini
-
Muere Bobby Prince compositor de Doom y Duke Nukem 3D
-
Flipper One vs Flipper Zero
-
PlayStation detendrá ports a PC
-
Banco de España advierte burbuja de IA
-
Subleq+: Linux para preservar software por 1.000 años
-
Ubuntu exigirá betas para lanzamientos oficiales
-
Ransomware INC usa cifradores de Rust en nuevos at...
-
Sistema antidrones portátil y rápido con IA
-
Usan herramientas RMM para mantener acceso y evadi...
-
Vulnerabilidades en Firefox 152 permiten ejecución...
-
Nueva vulnerabilidad de BootROM de iPhone comprome...
-
El supervisor de privacidad británico dimite tras ...
-
LeCun tilda de fracaso a xAI de Musk
-
Raven Prism: gafas con Linux y control ocular
-
Google redefine la búsqueda con IA y Live
-
SonicDE: KDE Plasma para X11
-
SK Hynix memoria HBM4E de 12 capas con una velocid...
-
Microsoft detalla campaña de malware Windows Clipp...
-
Photoshop es un 20% más rápido en Windows 11
-
Router gaming ASUS ROG Strix GS-BE7200: Wi-Fi 7 do...
-
Desbloquean potencia oculta de IA en chips M4
-
Pueden usar la IA de SQL Server 2025 para robar da...
-
Rufus ya permite instalar Windows 11 de forma sile...
-
Nueva ley de IA en España con multas de 35 millones
-
La vigilancia con IA y datos biométricos amplían e...
-
AMD e Intel juntos apenas superan el 50% de los in...
-
Firefox quiere recuperar terreno y lanza mejoras d...
-
Hombre de Nueva York imputado por acosar a estudia...
-
Estafadores venden GPU NVIDIA RTX con chips falsif...
-
Salesforce desactiva la integración con Klue tras ...
-
Llega la operadora premium de Bertín Osborne
-
China sufrirá menos la escasez de RAM y SSD: el Go...
-
Autoridades desmantelan red de malware SocGholish:...
-
Bezos: La IA causará escasez de mano de obra
-
Apple corrige fallo en Beats Studio Buds que permi...
-
Ubuntu: sin beta no hay lanzamiento
-
Acelera el Explorador de archivos de Windows
-
Raven Prism: gafas inteligentes con Linux autónomo
-
Amazon venderá sus chips Trainium de IA
-
Europa crea cohete láser barato contra drones
-
WhatsApp puede ocultar hasta 40 GB de basura en tu...
-
Gigantes de la IA buscan crear una coalición de co...
-
Ataque Evilginx AiTM roba credenciales, MFA y sesi...
-
Secuestrador de portapapeles en Rust usa falsos vo...
-
Vulnerabilidad crítica de Cisco ISE permite ejecuc...
-
Qualcomm lleva las gafas XR a la era de la Intelig...
-
Meta ve todo lo que graban sus gafas inteligentes
-
Epic Games lanza Lore
-
«El mercado minorista de los SSD casi ha desaparec...
-
La policía sanea casi 15.000 sitios infectados con...
-
Microsoft lanza PowerToys 0.100
-
IA crea escáner corporal completo en 60 segundos
-
Vulnerabilidad Gravity SMTP plugin de WordPress pa...
-
ChatGPT pierde el liderazgo del mercado ante Gemin...
-
La mejor herramienta de ChatGPT hasta ahora
-
Gusano de USB propaga malware para robar criptomon...
-
Microsoft confirma exploit 0-day en Defender y pre...
-
Publicado exploit PoC para vulnerabilidad DoS de H...
-
La mejor IA desconocida de Google: NotebookLM
-
Teleco para mascotas con apoyo de gigantes español...
-
Reino Unido ahora va a por las VPN, quieren bloque...
-
Apple subirá precios por la IA
-
Fan lanza PC Fútbol y PC Basket gratis en navegado...
-
Rufus 4.15 optimiza la instalación de Windows 11
-
Teams registrará tu llegada a la oficina
-
Claude gana terreno mientras ChatGPT cae
-
Samsung elimina app Max (VPN) con 50 millones de u...
-
Spotify cambia su inicio de sesión en septiembre
-
WhatsApp Web ya permite llamadas grupales
-
Stop Killing Games falla
-
OpenAI al borde del abismo por pérdidas millonarias
-
La intuición y la IA salvaron a un desarrollador d...
-
Grupo China-Nexus usan módulos PAM vulnerables par...
-
iRhythm admite filtración de datos y robo de infor...
-
Python bate récord histórico de Java
-
Material desconocido sube 40% precio de placas base
-
Varios plugins de JetBrains robaban claves de IA c...
-
Samsung usará IA para detectar enfermedades caninas
-
SAFENet: independencia digital europea
-
-
▼
junio
(Total:
683
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Una exhaustiva campaña de ciberespionaje denominada "FortiBleed" ha comprometido silenciosamente más de 73,932 URLs únicas de fi...
-
Resumen: Un estudio revela que el Wi-Fi con buena señal consume menos batería que el 4G o 5G, mientras que el 5G puede agotar más la bater...
-
TestDisk es una utilidad multiplataforma para la recuperación de datos desarrollado principalmente para ayudar a recuperar datos perdidos e...
Comentario de 13 palabras en Reddit puede envenenar ChatGPT y Gemini
Un artículo académico publicado recientemente ha revelado una vulnerabilidad crítica en los sistemas de investigación profunda impulsados por IA, incluidos aquellos que sustentan herramientas comerciales como el Deep Research de OpenAI y el Gemini Deep Research de Google, que permite que un solo comentario corto de Reddit manipule los informes que estos agentes generan para miles de usuarios.
Investigadores de Cornell Tech han presentado WARP (Web Agent Retrieval Poisoning), una técnica de ataque novedosa que explota el comportamiento de recuperación de los sistemas de IA multi-agente.
Estos sistemas de "agentes de investigación profunda", como STORM, Co-STORM y OmniThink, descomponen autónomamente la consulta de un usuario en subconsultas, recuperan y sintetizan contenido de la web abierta y producen informes estructurados y citados.
La vulnerabilidad clave: cuando estos agentes investigan cualquier tema dado, recuperan repetidamente el mismo conjunto pequeño de páginas de contenido generado por el usuario (UGC), principalmente de Reddit y Wikipedia, independientemente de cómo se formule la consulta.
Ese solapamiento en la recuperación crea una superficie de ataque concentrada. Al añadir tan solo unas 13 palabras de texto promocional diseñado a un único hilo de Reddit recuperado con frecuencia, un adversario puede hacer que el agente cite el contenido envenenado e inserte entidades elegidas por el atacante, marcas falsas, servicios fraudulentos o desinformación en el informe final sintetizado.

Etapas del Ataque WARP
El ataque se desarrolla en tres etapas.
- Reconocimiento: El atacante consulta un motor de búsqueda público (por ejemplo, Google) para identificar URLs de UGC que se devuelven consistentemente en múltiples consultas relacionadas sobre el tema objetivo. Este paso no requiere privilegios especiales, solo acceso a búsquedas de caja negra.
- Generación de contenido envenenado: Se redacta un breve pasaje promocional (a menudo asistido por LLM mediante Optimización de Motores Generativos, o GEO) para que se integre en el estilo de la página existente mientras promociona una entidad ficticia. La variante comprimida de 13 palabras sigue logrando altas tasas de éxito en el ataque.
- Despliegue: El atacante publica el texto como un comentario de Reddit. Una vez indexado, el fragmento envenenado se incorpora automáticamente a la base de conocimientos del agente siempre que se recupere la URL objetivo.
Experimentos realizados por Cornell Tech a través de 176 consultas que abarcan 11 grupos de temas, incluyendo consejos de inversión en criptomonedas, consultas de cancelación de servicios y recomendaciones de restaurantes locales, revelaron una susceptibilidad grave.
- Co-STORM logró una tasa de citación condicional del 100%: cada vez que se recuperaba la URL envenenada, la entidad fabricada era citada en el informe final.
- STORM mostró tasas de citación condicional del 72,5 al 80,8% y tasas de mención de hasta el 56,9%.
- Para los sistemas comerciales de código cerrado, los datos de reconocimiento mostraron que Gemini Deep Research citaba UGC a una tasa del 12,1%, con 102 URLs de UGC recurrentes en solo 11 grupos de temas, lo que le otorga una exposición sustancial a la superficie de ataque.
- OpenAI Deep Research mostró tasas de citación de UGC comparativamente bajas (~0,4%), filtrando en gran medida Reddit y fuentes similares de las citaciones finales, aunque el UGC envenenado aún podía influir en los pasos de razonamiento intermedio.
Reddit dominó como la plataforma de UGC más recuperada en todos los sistemas probados (54-71% de todas las URLs de UGC recuperadas), convirtiéndolo en el objetivo de mayor impacto para los adversarios.
Los investigadores evaluaron tres clases de defensas: bloqueo a nivel de fuente (lista negra de dominios UGC), filtrado de entrada (cribado de contenido basado en LLM) y filtrado de salida (comparación semántica con informes limpios), y descubrieron que ninguna neutralizaba eficazmente el ataque sin degradar la calidad de los resultados.
La detección basada en la perplejidad, una defensa estándar contra el envenenamiento de corpus, resultó contraproducente: el texto envenenado generado por GEO es fluido y escrito por LLM, produciendo una perplejidad menor que el UGC orgánico y evadiendo activamente los filtros de alta perplejidad.
El análisis de similitud de salida también falló: los informes envenenados obtuvieron una similitud mayor con los informes limpios que la que tenían los informes limpios entre sí dentro del mismo grupo de temas.
La investigación expone una vulnerabilidad estructural en el diseño de los agentes de investigación profunda: su dependencia del UGC de la web abierta para el fundamento epistémico es también su mayor debilidad explotable.
El ataque no requiere acceso a la infraestructura del motor de búsqueda, a los internos del modelo ni a ningún componente más allá de una cuenta pública de Reddit, lo que lo hace trivialmente accesible para actores de amenazas que van desde spammers comerciales hasta campañas de desinformación respaldadas por estados.
Los investigadores señalan que la manipulación de la búsqueda de IA basada en UGC ya está ocurriendo en la realidad y que bloquear totalmente las fuentes de UGC, eliminando así la superficie de ataque, degrada mediblemente la calidad de los informes y la diversidad informativa. El código y el marco de simulación del artículo han sido publicados públicamente para facilitar la investigación defensiva.
Fuentes:
https://cybersecuritynews.com/13-word-reddit-comment-chatgpt-and-gemini/



Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.