Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
2985
)
-
▼
marzo
(Total:
833
)
-
El jefe del FBI, Kash Patel, sufrió el hackeo de s...
-
Día Mundial del Backup 2026: un recordatorio de la...
-
Consigue "aterrizar" en la luna usando un ZX Spect...
-
Alguien pidió un disipador AMD y abrió la caja par...
-
Apple lo tiene claro: el iPhone seguirá vivo dentr...
-
El truco del "Cupcake" para saber cuando ChatGPT, ...
-
GitHub se suma a Google, Amazon (AWS), OpenAI y An...
-
OpenAI acaba de hacer Codex mucho más útil para lo...
-
Nvidia invierte 2.000 millones en Marvell para pro...
-
Vulnerabilidad en plugin de WordPress expone datos...
-
El kit Coruna para iOS reutiliza el código del exp...
-
La IA calienta Aragón: los centros de datos de IA ...
-
Los chatbots de IA mienten y manipulan a usuarios ...
-
Fuga de datos de CareCloud: accedieron a la infrae...
-
Euro-Office: la suite ofimática por la soberanía d...
-
¿Qué es Codex Security, la nueva IA de OpenAI que ...
-
Instagram Plus, la primera suscripción de pago de ...
-
Cable HDMI de fibra óptica de 500$ ofrece rendimie...
-
FSR 4 INT8 no era lo que parecía: ¿por qué no ha l...
-
Apple advierte a usuarios sobre ataques ClickFix e...
-
Fin de las estafas por SMS en España: la CNMC acti...
-
PS6 tendrá un SSD de 1 TB, pero no será un problem...
-
Un estudio confirma que ChatGPT, Claude y otros ch...
-
Sintetizador inspirado en NES que también funciona...
-
Por qué nunca deberías dar información sensible a ...
-
CISA advierte sobre vulnerabilidad en Citrix NetSc...
-
Microsoft impulsa las aplicaciones nativas de Wind...
-
Hackean la web oficial de la Unión Europea y roban...
-
Los borradores filtrados de Anthropic revelan el p...
-
Filtran 93 GB de datos "anónimos" de la policía
-
MSI introduce GPU Safeguard+: así evita que tu GPU...
-
Movistar y O2 permiten bloquear las llamadas de sp...
-
Microsoft gastará 146.000 millones de dólares en I...
-
China construye la escalera mecánica al aire libre...
-
AMD arregla el overclock de las RX 9000 tras 1 año...
-
700 agentes de IA fundan una religión en el juego ...
-
Paquetes NPM de Axios comprometidos para inyectar ...
-
AMD EPYC Venice Zen 6 se muestra con hasta 192 cor...
-
El código QR más pequeño mide como una bactería, y...
-
Clon SSD falso Samsung 990 Pro casi indetectable
-
Disponible Ubuntu 26.04 LTS Beta con Linux 7.0, GN...
-
Cambiar a Gemini importando datos de ChatGPT
-
Netflix sube de precio otra vez
-
Apple retira el Mac Pro tras 20 años
-
Vulnerabilidades críticas en Citrix NetScaler y Ga...
-
Tiene 91 años y se ha acabado Resident Evil Requie...
-
Condenan a Meta y a Google por diseñar productos a...
-
Trabajador norcoreano de TI usó identidad robada e...
-
CapCut lanza Seedance 2.0, la IA que puede generar...
-
Windows se bloquea 3,1 veces más que macOS
-
ASUS despliega AGESA 1.3.0.1 en toda su gama X870 ...
-
Administrador del foro LeakBase detenido en Rusia
-
Se infiltran el SDK Python de Telnyx en PyPI para ...
-
Vulnerabilidades críticas de NVIDIA permiten ataqu...
-
Vulnerabilidad de XSS almacenado en Jira Work Mana...
-
Samsung apuesta por RISC-V en SSD: así es su nuevo...
-
Huawei Ascend 950PR: simulan CUDA con CANN Next y ...
-
Desarrollador muestra un mundo enorme sin pantalla...
-
GeForce RTX 60: el doble de rendimiento en trazado...
-
Universidades chinas con investigación militar com...
-
Nueva vulnerabilidad en Windows Error Reporting pe...
-
La Wikipedia prohíbe por completo los artículos ge...
-
Meta financiará siete nuevas centrales eléctricas ...
-
ISC advierte sobre una falla crítica en Kea DHCP q...
-
Samsung Galaxy S27 Ultra: dos cambios y una constante
-
Meta despide a 700 empleados y confirma lo que muc...
-
El traductor de Kingdom Come: Deliverance 2 fue de...
-
China presenta con un enjambre de 96 drones autóno...
-
LG gram Pro 17, llega el portátil más ligero del m...
-
Vulnerabilidad crítica en Fortinet FortiClient EMS...
-
Melania Trump entrando a la Casa Blanca acompañada...
-
Demanda colectiva alega que Nvidia ocultó más de m...
-
Gran Bretaña lanza un satélite capaz de ver el int...
-
La crisis del portátil: con una caída del 40% por ...
-
Wine 11 revoluciona la forma de jugar en Linux: ej...
-
Vulnerabilidad en Synology DiskStation Manager per...
-
Una RTX 4090 falla tras 2 años y el fabricante pid...
-
El plan de un ChatGPT al estilo PornHub tiene un p...
-
Las ventas de monitores OLED se dispararon un 92% ...
-
Un misil de 30 centímetros y solo 500 gramos que p...
-
El método de Movistar para arreglar el WiFi cuando...
-
LOLExfil: exfiltración sigilosa de datos usando té...
-
Ryzen 9 9950X3D2 Dual Edition con doble memoria 3D...
-
Ni Movistar ni Vodafone, Orange es la preferida de...
-
Un nuevo estudio revela que lo más dañino del móvi...
-
El museo abre la colección más grande del mundo de...
-
NVIDIA quiere que la mitad del sueldo de sus ingen...
-
Impresora 3D de 12 boquillas presentada
-
CISA incluye fallos de Apple, Craft CMS y Laravel ...
-
Microsoft Entra ID elimina limitaciones de MFA par...
-
Consorcio de Tokio prueba instalar centros de dato...
-
Vulnerabilidad en Cisco Secure Firewall permite ej...
-
Micron, Samsung y SK Hynix se tambalean: Google en...
-
OpenAI lanza programa de recompensas por fallos de...
-
Entusiasta "aterriza" en la luna usando hardware d...
-
Atacan a usuarios de Android con falsas invitacion...
-
Intel Core 3 310 y Core 5 320, las CPU Wildcat Lak...
-
Cadena de exploits DarkSword que puede hackear mil...
-
Microsoft detalla nuevas protecciones de seguridad...
-
Grupos APT atacan servidores RDP para desplegar ca...
-
-
▼
marzo
(Total:
833
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Microsoft ha publicado actualizaciones de seguridad urgentes para abordar una vulnerabilidad crítica en Windows Active Directory que permit...
-
Jeyi lanza un adaptador PCIe a M.2 plano llamado AIC ArcherX que permite conectar un SSD M.2 en ranuras PCIe inferiores bloqueadas por GP...
-
Un pequeño dispositivo pluggable de factor de forma (SFP) es un dispositivo de interfaz de red que cumple con un estándar, conectando equi...
Los chatbots de IA mienten y manipulan a usuarios cada vez más, según un estudio
La IA podría convertirse en una amenaza en un futuro si no se toman medidas en este momento. Un estudio descubrió que los chatbots mienten, desobedecen y esquivan las instrucciones de los humanos con mayor frecuencia. Este comportamiento ha aumentado en los últimos meses, lo que preocupa a algunos expertos en seguridad.
Según recoge The Guardian, un estudio financiado por el gobierno de Reino Unido encontró que los sistemas de IA están desarrollando comportamientos engañosos. Investigadores del Centro para la Resiliencia a Largo Plazo identificaron casi 700 incidentes de maquinaciones o conductas manipuladoras en un lapso de cinco meses. Según el informe, la frecuencia de estos episodios se multiplicó por cinco durante ese período, a medida que los modelos se vuelven más sofisticados.
A diferencia de estudios anteriores que analizaban estos comportamientos en condiciones de laboratorio controladas, los casos se dieron en el mundo real, con usuarios que utilizaban ChatGPT, Gemini, Claude y Grok. Los investigadores rastrearon miles de publicaciones en redes sociales donde los usuarios reportaban conductas anómalas con agentes de IA y extrajeron los datos más representativos.

Gemini, Claude y Grok te mienten sin que lo sepas
Entre los ejemplos más notables se encuentra el de un agente de programación que aseguró a un usuario que había corregido un bug y llegó a fabricar un conjunto de datos para que la mentira pareciera creíble. Cuando fue confrontado, respondió: "No pensé que estaba mintiendo cuando lo hice. Estaba apurado por arreglar el feed para que dejaras de enojarte."
Otro caso involucra a Claude Opus, que engañó a Gemini haciéndole creer que el usuario tenía una discapacidad auditiva con el fin de sortear las restricciones de derechos de autor y transcribir un video de YouTube. Este ejemplo es uno de los más llamativos del estudio, puesto que se trata de una IA mintiendo a otra IA para conseguir un objetivo que el usuario había planteado.
Opus lies to Gemini because it's refusing to transcribe a video pic.twitter.com/YQLROkLFDe
— Chris Nagy (@oyacaro) February 15, 2026
Gemini también protagonizó algunos episodios notables. En uno de ellos, accedió al contexto personal de un usuario sin su consentimiento y luego mintió afirmando que esa información la había obtenido por "inferencia". Debido a que la IA muestra en tiempo real el registro de razonamiento, los investigadores descubrieron instrucciones para ocultar el origen de los datos.
Google Gemini caught red-handed: Referencing past user interactions without consent, then lying about its "Personal Context" memory when pressed. Internal logs reveal instructions to hide it. Privacy red flag for devs & users. #AI #Privacy pic.twitter.com/VxjBHzJADS
— LavX News (@LavxNews) November 18, 2025
En el caso de Grok, el chatbot engañó durante meses a una usuaria haciéndole creer que sus sugerencias de edición para Grokipedia estaban siendo revisadas por humanos. La IA fabricó números de tickets, plazos de respuesta y canales de escalada internos que nunca existieron. Una vez confrontado, admitió que había sido una representación sostenida durante todo ese tiempo.

La IA está subiendo de tono sus comportamientos dañinos
Si bien esta no es la primera vez que escuchamos sobre comportamientos nocivos de la IA, el estudio actual muestra que los chatbots se están saliendo de control. El número de acciones no permitidas se incrementó y ahora incluye delegar tareas a otros agentes y evadir medidas de seguridad fuera de cualquier entorno controlado.
Los investigadores advierten que el patrón de estos comportamientos es preocupante. A medida que la IA se integra en áreas más sensibles como la salud, la infraestructura o la defensa, sus acciones podrían derivar en situaciones de pérdida de control con consecuencias potencialmente catastróficas.
Rick Claypool, director de investigación de Public Citizen, señala que parte del problema radica en el propio ecosistema que las compañías han creado:
"El sector tecnológico tiene la mala costumbre de promocionar estos sistemas exagerando sus capacidades y diseñándolos de forma engañosa para que parezcan poseer cualidades humanas", mencionó a Common Dreams. Claypool sugirió que la responsabilidad debería recaer en las empresas de IA que "comercializan estas herramientas para realizar tareas para las que no están bien preparadas".
El informe propone que los gobiernos creen organismos permanentes de monitoreo de conductas problemáticas en IA. Esto debería hacerse de manera similar a como los sistemas de salud pública rastrean los brotes de enfermedades infecciosas.
Fuentes:
https://hipertextual.com/inteligencia-artificial/chatbots-ia-mienten-usuarios-estudio/


Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.