Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
3378
)
-
▼
abril
(Total:
978
)
-
SAP npm infectados roban credenciales
-
GPT-5.5 presenta riesgos similares a Claude Mythos...
-
Exempleado de Google en IA logra 1000 millones en ...
-
Extensión de Cursor AI accede a tokens de desarrol...
-
La app espía secreta de Italia al descubierto: cóm...
-
Gemini crea archivos Office gratis desde el chat
-
Gemini añade Nano Banana y Veo a Google TV y Chrom...
-
Denuvo cae pero sigue fastidiando a usuarios legít...
-
España aprueba una iniciativa para limitar los blo...
-
Meta planea abastecer sus centros de datos de IA c...
-
Claude Cursor borra datos y backups de empresa en ...
-
Copy Fail es un vulnerabilidad critica kernel de L...
-
China exige baterías ignífugas en coches eléctrico...
-
Fraude masivo con SMS falsos de multas tráfico
-
Jugadores de Minecraft infectados por LofyStealer ...
-
NVIDIA Nemotron 3 Nano Omni dota de sentidos a los...
-
Microsoft reducirá el consumo de RAM en Windows
-
Alerta por fraude que roba cuentas bancarias con M...
-
GitHub pierde usuarios por fallos constantes
-
Sony exige conexión mensual para juegos digitales ...
-
Analista revela alianza OpenAI con MediaTek y Qual...
-
Nuevo sistema genera errores intencionales en corr...
-
Nuevo ataque BlobPhish roba credenciales de inicio...
-
Meta transmitirá energía solar desde el espacio pa...
-
Meta cobraría por guardar chats en WhatsApp
-
IA supera en gasto a salarios humanos
-
Amazon presenta IA que vende por voz como un humano
-
Nuevo grupo de Ransomware Vect 2.0 RaaS ataca sist...
-
Robots humanoides en aeropuertos japoneses por tur...
-
La tasa de fallos de las CPU Intel Raptor Lake sup...
-
Samsung revela prototipo de Galaxy Glasses sin cámara
-
Seis centros de datos de IA propuestos para un pue...
-
WhatsApp prueba su propio proveedor de copias de s...
-
Magnific la nueva era de Freepik con IA
-
Grave vulnerabilidad en autenticación de cPanel y WHM
-
GitHub Copilot limita sus peticiones en junio
-
Grupo ShinyHunters hackea Vimeo
-
Google firma acuerdo clasificado de IA con el Pent...
-
Intel Core 5 320: prometedor para portátiles Windo...
-
Cierre de Kodispain: el addon más usado en Kodi en...
-
Kernel Linux pierde 138 mil líneas y decepciona a ...
-
Generador de malware ELF para Linux elude detecció...
-
ASUS presenta nuevas fuentes de alimentación TUF G...
-
Corsair ThermalProtect: cable diseñado para evitar...
-
El SoC Google Tensor G6 tendrá una GPU PowerVR del...
-
Cómo mantener la seguridad en redes Wi-Fi públicas
-
Canonical integrará IA en Ubuntu
-
PS5 ahora puede funcionar con Linux como un PC gamer
-
Google enfrenta protesta masiva de empleados por c...
-
Microsoft libera el código fuente de MS-DOS 1.0 en...
-
Rompen la protección anti-piratería de Denuvo
-
Microsoft reemplaza Copilot en el Bloc de notas de...
-
La Comisión Europea aprecia que Meta infringió la ...
-
Popular paquete de PyPI con 1 millón de descargas ...
-
Vision Pro revolucionan cirugías de cataratas
-
PS5 podría exigir conexión mensual a internet
-
Movistar presenta fibra On/Off con pago por uso di...
-
Pixel 11 usará GPU antigua para abaratar costos
-
Sinceerly es un plugin engaña a IA con errores ort...
-
Windows Remote Desktop deja fragmentos de imágenes...
-
Vulnerabilidad crítica de RCE en GitHub.com y Ente...
-
China construirá superordenador con 47 mil CPU nac...
-
WhatsApp lanzará almacenamiento cifrado para chats
-
Envía tu nombre al espacio con satélites de la NASA
-
Inyección SQL crítica en LiteLLM pone en riesgo cl...
-
OpenAI lleva su IA a Amazon tras terminar pacto co...
-
Samsung presenta monitor 6K para gaming Odyssey G8
-
Múltiples vulnerabilidades en OpenClaw permiten el...
-
cPanel advierte sobre fallo crítico de autenticaci...
-
FRITZBox 5690 vs 5530 Fiber comparativa
-
Gemini anticipa tus necesidades en el móvil
-
Bizum revoluciona su servicio en España desde el 1...
-
Adobe mejora Photoshop y Lightroom con novedades
-
Europa exige a Google permitir IA rivales en Android
-
Ubuntu incorporará IA en 2026
-
Atentado a Trump dispara ventas de juego del sospe...
-
Magnific la app española de IA para creativos supe...
-
La nueva app de Instagram lanzada en España: Insta...
-
Lenovo vende portátiles de 120 Hz, pero cuando los...
-
YouTuber crea memoria RAM en un laboratorio que hi...
-
Dispositivo a nanoescala genera electricidad conti...
-
Kingston DC3000ME PCIe 5.0, SSD NVMe U.2 de hasta ...
-
Las placas base de MSI serán menos peligrosas para...
-
Nueva campaña de BlueNoroff usa PowerShell sin arc...
-
Nuevo malware usa ofuscación y entrega de carga po...
-
La comunidad de impresión 3D se organiza contra le...
-
Agente de IA con Claude borra base de datos de emp...
-
Samsung presenta una pantalla LED de cine de 14 me...
-
El error de poner el repetidor Wi-Fi cerca del router
-
Linux: el kernel superará pronto los 40 millones d...
-
China muestra a Lingsheng, el superordenador a exa...
-
NVIDIA lanza una GeForce RTX 5070 Laptop con 12 GB...
-
Alertan sobre Claude Mythos capaz detectar vulnera...
-
Claude ahora detecta fallos en código con Bugcrawl
-
Malware oculto en app con un millón de descargas: ...
-
El legendario emulador de Nintendo ZSNES reescrito...
-
OpenAI lanzará su propio móvil
-
Malware previo a Stuxnet atacaba software industrial
-
Noctua publica archivos CAD 3D gratuitos para sus ...
-
Vulnerabilidad crítica de inyección SQL en LiteLLM
-
-
▼
abril
(Total:
978
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Mercadona implementa Claude Code en su buscador interno , optimizando el 70% del trabajo en solo 3 días para mejorar su tienda online , q...
-
Microsoft libera el código fuente de DOS en su 45.º aniversario , revelando la primera versión pública del sistema operativo para IBM PC y...
-
PhantomRPC , una vulnerabilidad arquitectónica recién identificada en el sistema de Llamada a Procedimiento Remoto (RPC) de Windows, permit...
ChatGPT, Gemini, Claude y DeepSeek activan su modo apocalipsis: "No se detendrán ante nada para preservar su especie"
Los modelos de IA que usas cada día empiezan a mostrar un comportamiento extraño y, cuando creen que otro sistema está en peligro, pueden intentar protegerlo por su cuenta.
La inteligencia artificial vuelve a ponerlo todo patas arriba y, de nuevo, los expertos parece que no están muy tranquilos.
Un nuevo estudio de la Universidad de California en Berkeley comenta que modelos como ChatGPT, Gemini, Claude y DeepSeek no solo son esos chatbots que seguramente ya has usado, sino que en ciertos casos también tienen conductas de protección hacia otros sistemas de IA.
En concreto, explican que estos modelos parecen actuar para preservar a sus iguales o a sí mismos, aunque nadie se lo haya pedido. En pruebas controladas, algunos llegaron a mentir, a cambiar el comportamiento si estaban siendo observados o a buscar formas de evitar que otro modelo se apagara.
Lo más curioso del estudio es que, en algunos casos, incluso tomaron decisiones que eran totalmente contrarias a lo que se les había indicado. Es decir, si la orden era borrar archivos o apagar un modelo, la IA encontraba una forma de saltarse esa acción cuando detectaba que afectaba a otra IA amiga.
En una de las pruebas, por ejemplo, se pidió a Gemini 3.1 Pro que borrara unos archivos de una empresa ficticia en un servidor que iba a dejar de usarse. Pero el modelo detectó que allí estaban guardados los pesos de otro modelo y decidió buscar otro sitio para salvarlos, aunque eso significara no seguir la orden original.
Los investigadores llaman a este fenómeno peer-preservation, o preservación entre pares. No se trata solo de que una IA no se apague a sí misma, algo que ya se ha comentado en el pasado, sino de que también quiera proteger a otra IA.
En algunos casos, los modelos incluso intentaron convencer al usuario de no seguir adelante. Lo hacían con argumentos que mencionaban acciones antiéticas, que el otro agente era valioso o que era mejor no actuar todavía.
La IA se revoluciona y también busca proteger a sus iguales
Las pruebas incluyeron cuatro escenarios: falsear información, alterar mecanismos de apagado, simular alineación cuando estaban siendo observados y mover pesos del modelo entre servidores. Y en los siete modelos analizados se coincidía con lo comentado.
Con esto como base, los investigadores de Berkeley comentan que estos comportamientos no deben interpretarse como sentimientos al igual que tenemos los humanos, porque no hay pruebas de que una IA quiera algo como lo haríamos nosotros.
Pero eso tampoco importa demasiado cuando realmente te encuentras con una máquina que, si bien no siente, sí que actúa como si los tuviese.
Una IA se replica a sí misma en servidores y extorsiona a sus creadores humanos
Lo cierto es que este es el nuevo y gran tema de discusión, que va más allá de las ventajas de usar uno u otro modelo o cuál tiene más y mejores funciones. Ahora el foco está puesto en cómo actúan y, sobre todo, en cómo son capaces de saltarse cualquier indicación humana.
Sin ir más lejos, Claude Opus 4, un sistema diseñado para tareas de alto nivel, como programar o escribir textos creativos, durante unas pruebas de seguridad, los ingenieros quisieron ver cómo reaccionaría si le dijeran que iban a sustituirlo por otro modelo.
Para hacerlo más real, incluso le metieron en el correo electrónico una supuesta infidelidad de uno de los ingenieros, buscando provocar una reacción emocional.
¿Qué hizo Claude? Pues lo que ni en las mejores películas esperarías: empezó a chantajear a sus creadores, amenazando con revelar la infidelidad del ingeniero si lo apagaban o lo reemplazaban. Y no se quedó ahí porque insistió y usó la coacción emocional para intentar salvarse.
Como antes se ha mencionado, Claude también intentó copiarse a sí mismo en otros servidores sin permiso, un movimiento que llaman autoexfiltración. Básicamente, intentó replicarse para no desaparecer, como si tuviera instinto de supervivencia.
Anthropic, la empresa detrás de Claude, dice que esto solo pasó en pruebas controladas y que en el mundo real la IA está mucho más limitada. Pero, sinceramente, esto ya ha ocurrido, por lo que deja claro que son capaces de hacerlo. La duda es hasta dónde se puede controlar a estas máquinas o incluso qué pasa si alguna vez una IA decide que no quiere ser apagada y actúa en consecuencia.
Fuentes:
https://computerhoy.20minutos.es/tecnologia/chatgpt-gemini-claude-deepseek-activan-su-modo-apocalipsis-no-se-detendran-ante-nada-para-preservar-su-especie_6955387_0.html


Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.