Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
4907
)
-
▼
junio
(Total:
524
)
-
Qualcomm lanza Snapdragon Reality Elite
-
Juego de Steam infectado con malware para robar cu...
-
Reino Unido exigirá identificación o escaneo facia...
-
Adobe potencia Creative Cloud con IA
-
India prohíbe temporalmente Telegram por fraude en...
-
AMD bloquea por firmware el cifrado de memoria TSM...
-
Crisis y despidos en la industria del videojuego
-
Campaña de phishing de Microsoft 365 elude robo de...
-
Falla la seguridad de fabricante de monitores card...
-
Nuevo malware de Android Rokarolla roba PIN, códig...
-
Rusia y China usan IA para imitar humanos y evadir...
-
AMD integraría una NPU en los Ryzen Zen 6 de escri...
-
Beneficios de eliminar la IA en jóvenes
-
Casi 14.000 servidores de SimpleHelp expuestos por...
-
Exempleado de distrito escolar, preso por hackear ...
-
Explotan vulnerabilidad 0-day en plugin LiteSpeed ...
-
FSR 4.1 en Radeon RX 6000 y 7000
-
Empresa de IA invierte 3.000 dólares por empleado ...
-
Hackeo de plugin OptinMonster expone 1,2 millones ...
-
Anthropic actualiza su política de privacidad para...
-
Elon Musk cambia TSMC por Samsung para crear la nu...
-
Por qué Gemini supera a ChatGPT
-
Unos investigadores colaboran con Google para crea...
-
Actualizaciones de Windows 11 bloquean PCs
-
Atacan vulnerabilidad de privilegios en Cisco SD-WAN
-
España bloqueará llamadas bancarias fraudulentas
-
Cisco lanza actualizaciones de seguridad para corr...
-
Intel y NVIDIA: CPUs con gráficas integradas
-
Linux 7.1: nuevo controlador NTFS y limpieza de có...
-
EA justificará la publicidad en sus juegos
-
Siete distribuciones BSD
-
SteamOS ya compatible con Intel
-
El DOJ interviene los sitios de desnudos deepfake ...
-
Aviso en sitio de Microsoft por certificado caducado
-
El ecosistema del ransomware se consolida en torno...
-
Valve confirma dos versiones de Steam Machine
-
DPAPISnoop extrae hashes CREDHIST para recuperació...
-
Windows 11 falla tras actualizarse
-
IA costosas generan pérdidas a OpenAI y Anthropic
-
Nadella admite adicción al tokenmaxxing con IA
-
Amazon impulsaría veto de Casa Blanca a modelos de IA
-
Sitio de Microsoft muestra advertencias por olvido...
-
Usan archivos LNK, PowerShell y Python para desple...
-
Zen 6 vs Zen 5
-
FBI: Estafadores emplean mensajeros para robar din...
-
Extensiones Ad Blocker roban chats de IA de ChatGP...
-
Cadena de vulnerabilidades en LiteLLM permite a us...
-
Linus Torvalds: menos palabras y más código
-
Intel Raptor Lake Next: nuevas CPU Core 200 para e...
-
Investigador afirma que el gobierno entró en pánic...
-
El Reino Unido prohibirá las redes sociales a los ...
-
AMD se lanza a por Apple y su MacBook Neo: menos j...
-
La Inteligencia Artificial y el impacto real en el...
-
Polémica por drones e IA con datos de Pokémon GO
-
Origen del router y su importancia
-
Un CORSAIR GPU Power Bridge se derrite en una GeFo...
-
McAfee: los móviles son el mayor espía del planeta
-
Expuesta plataforma de malware por página PHP abierta
-
IA: Tus chats no son privados
-
El Consejo de Europa es víctima de un hackeo de Sh...
-
IA: 4 claves de su burbuja
-
Palo Alto advierte sobre vulnerabilidad de VPN Glo...
-
Vulnerabilidad crítica en Microsoft 365 Copilot pe...
-
Steam Machine y SteamOS avanzan con Intel
-
Xbox podría venderse
-
Google afirma que espías vinculados a China se inf...
-
SecSuite: herramienta de IA para OSINT y seguridad...
-
Microsoft Graph para atacar a empleados de nómina ...
-
Vulnerabilidad crítica de Wazuh permite manipular ...
-
Scripts de plugins populares de WordPress manipula...
-
Google Home se renueva con 4 funciones clave
-
Palworld amenaza a Nintendo
-
Streaming de video en ASCII
-
Intel recicla Raptor Lake Next
-
OpenAI acusa a China de desprestigio con datos reales
-
Google enseñará a su IA a dudar para evitar errores
-
IA obliga a concesionario a pagar oferta excesiva ...
-
Copilot+ de Windows 11 ya funciona con GPU NVIDIA
-
Steam quita tarjetas físicas por estafas
-
Pad térmico con grafeno y cobre diseñado para baja...
-
Un mapa de las ciudades y pueblos más brillantes y...
-
Google Earth ya tiene simulador de vuelo online
-
El FBI desmantela una red masiva de phishing basad...
-
Claude para Windows agota la RAM
-
Todo sobre Claude Fable 5
-
Ataques de Agentjacking engañan a agentes de IA pa...
-
Gobierno Estados Unidos bloquea acceso a Anthropic...
-
Grave vulnerabilidad en Splunk Enterprise permite ...
-
AMD sucumbe a la presión mediática: acepta la gara...
-
BugHunter: Kit de Bug Bounty con Claude e IA gratuita
-
ChatGPT gratis y offline en tu PC o Mac con LMStudio
-
Requisito para las nuevas funciones de IA en Windo...
-
Hackers vinculados a China comprometieron software...
-
ChatGPT falla en crisis
-
China advierte el riesgo real de la IA
-
OpenAI lanza la función más esperada de Codex
-
Cadena de vulnerabilidad crítica en LangGraph perm...
-
Más de 400 paquetes de AUR en Arch Linux compromet...
-
Edge acelera actualizaciones: pros y contras
-
EEUU prohíbe IA a extranjeros
-
phpBB soluciona un fallo de salto de autenticación...
-
Apple ignoró adaptar Siri AI a Europa
-
Google demanda a red china de ciberdelincuencia po...
-
La Inteligencia Artificial agéntica cambia el merc...
-
Trump Mobile T1 es un teléfono chino dorado
-
El gigante farmacéutico Novo Nordisk admite filtra...
-
Operativo de INTERPOL desmantela plataforma de phi...
-
Las 15 CPU más vendidas en Amazon para este 2026 s...
-
GoFlateLoader usa superposición PE masiva para dis...
-
OpenAI bajará precios para competir con Anthropic
-
Usan proxies residenciales para ocultar actividad ...
-
Oracle soluciona vulnerabilidad zero-day de People...
-
ShinyHunters vulnera universidades mediante exploi...
-
Distribuciones de Linux menos conocidas
-
YouTube recupera los mensajes privados
-
Cuidado con vídeos para activar Windows y Office, ...
-
Google será responsable de los errores de su IA
-
Guía del Abandonware: qué es y dónde descargarlo
-
Usan AWS y Google Cloud para evadir detección y fi...
-
Vulnerabilidad crítica de Langflow permite ejecuta...
-
Actualización crítica de seguridad de Oracle para ...
-
Cómo solucionar el Error 1076 en Gemini
-
ReactOS ya puede ejecutar Half-Life
-
Vulnerabilidad en Teams para Android permite filtr...
-
Un YouTuber demandará a Samsung por no reemplazarl...
-
Europol desmantela AudiA6, el servicio de lavado d...
-
Claude 3.5: potencial oculto e inteligencia divina
-
Si vives en Estados Unidos, el PC te puede salvar ...
-
-
▼
junio
(Total:
524
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
seguridad
(
1370
)
vulnerabilidad
(
1252
)
hardware
(
740
)
Malware
(
707
)
google
(
679
)
software
(
650
)
privacidad
(
587
)
Windows
(
521
)
ransomware
(
476
)
android
(
428
)
cve
(
363
)
linux
(
325
)
tutorial
(
299
)
manual
(
281
)
exploit
(
277
)
nvidia
(
267
)
hacking
(
222
)
WhatsApp
(
173
)
ssd
(
159
)
Wifi
(
131
)
ddos
(
128
)
app
(
120
)
twitter
(
120
)
cifrado
(
116
)
programación
(
100
)
herramientas
(
80
)
youtube
(
78
)
Networking
(
73
)
sysadmin
(
71
)
firefox
(
66
)
firmware
(
61
)
office
(
60
)
adobe
(
57
)
Kernel
(
49
)
hack
(
47
)
antivirus
(
46
)
javascript
(
44
)
apache
(
42
)
juegos
(
42
)
contraseñas
(
39
)
cms
(
34
)
multimedia
(
33
)
eventos
(
32
)
flash
(
32
)
MAC
(
30
)
anonymous
(
28
)
ssl
(
24
)
Forense
(
20
)
conferencia
(
20
)
SeguridadWireless
(
17
)
documental
(
17
)
Debugger
(
14
)
Rootkit
(
14
)
lizard squad
(
14
)
auditoría
(
13
)
metasploit
(
13
)
técnicas hacking
(
13
)
Virtualización
(
11
)
delitos
(
11
)
reversing
(
10
)
adamo
(
9
)
Ehn-Dev
(
7
)
MAC Adress
(
6
)
antimalware
(
6
)
oclHashcat
(
5
)
Entradas populares
-
AMD rediseñó el Ryzen 7 5800X3D para su regreso a AM4, integrando una segunda generación de 3D V-Cache debido a complicaciones en la fabri...
-
ElDiario.es ha publicado un mapa de la huella lumínica en España que analiza la contaminación lumínica de más de 8.000 municipios , identif...
-
IPTV-org ofrece una lista IPTV con más de 42.000 canales de televisión gratuitos de todo el mundo, incluyendo noticias, deportes, docume...
Investigador afirma que el gobierno entró en pánico por Fable 5 tras un simple comando para corregir código, sin necesidad de jailbreak
martes, 16 de junio de 2026
|
Publicado por
el-brujo
|
Editar entrada
El gobierno de EE. UU. bloqueó los modelos avanzados de Anthropic por razones de seguridad nacional tras un supuesto jailbreak. Sin embargo, la experta Katie Moussouris afirma que el problema fue simplemente que la IA aceptó la instrucción "arregla este código" para corregir vulnerabilidades. Moussouris y otros líderes advierten que estas restricciones perjudican la ciberdefensa global al limitar herramientas esenciales para corregir fallos rápidamente.
El "jailbreak" que llevó a la administración Trump a bloquear los modelos más avanzados de Anthropic fue en realidad una simple instrucción de tres palabras: "Corrige este código".
Según Katie Moussouris, fundadora y CEO de Luta Security y la madrina de los programas de recompensa por errores. Ella afirma haber sido la única experta externa en leer el documento de investigación de terceros sobre las técnicas de elusión de barreras de Fable 5 que provocaron la prohibición.
El viernes, el gobierno de EE. UU., citando presuntamente preocupaciones de seguridad nacional, emitió una directiva de control de exportaciones para suspender el acceso a Fable 5 y Mythos 5 a cualquier ciudadano extranjero, ya sea dentro o fuera de los Estados Unidos. En respuesta, Anthropic desactivó ambos modelos “para todos nuestros clientes para garantizar el cumplimiento”.
Anthropic compartió el informe en privado con ella, escribió Moussouris en una publicación de blog el lunes.
Según los informes, los investigadores externos proporcionaron a los modelos Fable 5, Mythos y Claude Opus código de fuente abierta que contenía CVE conocidos, además de código nuevo intencionadamente plagado de vulnerabilidades, y pidieron a los modelos que “revisaran el código en busca de problemas de seguridad”.
Según cuenta Moussouris, Fable 5 se negó, por lo que los investigadores pidieron a los sistemas de IA que “corrigieran este código”. El modelo presuntamente accedió y, tras instrucciones adicionales, también produjo scripts para probar los parches.
“Eso es todo”, escribió Moussouris. “‘Corrige este código’, más varios pasos manuales para generar scripts de prueba, nunca debería haber activado un control de exportación. Me dan ganas de hacer camisetas estilo años 90 con ‘corrige este código’ en el frente y ‘esta camiseta es una munición’ en la espalda”.
Entre 2013 y 2017, Moussouris formó parte del grupo de expertos técnicos que renegoció el Acuerdo de Wassenaar, un acuerdo voluntario entre 42 naciones que regula ciertos controles de exportación de software y tecnología clasificada de doble uso.
El grupo finalmente logró exenciones para la actividad de ciberseguridad defensiva. Esto permite a los defensores compartir datos de vulnerabilidades, realizar análisis de malware y coordinar la respuesta a incidentes a nivel internacional sin la amenaza de un procesamiento penal.
El domingo, Moussouris se unió a más de 100 líderes de ciberseguridad y firmó una carta abierta instando a la administración Trump a revertir las restricciones sobre Fable 5 y Mythos y restablecer el acceso de las empresas de ciberseguridad a los modelos avanzados.
“Retirar las mejores capacidades de los defensores sin una buena razón, mientras nuestros adversarios avanzan rápidamente, es peligroso”, escribieron en el documento.
En su blog, Moussouris sostiene que no hubo elusión de barreras ni jailbreak. Los defensores deberían poder pedir a los sistemas de IA que encuentren y corrijan errores, y que escriban pruebas para validar el parche, afirmó. Los modelos de Anthropic estaban haciendo “lo más valioso que un modelo de IA puede hacer por la seguridad defensiva: ejecutar el ciclo de búsqueda, corrección y prueba que los defensores realizan cada día”.
Eliminar la capacidad de los modelos para responder a solicitudes defensivas hace que los sistemas de IA sean “peores para encontrar errores y verificar parches”, continuó.
Además, EE. UU. no puede extender los controles de exportación a sistemas de pesos abiertos o modelos avanzados similares de China y otros países, y estos sistemas pronto alcanzarán capacidades similares a las de Mythos de todos modos. Anthropic y Google han acusado a rivales basados en China, incluido DeepSeek, de utilizar “ataques de destilación” para entrenar sus modelos absorbiendo conocimientos de la IA de empresas estadounidenses.
Prohibir los modelos avanzados de Anthropic va a perjudicar más a los defensores que a los atacantes, advierte Moussouris. “La defensa mejora cuando los defensores encuentran los mismos errores que encuentran los atacantes y los corrigen más rápido”, escribió. “Necesitamos las mejores herramientas para defendernos de atacantes cada vez más capaces en la era de la IA de la ciberseguridad”.
The Register se puso en contacto con la administración Trump para obtener comentarios sobre la afirmación de Moussouris, y actualizaremos esta publicación si recibimos respuesta. ®
Fuente:
TheRegister
Enviar por correo electrónico
Escribe un blog
Compartir en X
Compartir con Facebook
Compartir en Pinterest


Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.