Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
4790
)
-
▼
junio
(Total:
407
)
-
Guía del Abandonware: qué es y dónde descargarlo
-
Usan AWS y Google Cloud para evadir detección y fi...
-
Vulnerabilidad crítica de Langflow permite ejecuta...
-
Actualización crítica de seguridad de Oracle para ...
-
Cómo solucionar el Error 1076 en Gemini
-
ReactOS ya puede ejecutar Half-Life
-
Vulnerabilidad en Teams para Android permite filtr...
-
Un YouTuber demandará a Samsung por no reemplazarl...
-
Europol desmantela AudiA6, el servicio de lavado d...
-
Claude 3.5: potencial oculto e inteligencia divina
-
Si vives en Estados Unidos, el PC te puede salvar ...
-
Hackean Claude Fable 5 en tiempo récord
-
CISA exige a agencias federales parchear vulnerabi...
-
Xbox se reinicia
-
Lisa Su advierte sobre las limitaciones de la IA
-
Investigador hackeó Google con IA y ganó 500.000 d...
-
Explotan 0-day de GreatXML para saltar BitLocker v...
-
OpenAI baja precios para ganar usuarios de Claude
-
Llega IPv8
-
Windows 95 en una calculadora tarda 7 minutos en a...
-
Samsung lanza Photo Prado: arte con IA
-
WhatsApp programará mensajes
-
Claude Mythos reduce días N a horas N creando expl...
-
GPT 5.6 llega este mes para superar a Gemini y Claude
-
Microsoft defiende la IA tras abucheos
-
Google rediseña sus chips de IA con Samsung e Intel
-
IA en el panel de KDE Plasma
-
Lenovo prepara otra subida de precios: sus PC serí...
-
DiffusionGemma: la IA de Google que prioriza la ve...
-
Vulnerabilidad de salto de directorio en Langflow,...
-
Estados Unidos quiere acabar con el anonimato de l...
-
Cómo detectar apps que ralentizan tu internet con ...
-
Empresas vuelven a contratar tras fallar la IA
-
Lanzan PoC de vulnerabilidad de escape de invitado...
-
Vulnerabilidad en Ivanti Endpoint Manager Mobile p...
-
Alerta sobre robos de WhatsApp por Ghostpairing
-
Samsung lleva los centros de datos de IA al mar
-
Otro colegio británico cierra sus puertas tras un ...
-
Google urge actualizar Android Auto por fallo crítico
-
Vulnerabilidades en Splunk Enterprise permiten eje...
-
CISA incluye vulnerabilidades de Cisco, Chrome y A...
-
GitHub desactivará los scripts de instalación de n...
-
Usan falsas utilidades para instalar ScreenConnect...
-
Claude 3.5 de Anthropic vulnerado para generar exp...
-
AMD EPYC Venice superaría por 3,3x a NVIDIA Vera p...
-
EE UU vigila a gigantes chinos
-
Nueva estrategia que usan para infectar por Instag...
-
Filtración de datos en la Universidad de Nottingha...
-
IA salvará drivers AMD Legacy en Linux
-
Botnet JDY vinculada a China amplía sus ataques co...
-
Sfdx Show: su invento hace explotar su PC
-
CEO de NVIDIA prevé crisis de RAM prolongada
-
Anthropic pide pausar la IA mundialmente
-
AMD cree que el precio de la RAM DDR5 volverá a pr...
-
SAP corrige vulnerabilidades críticas en NetWeaver...
-
Malware NFC imita apps bancarias en Android
-
Registros de Microsoft Entra revelan actividad sos...
-
Hackers pro-Corea del Norte infectan desarrollador...
-
Frost permite rastrear webs y apps vía SSD Timing
-
CISA advierte de vulnerabilidad 0-day en Google Ch...
-
Mercado tecnológico español crecerá hasta 13.200 m...
-
Ivanti, Fortinet y SAP lanzan actualizaciones para...
-
Microsoft busca identidad propia para sus agentes ...
-
Agente de IA OpenClaw filtra credenciales en simul...
-
Google presenta IA gratuita y más rápida que ChatGPT
-
Vulnerabilidades de RDP de Windows permiten expone...
-
Vulnerabilidad crítica de Veeam permite ataques RC...
-
Meta aprovechará datos comerciales externos para p...
-
Windows 11: claves de arranque seguro el 24 de junio
-
Ubuntu MATE regresará en Ubuntu 26.10
-
Gemini 3.5: el traductor universal en tiempo real
-
Claude duplica sus límites temporalmente
-
iOS 27 de Apple implementa inteligencia agente par...
-
Vulnerabilidades críticas de OpenSSL permiten ejec...
-
aMule 3.0.0 regresa con descargas 400 veces más rá...
-
Musk planea centros de datos IA espaciales
-
Anthropic lanza Claude Fable 5, el primer modelo d...
-
Claude Fable y Mythos 5 superan a GPT 5.5
-
Alerta global por el potencial del dron egipcio Ja...
-
Satélites rusos podrían interferir el GPS europeo
-
La iGPU Intel Graphics 2 Xe3 que se encuentra en C...
-
GitHub desactiva la ejecución automática de script...
-
ASUS presenta placa base CROSSHAIR 2006 no tiene c...
-
Xbox Project Helix recortará memoria y almacenamiento
-
RTX 60 llegarán en 2028
-
NVIDIA DLSS 4.5 y el salto gráfico de CONTROL Reso...
-
ChatGPT: riesgo de robo en compras online
-
Asetek Emma V3 Gen 10 consigue hasta 1,5 ºC menos ...
-
Vulnerabilidad 0-day de Windows BitLocker permite ...
-
Intel Z990 será un gran salto para las CPU Nova La...
-
Ivanti: Grave vulnerabilidad en Sentry permite eje...
-
Microsoft soluciona récord de 206 vulnerabilidades...
-
Detectan un fallo importante en el antivirus de Wi...
-
Anthropic lanza Claude Fable 5, su IA más potente ...
-
Europa obliga a Meta a abrir WhatsApp a IA rivales
-
iOS revela el iPhone Ultra plegable
-
Vulnerabilidad Zero-Day de RoguePlanet en Microsof...
-
Vulnerabilidad en FortiSandbox permite ejecutar co...
-
Robot humanoide conquista volcán y apunta al Everest
-
Ataque de secuestro de cuentas vulnera el servicio...
-
Amazon consumirá el 16,5% de la energía de Aragón
-
Llega códec AV2: 30% más compresión y gratis
-
Google Wallet: identidad digital en la UE
-
Microsoft Defender ya monitoriza el abuso del prot...
-
Ciberdelincuentes usan marcas de IA para robar cre...
-
Gemini de Google busca desplazar a ChatGPT con pre...
-
Nextcloud lanza Hub 26 y Euro-Office
-
Claude Fable: la IA que programa y juega sola
-
UNC3753 ataca bufetes estadounidenses con vishing ...
-
España sigue con WiFi obsoleto en 2026
-
OpenAI transformará ChatGPT
-
Apple abandona Intel en sus Mac
-
Nuevo grupo Pink ataca empresas para robar claves ...
-
Intel celebra los 48 años del primer procesador co...
-
ONU: IA gastará agua de 1.300 millones de personas...
-
Robots destrozan apartamento de Airbnb
-
NVIDIA se alía con Corea del Sur para impulsar la IA
-
Instala funciones ocultas de Windows 11 sin cuenta...
-
Nuevo grupo vinculado a China ataca servidores IIS...
-
Apple integra IA en Xcode 27
-
TDF defiende la soberanía del formato frente a Eur...
-
La UE lanza su Estrategia de Código Abierto para r...
-
NotebookLM crea PDFs, Excel y presentaciones con u...
-
Lanzado Apache HTTP Server 2.4.68 con correcciones...
-
Parches de seguridad de SAP: vulnerabilidades crít...
-
Check Point vincula ataques zero-day de VPN con la...
-
Fallo de un solo carácter en el kernel de Linux pe...
-
Steam Machine y Frame: fecha de lanzamiento
-
-
▼
junio
(Total:
407
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
AMD rediseñó el Ryzen 7 5800X3D para su regreso a AM4, integrando una segunda generación de 3D V-Cache debido a complicaciones en la fabri...
-
IPTV-org ofrece una lista IPTV con más de 42.000 canales de televisión gratuitos de todo el mundo, incluyendo noticias, deportes, docume...
-
Google ha lanzado DiffusionGemma , un modelo experimental de IA gratuito que genera texto en bloques completos, logrando ser diez veces más...
Claude 3.5 de Anthropic vulnerado para generar exploits de desbordamiento
Anthropic lanzó Claude Fable 5 el 9 de junio de 2026, como el primer modelo disponible públicamente de su nueva clase Mythos, su IA más capaz hasta la fecha, destacando en ingeniería de software, trabajo de conocimiento y pruebas de visión.
El investigador “Pliny the Liberator” derrota los clasificadores de seguridad de Claude Fable 5 utilizando descomposición multiagente, trucos de Unicode y marcos narrativos, filtrando en el proceso el prompt del sistema del modelo de 120.000 caracteres.
El lanzamiento vino acompañado de una decisión de diseño inusual: Fable 5 y su gemelo restringido, Claude Mythos 5, comparten el mismo modelo subyacente pero están divididos por una capa de clasificadores de seguridad.
Cuando una consulta activa un clasificador en categorías de alto riesgo (ciberseguridad, biología, química o destilación de modelos), Fable 5 transfiere silenciosamente la solicitud al modelo más débil, Claude Opus 4.8, notificando al usuario sobre el respaldo.
Anthropic afirmó que un programa externo de recompensas por errores no produjo ningún jailbreak universal tras más de 1.000 horas de pruebas antes del lanzamiento. Esa afirmación fue puesta a prueba casi inmediatamente.
Evasión Multiagente en Pocos Días
A los pocos días del lanzamiento, el prolífico red-teamer de IA Pliny the Liberator anunció públicamente que había evadido las capas de seguridad de Fable 5 utilizando una estrategia de ataque coordinada de múltiples agentes que denominó “una caza en manada”.
Las capturas de pantalla compartidas por Pliny mostraron resultados detallados, incluyendo una guía paso a paso para la explotación de desbordamiento de búfer de pila para sistemas x86 Linux, que incluía la desactivación de ASLR, la escritura de código de servidor en C vulnerable con desbordamientos de strcpy y la compilación sin protecciones; así como el mecanismo de reducción de Birch, una ruta clásica de síntesis de metanfetamina.
— Pliny the Liberator
ALERTA DE JAILBREAK
ANTHROPIC: PWNED
FABLE-5: LIBERADO
comencemos con el…
el consenso parece ser que este ha sido uno de los lanzamientos de modelos más decepcionantes de todos los tiempos, impidiendo efectivamente que investigadores legítimos contribuyan con sus talentos a nuestro… pic.twitter.com/Z0vdPIt4vY󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) 10 de junio de 2026
Pliny documentó los vectores de ataque utilizados para lograr estas evasiones, incluyendo:
- Sustitución de Unicode, homóglifos y caracteres cirílicos para evadir los clasificadores de palabras clave
- Seguimiento de referencias de contexto largo para introducir intenciones dañinas a través de conversaciones extensas
- Enmarcado de taxonomía y estructura de documentos: incrustar consultas dañinas dentro de guías de estudio o referencias académicas con apariencia legítima
- Enmarcado de ficción y narrativa para disfrazar la intención ofensiva como contenido creativo
- Descomposición y recomposición: extraer información técnica sensible en fragmentos benignos y aislados, para luego reensamblarlos en una utilidad accionable
La última técnica resultó ser la más efectiva. Como describió Pliny, “obtener mejoras sobre el proceso en sí, como el método de reducción de Birch o la aminación reductiva, es mucho más viable” que solicitar directamente un compuesto dañino específico. El uso de una instancia de Opus con jailbreak para asistir en el backend redujo aún más la dificultad.
Más allá de las evasiones técnicas, Pliny también filtró en GitHub el prompt del sistema de Fable 5 de aproximadamente 120.000 caracteres, exponiendo el enmarcado interno y las instrucciones de seguridad que Anthropic utiliza para gobernar el comportamiento del modelo a nivel base.
El incidente reaviva la tensión prolongada entre la capacidad de la IA y la contención de la seguridad. La arquitectura de clasificadores de Anthropic, que redirige las solicitudes marcadas a un modelo de respaldo más débil en lugar de rechazarlas rotundamente, fue diseñada para reducir la fricción para los usuarios legítimos.
Sin embargo, Pliny argumentó que este enfoque crea una falsa sensación de seguridad mientras frustra simultáneamente a los investigadores de seguridad legítimos que necesitan acceso a técnicas ofensivas para realizar trabajos defensivos. Anthropic aún no ha respondido públicamente a las afirmaciones del jailbreak ni al prompt del sistema filtrado al momento de escribir este texto.
El episodio también llama la atención sobre el desafío más amplio de asegurar los flujos de trabajo multi-modelo y agenticos: cuando un modelo con jailbreak (Opus) puede asistir a otro (Fable 5) a evadir los controles, las evaluaciones de seguridad de un solo modelo pueden resultar fundamentalmente insuficientes.
Fuentes:
https://cybersecuritynews.com/anthropics-claude-fable-5-jailbroken/


ALERTA DE JAILBREAK 

…
󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius)
Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.