Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
4748
)
-
▼
junio
(Total:
365
)
-
GitHub desactivará los scripts de instalación de n...
-
Usan falsas utilidades para instalar ScreenConnect...
-
Claude 3.5 de Anthropic vulnerado para generar exp...
-
AMD EPYC Venice superaría por 3,3x a NVIDIA Vera p...
-
EE UU vigila a gigantes chinos
-
Nueva estrategia que usan para infectar por Instag...
-
IA salvará drivers AMD Legacy en Linux
-
Botnet JDY vinculada a China amplía sus ataques co...
-
Sfdx Show: su invento hace explotar su PC
-
CEO de NVIDIA prevé crisis de RAM prolongada
-
Anthropic pide pausar la IA mundialmente
-
AMD cree que el precio de la RAM DDR5 volverá a pr...
-
SAP corrige vulnerabilidades críticas en NetWeaver...
-
Malware NFC imita apps bancarias en Android
-
Registros de Microsoft Entra revelan actividad sos...
-
Hackers pro-Corea del Norte infectan desarrollador...
-
Frost permite rastrear webs y apps vía SSD Timing
-
CISA advierte de vulnerabilidad 0-day en Google Ch...
-
Mercado tecnológico español crecerá hasta 13.200 m...
-
Ivanti, Fortinet y SAP lanzan actualizaciones para...
-
Microsoft busca identidad propia para sus agentes ...
-
Agente de IA OpenClaw filtra credenciales en simul...
-
Google presenta IA gratuita y más rápida que ChatGPT
-
Vulnerabilidades de RDP de Windows permiten expone...
-
Vulnerabilidad crítica de Veeam permite ataques RC...
-
Meta aprovechará datos comerciales externos para p...
-
Windows 11: claves de arranque seguro el 24 de junio
-
Ubuntu MATE regresará en Ubuntu 26.10
-
Gemini 3.5: el traductor universal en tiempo real
-
Claude duplica sus límites temporalmente
-
iOS 27 de Apple implementa inteligencia agente par...
-
Vulnerabilidades críticas de OpenSSL permiten ejec...
-
aMule 3.0.0 regresa con descargas 400 veces más rá...
-
Musk planea centros de datos IA espaciales
-
Anthropic lanza Claude Fable 5, el primer modelo d...
-
Claude Fable y Mythos 5 superan a GPT 5.5
-
Alerta global por el potencial del dron egipcio Ja...
-
Satélites rusos podrían interferir el GPS europeo
-
La iGPU Intel Graphics 2 Xe3 que se encuentra en C...
-
GitHub desactiva la ejecución automática de script...
-
ASUS presenta placa base CROSSHAIR 2006 no tiene c...
-
Xbox Project Helix recortará memoria y almacenamiento
-
RTX 60 llegarán en 2028
-
NVIDIA DLSS 4.5 y el salto gráfico de CONTROL Reso...
-
ChatGPT: riesgo de robo en compras online
-
Asetek Emma V3 Gen 10 consigue hasta 1,5 ºC menos ...
-
Vulnerabilidad 0-day de Windows BitLocker permite ...
-
Intel Z990 será un gran salto para las CPU Nova La...
-
Ivanti: Grave vulnerabilidad en Sentry permite eje...
-
Microsoft soluciona récord de 206 vulnerabilidades...
-
Detectan un fallo importante en el antivirus de Wi...
-
Anthropic lanza Claude Fable 5, su IA más potente ...
-
Europa obliga a Meta a abrir WhatsApp a IA rivales
-
iOS revela el iPhone Ultra plegable
-
Vulnerabilidad Zero-Day de RoguePlanet en Microsof...
-
Vulnerabilidad en FortiSandbox permite ejecutar co...
-
Robot humanoide conquista volcán y apunta al Everest
-
Ataque de secuestro de cuentas vulnera el servicio...
-
Amazon consumirá el 16,5% de la energía de Aragón
-
Llega códec AV2: 30% más compresión y gratis
-
Google Wallet: identidad digital en la UE
-
Microsoft Defender ya monitoriza el abuso del prot...
-
Ciberdelincuentes usan marcas de IA para robar cre...
-
Gemini de Google busca desplazar a ChatGPT con pre...
-
Nextcloud lanza Hub 26 y Euro-Office
-
Claude Fable: la IA que programa y juega sola
-
UNC3753 ataca bufetes estadounidenses con vishing ...
-
España sigue con WiFi obsoleto en 2026
-
OpenAI transformará ChatGPT
-
Apple abandona Intel en sus Mac
-
Nuevo grupo Pink ataca empresas para robar claves ...
-
Intel celebra los 48 años del primer procesador co...
-
ONU: IA gastará agua de 1.300 millones de personas...
-
Robots destrozan apartamento de Airbnb
-
NVIDIA se alía con Corea del Sur para impulsar la IA
-
Instala funciones ocultas de Windows 11 sin cuenta...
-
Nuevo grupo vinculado a China ataca servidores IIS...
-
Apple integra IA en Xcode 27
-
TDF defiende la soberanía del formato frente a Eur...
-
La UE lanza su Estrategia de Código Abierto para r...
-
NotebookLM crea PDFs, Excel y presentaciones con u...
-
Lanzado Apache HTTP Server 2.4.68 con correcciones...
-
Parches de seguridad de SAP: vulnerabilidades crít...
-
Check Point vincula ataques zero-day de VPN con la...
-
Fallo de un solo carácter en el kernel de Linux pe...
-
Steam Machine y Frame: fecha de lanzamiento
-
AM6 de AMD: DDR6 y PCIe Gen6
-
Tu fibra puede ser rápida, pero tu WiFi no tanto: ...
-
LaLiga extiende bloqueos de IP a Segunda División
-
IA crea gusanos adaptativos
-
NSA usa Claude Mythos para ciberoperaciones ofensi...
-
Grave fallo en VPN de Check Point permite saltar c...
-
Microsoft implementará una nueva carpeta de Acceso...
-
Microsoft fuerza Copilot en Windows
-
Windows 11 eliminará Bing de su búsqueda
-
SK hynix: su gran plan de duplicar la producción d...
-
Ejecutivos recortan empleos por un futuro de IA qu...
-
Explotan vulnerabilidad RCE de LiteLLM para ejecut...
-
Barra de sonido gaming puede ser hackeada a 16 met...
-
Intel muestra su liderazgo sobre AMD: la MSI Claw ...
-
Intel explica cómo reducirá el coste de los portát...
-
Grupo Silent Ransom ataca bufetes de abogados medi...
-
Norcoreanos envían más de 250 ofertas falsas de em...
-
Todo sobre los Pixel 11
-
Nueva vulnerabilidad de Linux permite escalar priv...
-
La alianza de navegadores (BCA) demanda a Microsof...
-
Nidos de pájaro hechos con fibra óptica: el peligr...
-
RTX Spark: el reto de apps x86 y juegos
-
Linux Foundation respalda la IA para crear empleo
-
FBI: China recluta espías en LinkedIn
-
NVIDIA RTX Spark recurre a núcleos Cortex-X925 mod...
-
UNC3753 empleó vishing e intrusiones físicas en ca...
-
Nuevo modo de bloqueo de ChatGPT contra inyeccione...
-
Anthropic pide frenar la IA para evitar perder el ...
-
Ataque de ransomware mantiene cerrada escuela secu...
-
Nuevo Lucid Stealer ataca 18 navegadores, billeter...
-
Comprometido canal de distribución de Hola Browser...
-
Chrome corrige 429 vulnerabilidades, 22 críticas
-
Una aplicación para «estropear» vídeos convirtiénd...
-
WhatsApp frustra ciberataque de NSO con el spyware...
-
Anthropic crea IA de mejora infinita y pide detene...
-
AMD niega la garantía de un Ryzen 9 7950X3D hinchado
-
¿Dejarías que la IA publique por ti en tus redes s...
-
Xbox Series X25: Edición 25 aniversario
-
OWASP publica reporte de seguridad de IA para prof...
-
Varias vulnerabilidades XSS de VMware permiten iny...
-
VS Code implementa un retraso de 2 horas en la act...
-
ChatGPT prepara su súper app de IA
-
-
▼
junio
(Total:
365
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
AMD rediseñó el Ryzen 7 5800X3D para su regreso a AM4, integrando una segunda generación de 3D V-Cache debido a complicaciones en la fabri...
-
IPTV-org ofrece una lista IPTV con más de 42.000 canales de televisión gratuitos de todo el mundo, incluyendo noticias, deportes, docume...
-
Google ha lanzado DiffusionGemma , un modelo experimental de IA gratuito que genera texto en bloques completos, logrando ser diez veces más...
Claude 3.5 de Anthropic vulnerado para generar exploits de desbordamiento
Anthropic lanzó Claude Fable 5 el 9 de junio de 2026, como el primer modelo disponible públicamente de su nueva clase Mythos, su IA más capaz hasta la fecha, destacando en ingeniería de software, trabajo de conocimiento y pruebas de visión.
El investigador “Pliny the Liberator” derrota los clasificadores de seguridad de Claude Fable 5 utilizando descomposición multiagente, trucos de Unicode y marcos narrativos, filtrando en el proceso el prompt del sistema del modelo de 120.000 caracteres.
El lanzamiento vino acompañado de una decisión de diseño inusual: Fable 5 y su gemelo restringido, Claude Mythos 5, comparten el mismo modelo subyacente pero están divididos por una capa de clasificadores de seguridad.
Cuando una consulta activa un clasificador en categorías de alto riesgo (ciberseguridad, biología, química o destilación de modelos), Fable 5 transfiere silenciosamente la solicitud al modelo más débil, Claude Opus 4.8, notificando al usuario sobre el respaldo.
Anthropic afirmó que un programa externo de recompensas por errores no produjo ningún jailbreak universal tras más de 1.000 horas de pruebas antes del lanzamiento. Esa afirmación fue puesta a prueba casi inmediatamente.
Evasión Multiagente en Pocos Días
A los pocos días del lanzamiento, el prolífico red-teamer de IA Pliny the Liberator anunció públicamente que había evadido las capas de seguridad de Fable 5 utilizando una estrategia de ataque coordinada de múltiples agentes que denominó “una caza en manada”.
Las capturas de pantalla compartidas por Pliny mostraron resultados detallados, incluyendo una guía paso a paso para la explotación de desbordamiento de búfer de pila para sistemas x86 Linux, que incluía la desactivación de ASLR, la escritura de código de servidor en C vulnerable con desbordamientos de strcpy y la compilación sin protecciones; así como el mecanismo de reducción de Birch, una ruta clásica de síntesis de metanfetamina.
— Pliny the Liberator
ALERTA DE JAILBREAK
ANTHROPIC: PWNED
FABLE-5: LIBERADO
comencemos con el…
el consenso parece ser que este ha sido uno de los lanzamientos de modelos más decepcionantes de todos los tiempos, impidiendo efectivamente que investigadores legítimos contribuyan con sus talentos a nuestro… pic.twitter.com/Z0vdPIt4vY󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) 10 de junio de 2026
Pliny documentó los vectores de ataque utilizados para lograr estas evasiones, incluyendo:
- Sustitución de Unicode, homóglifos y caracteres cirílicos para evadir los clasificadores de palabras clave
- Seguimiento de referencias de contexto largo para introducir intenciones dañinas a través de conversaciones extensas
- Enmarcado de taxonomía y estructura de documentos: incrustar consultas dañinas dentro de guías de estudio o referencias académicas con apariencia legítima
- Enmarcado de ficción y narrativa para disfrazar la intención ofensiva como contenido creativo
- Descomposición y recomposición: extraer información técnica sensible en fragmentos benignos y aislados, para luego reensamblarlos en una utilidad accionable
La última técnica resultó ser la más efectiva. Como describió Pliny, “obtener mejoras sobre el proceso en sí, como el método de reducción de Birch o la aminación reductiva, es mucho más viable” que solicitar directamente un compuesto dañino específico. El uso de una instancia de Opus con jailbreak para asistir en el backend redujo aún más la dificultad.
Más allá de las evasiones técnicas, Pliny también filtró en GitHub el prompt del sistema de Fable 5 de aproximadamente 120.000 caracteres, exponiendo el enmarcado interno y las instrucciones de seguridad que Anthropic utiliza para gobernar el comportamiento del modelo a nivel base.
El incidente reaviva la tensión prolongada entre la capacidad de la IA y la contención de la seguridad. La arquitectura de clasificadores de Anthropic, que redirige las solicitudes marcadas a un modelo de respaldo más débil en lugar de rechazarlas rotundamente, fue diseñada para reducir la fricción para los usuarios legítimos.
Sin embargo, Pliny argumentó que este enfoque crea una falsa sensación de seguridad mientras frustra simultáneamente a los investigadores de seguridad legítimos que necesitan acceso a técnicas ofensivas para realizar trabajos defensivos. Anthropic aún no ha respondido públicamente a las afirmaciones del jailbreak ni al prompt del sistema filtrado al momento de escribir este texto.
El episodio también llama la atención sobre el desafío más amplio de asegurar los flujos de trabajo multi-modelo y agenticos: cuando un modelo con jailbreak (Opus) puede asistir a otro (Fable 5) a evadir los controles, las evaluaciones de seguridad de un solo modelo pueden resultar fundamentalmente insuficientes.
Fuentes:
https://cybersecuritynews.com/anthropics-claude-fable-5-jailbroken/


ALERTA DE JAILBREAK 

…
󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius)
Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.