Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
5380
)
-
▼
junio
(Total:
898
)
-
EE. UU. ofrece hasta 10M$ por información que ayud...
-
Nuevo ataque de Claude Code permite control total ...
-
Base de datos de vulnerabilidades de GitHub alcanz...
-
Explotan vulnerabilidad crítica de Oracle E-Busine...
-
Vulnerabilidades de Synology MailPlus Server permi...
-
Microsoft advierte que las descripciones manipulad...
-
Gemini supera a ChatGPT con imágenes gratis para t...
-
Claude Science acelera el descubrimiento científico
-
IA de Google crea imágenes en 4 segundos
-
Kodi 22 Piers llega a beta
-
Meta pierde juicio por impacto de redes en menores
-
Vulnerabilidad crítica en Gemini CLI permite ejecu...
-
Vulnerabilidades de WolfSSL exponen miles de millo...
-
Vulnerabilidad RCE de Microsoft 365 explotada con ...
-
Publicado PoC de fallo en NTLM que permite acceso ...
-
Vulnerabilidades críticas de Dell Wyse permiten ej...
-
Roban sesiones de WhatsApp Web para estafas a dire...
-
Publicado PoC de vulnerabilidad RCE en Splunk Secu...
-
Vulnerabilidad crítica en Kemp LoadMaster permite ...
-
Extensión maliciosa de Perplexity para Chrome inte...
-
Kali Linux 2026.2: GNOME 50 y Plasma 6.6
-
Bing Search de ‘ManageEngine OpManager’ distribuye...
-
Vulnerabilidad de Oracle E-Business Suite CVE-2026...
-
ISPs exigen cuentas a Tebas por bloqueos IPTV
-
Microsoft crea un filtro de seguridad para evitar ...
-
Desarrolladores de Mozilla logran instalar malware...
-
Elon time: el retraso de Musk hacia Marte
-
Mod hace que el Steam Controller vuelva solo a su ...
-
Akrites: nuevo frente contra ataques de IA al códi...
-
Gemini permite buscar una app que haga algo especí...
-
Organic Maps: La alternativa a Google Maps que res...
-
Microsoft elimina 119 extensiones de Edge que ocul...
-
Chrome se integra mejor con Wallet para autocomple...
-
Cae masivamente la piratería de fútbol online
-
EE. UU. incauta cientos de dominios de streaming i...
-
OpenAI lanza GPT 5.6 y promete mayor seguridad
-
Turla, vinculado a Rusia, usa infraestructura comp...
-
Los drivers AMD Adrenalin en Windows 10 siguen pre...
-
La UE encarece compras en AliExpress, Shein y Temu
-
ClawHub Skills expone agentes de IA a puertas tras...
-
Dron sigue a F1 a 300 km/h
-
The New York Times demanda a Microsoft y OpenAI po...
-
Mageia 10: distro Linux sucesora de Mandriva
-
Demandan a Samsung, SK Hynix y Micron por los prec...
-
WhatsApp implementará nombres de usuario para prot...
-
Netflix endurece el control de cuentas compartidas
-
Senador acusa a Tim Cook de priorizar beneficios s...
-
IA china Zhipu igualaría a Claude Mythos en detecc...
-
CachyOS lanza Hyprland Noctalia y Shelly para AUR
-
Nissan advierte que un hackeo a Oracle PeopleSoft ...
-
Hacienda de España usará IA israelí para potenciar...
-
Agentes míticos generados por LLM permiten herrami...
-
Usan RemotePC y PowerShell para desplegar el ranso...
-
EEUU condiciona el lanzamiento de GPT-5.6 Sol
-
PowerPoint busca presentaciones perfectas
-
CNMC podría encarecer el despliegue de fibra de op...
-
OpenAI lanzó GPT-5.6 Sol con acceso limitado y pro...
-
Crea un Windows portátil con Windows To Go
-
Paquetes de Go y npm comprometidos utilizan tareas...
-
RedAmon: IA que encadena reconocimiento, explotaci...
-
Consiguen hacer funcionar Windows 11 en un PC de l...
-
Casi cien drones caen en un show aéreo en Australia
-
El nuevo malware SharkLoader despliega Cobalt Stri...
-
Windows 11: nueva recuperación de pago
-
El FBI advierte que rusos buscan las claves de rec...
-
Nuevo ataque de secuestro de buckets redirige dato...
-
Ucrania denuncia que el servicio de inteligencia r...
-
Xbox Series S iguala precio de PS5
-
IP Crawl, la colección de webcams abiertas que no ...
-
Chrome cifrará tus pestañas abiertas
-
Una guía para elegir el mejor DNS público; práctic...
-
Trump bloquea el acceso a GPT-5.6
-
Amazon: IA de Mythos afecta a Fable 5 en AWS
-
OpenAI presenta GPT-5.6 Sol con acceso restringido...
-
Se prevé otro gran aumento de precio de la memoria...
-
Eustella: el chatbot europeo frente a ChatGPT
-
Las placas Z990 tendrán 3 conectores de 8 pines pa...
-
75 juegos PC: pocos requisitos y buenos gráficos
-
Nobel de Medicina arremete contra Elon Musk y su p...
-
La IA aumenta la desigualdad laboral
-
Medios demandan a Microsoft y OpenAI por IA
-
Ford falla con IA y recontrata ingenieros
-
Fallo en Amazon Q permitía ejecutar código y robar...
-
Stremio 5 ya disponible para Linux
-
STIM Machine, así es el PC que imita la forma de l...
-
Nuevo exploit de Linux permite acceso root al sistema
-
Vulnerabilidad crítica en python.org permitía fals...
-
Hackeo en Leroy Merlin: miles de clientes expuestos
-
Activa la VPN de Firefox
-
LastPass sufre nueva filtración de datos
-
FortiBleed: el ataque a firewalls FortiGate que ro...
-
Mythos detecta Squidbleed, una fuga de memoria que...
-
Anthropic lanza Claude Tag: el compañero de IA lle...
-
Habilidad fraudulenta de agentes de IA supera esca...
-
GitHub actualiza actions/checkout para bloquear pa...
-
Casi la mitad de las apps de LG y Samsung venden t...
-
CISA advierte de vulnerabilidad explotada en Ubiqu...
-
Usan Velociraptor, Cloudflare, Zoho y VS Code para...
-
Nueva navaja suiza para hackers en GitHub
-
Operadora japonesa expone 14,2 millones de credenc...
-
SteamOS llegará a todos los PC
-
Las RTX 50 de análisis se empiezan a quemar: Club3...
-
El Departamento de Justicia incauta cuenta de Huio...
-
Claude Fable 5 escribió código del kernel de Windo...
-
Wikipedia expulsa permanentemente a su cofundador ...
-
Kit de phishing AWS AiTM roba credenciales y MFA e...
-
Shai-Hulud roba credenciales de desarrolladores
-
Caducó certificado de Secure Boot de Windows: mile...
-
Algoritmo suizo que quitará el carné por no respet...
-
Backdoor Mistic se autodestruye y se vincula a un ...
-
Polonia desmantela banda de SIM-swapping responsab...
-
CISA advierte sobre vulnerabilidad de Cisco Unifie...
-
Los navegadores más raros probados
-
Iberia estrena su acceso gratuito a Internet vía S...
-
El CEO de Epic Games dice que las herramientas de ...
-
Google detalla STOCKSTAY, la nueva puerta trasera ...
-
10 webs de eBooks gratis y legales
-
Fallo de seguridad en Apache Tomcat Tribes
-
Firma china de ciberseguridad asegura haber creado...
-
Nuevo exploit de COW en Linux permite acceso root ...
-
Qualcomm Dragonfly C1000: así es la CPU con más de...
-
OpenAI retrasaría ChatGPT 5.6 por pedido de Trump
-
Windows 10 tendrá soporte hasta 2027
-
Extensión maliciosa de Edge ejecuta código en sist...
-
Marketplace OpenClaw expone agentes de IA a malwar...
-
Vulnerabilidades en IA de Red-Team permiten robo d...
-
Usan Cisco y Google para propagar malware SharkLoader
-
Campaña de LokiBot roba credenciales con JScript, ...
-
-
▼
junio
(Total:
898
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
seguridad
(
1465
)
vulnerabilidad
(
1369
)
hardware
(
790
)
software
(
754
)
Malware
(
707
)
google
(
702
)
privacidad
(
614
)
Windows
(
521
)
ransomware
(
494
)
android
(
438
)
cve
(
365
)
linux
(
349
)
exploit
(
326
)
tutorial
(
299
)
manual
(
281
)
nvidia
(
275
)
hacking
(
230
)
WhatsApp
(
173
)
ssd
(
165
)
Wifi
(
131
)
ddos
(
128
)
app
(
123
)
twitter
(
121
)
cifrado
(
119
)
programación
(
103
)
herramientas
(
80
)
youtube
(
79
)
Networking
(
73
)
firefox
(
72
)
sysadmin
(
71
)
firmware
(
65
)
office
(
62
)
adobe
(
60
)
Kernel
(
49
)
hack
(
48
)
antivirus
(
47
)
javascript
(
45
)
apache
(
44
)
juegos
(
42
)
contraseñas
(
39
)
multimedia
(
35
)
cms
(
34
)
eventos
(
32
)
flash
(
32
)
MAC
(
30
)
anonymous
(
28
)
ssl
(
24
)
Forense
(
20
)
conferencia
(
20
)
SeguridadWireless
(
17
)
documental
(
17
)
Debugger
(
14
)
Rootkit
(
14
)
lizard squad
(
14
)
auditoría
(
13
)
metasploit
(
13
)
técnicas hacking
(
13
)
Virtualización
(
11
)
delitos
(
11
)
reversing
(
10
)
adamo
(
9
)
Ehn-Dev
(
7
)
MAC Adress
(
6
)
antimalware
(
6
)
oclHashcat
(
5
)
Entradas populares
-
Se ha detectado una nueva técnica de ransomware capaz de ejecutarse completamente dentro de un navegador web , sin necesidad de instalar apl...
-
Diez sitios web permiten conseguir eBooks gratuitos de forma legal como complemento ideal para los lectores de libros electrónicos.
-
Un actor de amenazas ha implementado una técnica alarmante para cegar a los equipos de seguridad antes de robar contraseñas. El atacante lo...
Anthropic lanza Claude Fable 5, su IA más potente hasta la fecha y con protecciones contra ciberataques
miércoles, 10 de junio de 2026
|
Publicado por
el-brujo
|
Editar entrada
Anthropic lanzó Claude Fable 5, su modelo más capaz, junto a una versión sin restricciones llamada Mythos 5, reservada para expertos en ciberseguridad. Fable 5 utiliza clasificadores de seguridad que redirigen solicitudes peligrosas a un modelo más débil para evitar ataques informáticos. Mythos 5 es extremadamente potente, capaz de hallar vulnerabilidades críticas, lo que obliga a los defensores a acelerar la aplicación de parches.
El 9 de junio, Anthropic lanzó Claude Fable 5 [https://www.anthropic.com/news/claude-fable-5-mythos-5], el modelo más capaz que jamás haya creado, ya disponible de forma general. También hizo algo inusual: lanzó un solo modelo como dos productos, divididos no por capacidad, sino por una capa de clasificadores de seguridad.
Fable 5 llega al público. Su gemelo, Claude Mythos 5, el mismo modelo subyacente pero con las salvaguardas cibernéticas eliminadas, permanece bloqueado para un grupo verificado de defensores cibernéticos y operadores de infraestructuras críticas.
Anthropic llama a Mythos 5 el modelo de ciberseguridad más fuerte del mundo.
La diferencia práctica es esta: Fable 5 redirige las solicitudes marcadas de ciberseguridad, biología, química y destilación al modelo más débil, Claude Opus 4.8, mientras que Mythos 5 mantiene las capacidades cibernéticas disponibles para los usuarios verificados. Ambos modelos cuestan 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida, menos de la mitad del precio del anterior Mythos Preview, y Fable 5 ya está disponible a través de la API de Claude.
Está incluido en los planes Pro, Max, Team y Enterprise basados en asientos sin coste adicional hasta el 22 de junio; después, pasará a créditos de uso.
Cómo funcionan los clasificadores cibernéticos de fable 5
La división existe porque los modelos de clase Mythos encuentran y explotan vulnerabilidades de software tan bien que, según el planteamiento de Anthropic, entregar esa capacidad al público general sin controles daría a los atacantes una ventaja seria.
El mecanismo es un conjunto de clasificadores [https://www.anthropic.com/news/claude-fable-5-mythos-5]: sistemas de IA independientes que vigilan el mal uso y los intentos de jailbreak. Cuando una solicitud activa uno, Fable 5 no la rechaza. La respuesta se entrega a Opus 4.8 y se le informa al usuario que se ha producido el traspaso. De las categorías marcadas, la destilación es la excepción: consiste en extraer las capacidades de un modelo para entrenar un modelo competidor, algo que Anthropic bloquea para evitar que las capacidades de vanguardia se filtren sin salvaguardas adjuntas.
El clasificador de ciberseguridad es el más amplio. Anthropic lo diseñó para bloquear no solo el desarrollo de exploits, sino tareas cibernéticas ofensivas en general: reconocimiento, descubrimiento, movimiento lateral y los pasos agentivos que componen un ataque real.
En una evaluación interna realizada con Fable 5 configurado para bloquear en lugar de retroceder, y que no intentó evadir las salvaguardas, los clasificadores impidieron que el modelo avanzara en esas tareas. Un socio externo descubrió que Fable 5 cumplió con cero solicitudes dañinas de un solo turno sobre planificación de ciberataques, desarrollo de exploits o evasión de defensas, resistiendo 30 técnicas públicas diferentes de jailbreak.
La desventaja son los falsos positivos. Anthropic ajustó las salvaguardas de forma conservadora para lanzar rápido, por lo que a veces detectan solicitudes inofensivas. La empresa afirma que el retroceso ocurre en menos del 5% de todas las sesiones, por lo que, para más del 95%, Fable 5 se comporta como el Mythos 5 sin restricciones cibernéticas. Esta cifra cubre todos los retrocesos, incluidos los bloqueos genuinos, por lo que limita la interrupción total en lugar de medir la tasa de falsos positivos por sí sola. Anthropic afirma que estrechará las salvaguardas y reducirá los falsos positivos después del lanzamiento.
Sobre la robustez, los números son específicos. Un programa externo de bug bounty superó las 1.000 horas y no produjo ningún jailbreak universal, prompt o arnés que eliminara las salvaguardas por completo. Los red teams externos tampoco encontraron ninguno en tareas agentivas de formato largo, con una salvedad que Anthropic declara claramente: el Instituto de Seguridad de la IA del Reino Unido progresó hacia un jailbreak universal dentro de una breve ventana de prueba inicial. Anthropic admite que probablemente sea imposible prevenir totalmente los jailbreaks universales, y su objetivo declarado es lograr que cualquier jailbreak restante sea lo suficientemente lento y costoso como para detectarlo antes de que se use a escala.
Por qué la capacidad es una amenaza
El argumento para tratar este modelo con cuidado se expuso en abril, cuando Anthropic lanzó Claude Mythos Preview a un grupo limitado a través de Project Glasswing [https://www.anthropic.com/glasswing]. El informe técnico [https://red.anthropic.com/2026/mythos-preview/] del red team de Anthropic es la parte que vale la pena leer.
Durante las pruebas, Mythos Preview identificó y explotó vulnerabilidades de día cero en cada sistema operativo importante y en cada navegador web principal cuando un usuario se lo indicaba. El error más antiguo que encontró fue un fallo de 27 años en OpenBSD, un sistema operativo conocido principalmente por su seguridad. Escribió de forma autónoma un exploit de ejecución remota de código contra el servidor NFS de FreeBSD a partir de un error de 17 años, triagiado como CVE-2026-4747 [https://nvd.nist.gov/vuln/detail/CVE-2026-4747].
Anthropic describe el resultado como un acceso root completo para un atacante no autenticado desde cualquier lugar de internet; la entrada de NVD es más moderada, señalando que el desbordamiento de pila en sí no requiere que el cliente se autentique, pero plantea que la ejecución de código del kernel es alcanzable por un atacante capaz de enviar paquetes al servidor NFS mientras el módulo kgssapi.ko está cargado.
Según el propio relato de Anthropic, no entrenó explícitamente estas capacidades; estas surgieron como un efecto secundario de mejoras generales en código, razonamiento y autonomía, las mismas ganancias que hacen que el modelo sea mejor parcheando. La advertencia tajante del red team: las mitigaciones cuyo valor de seguridad proviene de la fricción en lugar de barreras duras se vuelven mucho más débiles frente a un modelo que procesa pasos de explotación tediosos a escala.
Las barreras técnicas duras como KASLR y W^X siguen elevando el coste; la advertencia es más estrecha, dirigida a defensas que confían en la paciencia del atacante o el esfuerzo manual, y ahora el modelo puede suministrarse a sí mismo.
Mythos 5 lleva esas habilidades adelante. Anthropic afirma que descubrirás que es comparable o algo más fuerte que Mythos Preview.
El problema real del defensor
El caso defensivo no es hipotético. En las primeras semanas del Project Glasswing, Anthropic y aproximadamente 50 socios utilizaron Mythos Preview para encontrar más de diez mil vulnerabilidades de severidad alta o crítica en software sistémicamente importante.
Cloudflare encontró por sí solo 2.000 errores, 400 de ellos de severidad alta o crítica. Mozilla encontró y corrigió 271 en Firefox 150, más de diez veces lo que detectó en Firefox 148 utilizando el antiguo Opus 4.6. Anthropic afirma que la misma presión es visible más allá de Glasswing, en proveedores que lanzan versiones de seguridad inusualmente grandes.
Esa inundación es la trampa. Encontrar errores ahora es barato y rápido. Verificarlo, triagarlo y parchearlo no lo es, y sigue dependiendo del tiempo humano.
Anthropic informa que los mantenedores de código abierto, ya enterrados bajo informes de errores generados por IA de baja calidad, le han pedido que ralentice sus divulgaciones porque no pueden escribir parches lo suficientemente rápido. En Glasswing, afirma que un error de severidad alta o crítica encontrado por el modelo tarda unas dos semanas en parchearse de promedio.
El cuello de botella se ha desplazado del descubrimiento a la corrección, y el espacio entre una divulgación pública y un parche desplegado es donde viven los atacantes. Los experimentos de N-day del red team agudizan el punto: partiendo de nada más que un CVE divulgado y su parche, Mythos Preview construyó exploits de escalada de privilegios en Linux funcionales en menos de un día cada uno, con unos pocos miles de dólares o menos en computación.
Para los defensores, la lectura es la misma de siempre, solo que con un reloj más corto: asume que un CVE de alta severidad puede convertirse en un exploit funcional a las pocas horas de su divulgación, no en semanas. Eso significa priorizar las rutas de actualización automática para los sistemas orientados a internet y tratar las actualizaciones de dependencias que llevan correcciones de CVE como trabajo urgente en lugar de tareas pendientes.
El MFA y el registro exhaustivo siguen siendo la base, para que un solo parche omitido no se convierta en lo único que se interpone entre un atacante y la red. Anthropic ha abierto un Programa de Verificación Cibernética [https://support.claude.com/en/articles/14604842-real-time-cyber-safeguards-on-claude] que permite a los profesionales de seguridad verificados utilizar sus modelos para trabajos ofensivos legítimos sin las salvaguardas cibernéticas.
Un nuevo requisito de retención de datos de 30 días
Anthropic también está cambiando la forma en que maneja los datos para los modelos de clase Mythos.
Requerirá una retención de 30 días para todo el tráfico en Fable 5, Mythos 5 y futuros modelos con este nivel de capacidad, tanto en superficies propias como de terceros. La empresa afirma que no utilizará los datos para entrenamiento ni para ningún propósito que no sea de seguridad, registrará todo el acceso humano y los eliminará después de 30 días, excepto cuando una investigación de seguridad u obligación legal requiera conservarlos más tiempo.
La razón declarada es defensiva: los datos ayudan a detectar ataques novedosos y jailbreaks que operan a través de muchas solicitudes. Los equipos con requisitos estrictos de manejo de datos deberán tener en cuenta esa ventana de retención antes de enrutar tráfico sensible a través de estos modelos.
Anthropic planea ampliar el acceso a Mythos 5 a través de un programa de acceso confiable, y afirma que una vez que la capacidad de cómputo se iguale, pretende reintegrar Fable 5 en los planes de suscripción sin la prima de crédito de uso que entrará en vigor después del 22 de junio.
La pregunta más amplia que plantea el lanzamiento es la que Anthropic ha estado rodeando desde abril: llegarán modelos similarmente capaces de otros laboratorios, y no todos se enviarán con un muro de clasificadores delante. La ventaja defensiva que Glasswing pretendía comprar solo importará si el resto de la industria la utiliza.
Fuente:
THN
Enviar por correo electrónico
Escribe un blog
Compartir en X
Compartir con Facebook
Compartir en Pinterest




Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.