Productos FTTH

Tienda FFTH desde 2004

Entradas Mensuales

Síguenos en:

Canal Oficial Telegram de elhacker.NET Grupo Facebook elhacker.NET Twitter elhacker.NET Canal Youtube elhacker.NET Comunidad Steam: Grupo elhacker.NET Mastodon

Entradas populares

PostHeaderIcon Anthropic lanza Claude Fable 5, el primer modelo de clase Mythos


Anthropic ha lanzado Claude Fable 5, el primer modelo disponible públicamente de su nueva categoría de capacidades Mythos. Según la compañía, este nivel de potencia es tan elevado que el modelo incluye salvaguardas de ciberseguridad integradas desde su lanzamiento. Fable 5 se posiciona por encima de la línea Claude Opus y ha logrado resultados vanguardistas en la mayoría de las pruebas de rendimiento.






Anthropic ha lanzado Claude Fable 5, el primer modelo disponible públicamente en su nuevo nivel de capacidad Mythos, una clase tan potente que la empresa afirma que se entrega con salvaguardas de ciberseguridad integradas desde el primer día.

Fable 5 se sitúa por encima de la línea Claude Opus y presenta resultados vanguardistas en la mayoría de los bancos de pruebas de capacidad, con sus mayores ventajas en tareas largas, complejas y de múltiples pasos.

Los modelos de clase Mythos son fuertes en el descubrimiento y explotación de vulnerabilidades de software, y en el "hackeo agéntico", encadenando reconocimiento, descubrimiento, movimiento lateral y desarrollo de exploits a lo largo de todo el ciclo de vida de un ataque. Esa misma capacidad tiene un uso dual, razón por la cual el lanzamiento se centra en la contención.

En lugar de rechazar directamente las solicitudes riesgosas, Fable 5 las redirige a un modelo menos capaz. Una capa separada de clasificadores detecta solicitudes relacionadas con ciberseguridad, biología y química, o destilación de modelos, y entrega esas sesiones a Claude Opus 4.8 en lugar de dejar que Fable responda. Se te notificará cuando ocurra este respaldo.


 

Anthropic Claude Fable 5

Anthropic ajustó los clasificadores de forma conservadora, reconociendo que marcarán algunas solicitudes benignas, pero afirma que los disparadores de respaldo se activan en menos del 5% de las sesiones, lo que significa que más del 95% de las sesiones funcionan con la capacidad total de Fable.

En el lado cibernético, las evaluaciones internas muestran que los clasificadores impiden que Fable logre avances significativos en tareas ofensivas. Anthropic realizó un programa externo de recompensas por errores que no reveló jailbreaks universales tras más de 1.000 horas de pruebas, y organizaciones externas de red-teaming informaron que no hubo jailbreaks universales en tareas agénticas de formato largo.

La empresa señala una advertencia: el Instituto de Seguridad de IA del Reino Unido logró avances tempranos hacia un jailbreak en una ventana de prueba corta. Según se informa, un socio externo encontró que las defensas de Fable eran las más robustas de cualquier modelo probado, con cero cumplimiento en solicitudes dañinas de un solo turno que involucraban planificación de ataques, desarrollo de exploits o evasión de defensas, incluso cuando se combinaron con 30 técnicas públicas de jailbreak.


 

Mythos 5 para Defensores

Junto con Fable, Anthropic ofrece Claude Mythos 5 —el mismo modelo subyacente pero con las salvaguardas cibernéticas eliminadas— a un grupo restringido de defensores cibernéticos y proveedores de infraestructura.

Se despliega inicialmente a través del Proyecto Glasswing, en colaboración con el gobierno de los EE. UU., y se describe como el modelo con las capacidades de ciberseguridad más fuertes del mundo. Se espera que el acceso se amplíe mediante un programa de acceso confiable.

Ambos modelos cuestan 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida. Una nueva política requiere la retención de datos durante 30 días en todo el tráfico de clase Mythos, utilizado únicamente para fines de seguridad para detectar nuevos jailbreaks, ataques de solicitudes múltiples y falsos positivos, y nunca para entrenamiento.

Puedes llamar a claude-fable-5 a través de la API de Claude hoy mismo.




Fuentes:
https://cybersecuritynews.com/anthropic-claude-fable-5/

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.