Blog elhacker.NET: Anthropic reactiva Claude Fable 5 tras el levantamiento de controles de exportación por jailbreak en EE. UU

Anthropic reactiva Claude Fable 5 tras el levantamiento de controles de exportación por jailbreak en EE. UU

miércoles, 1 de julio de 2026 | Publicado por el-brujo | Editar entrada

Anthropic restableció el acceso global a Claude Fable 5 luego de que el gobierno de EE. UU. levantara controles de exportación impuestos por un fallo de seguridad. Para solucionar el problema, la empresa implementó un nuevo filtro de seguridad y acordó coordinar futuros lanzamientos con las autoridades. El incidente resalta la tensión entre la innovación de la IA y el riesgo de que estas herramientas sean usadas para ciberataques.

Anthropic está reactivando Claude Fable 5 en todo el mundo. El 30 de junio enlace, el Departamento de Comercio de los EE. UU. levantó los controles de exportación que había impuesto a Fable y a su hermano más controlado, Mythos 5, hace unas dos semanas y media.

Fable 5 vuelve a los usuarios el miércoles 1 de julio en Claude.ai, la Plataforma Claude, Claude Code y Claude Cowork.

Los controles de exportación restringen quién puede recibir o utilizar una tecnología. La orden del 12 de junio indicó a Anthropic que cortara ambos modelos para cualquier ciudadano extranjero, dentro o fuera de los Estados Unidos, incluido su propio personal no ciudadano.

La norma entró en vigor de inmediato y la empresa no tenía una forma fiable de comprobar la nacionalidad de cada usuario en tiempo real, por lo que cerró ambos modelos para todo el mundo.

El detonante fue un jailbreak: un prompt que consigue que un modelo ignore sus reglas de seguridad. Investigadores de Amazon encontraron uno en Fable 5. Según Anthropic, el prompt logró que el modelo señalara algunos fallos de software y, en un caso, que escribiera código mostrando cómo podría abusarse de un fallo.

Anthropic minimizó el hallazgo. Afirma que las mismas solicitudes funcionan en muchos modelos más débiles, incluidos su propio Claude Opus 4.8, el GPT-5.5 de OpenAI y el Kimi K2.7 de China. La empresa califica el comportamiento detectado como un trabajo de seguridad defensiva rutinario, no como una supercapacidad oculta.

El gobierno y el socio que informó del jailbreak lo consideraron lo suficientemente grave como para justificar controles de emergencia.

Para solucionar la preocupación, Anthropic entrenó un nuevo filtro de seguridad, llamado clasificador, que vigila la técnica exacta del informe y la bloquea. La empresa afirma que ahora detiene esa técnica en más del 99% de los intentos, según la redacción del 30 de junio. Las solicitudes bloqueadas se derivan al Opus 4.8, que es más débil, y se le informa al usuario. La desventaja es que hay más falsas alarmas en la codificación y depuración normales.

Mythos 5, el mismo modelo base pero con menos barreras de seguridad, permanece bajo una vigilancia más estrecha. El acceso regresó el 26 de junio para aproximadamente 100 empresas y agencias federales de EE. UU. que defienden infraestructuras críticas. Anthropic dice que sigue trabajando con el gobierno para ampliar el acceso.

El Secretario de Comercio, Howard Lutnick, quien aprobó la reversión, dijo que su departamento había pasado dos semanas revisando los modelos con Anthropic. En su carta, la empresa acordó buscar problemas de seguridad por su cuenta, coordinar futuros lanzamientos e informar de cualquier uso malicioso que detecte.

Según se informa, las negociaciones fueron dirigidas por el cofundador Tom Brown en lugar del CEO Dario Amodei, quien ha chocado con la administración durante gran parte del año.

La pelea fue caótica desde el principio. Varios informes, incluido el del Wall Street Journal, dijeron que la investigación de Amazon y las preocupaciones del CEO Andy Jassy ayudaron a impulsar la orden original. El antiguo zar de la IA David Sacks enlace acusó a Anthropic de haber "priorizado la oferta continua del modelo de consumo sobre la seguridad". Otros lo interpretaron como una sobrecorrección.

Francesco Bailo, investigador de gobernanza de IA de la Universidad de Sydney, dijo a Al Jazeera que la reversión parecía una concesión del gobierno admitiendo que había ido demasiado lejos, y un grupo de líderes de seguridad había firmado una carta abierta pidiendo que se levantaran los controles.

Sobre todo esto planeaba la competencia. La pausa llegó justo cuando los modelos chinos de código abierto, baratos y capaces, estaban ganando terreno, y varios ejecutivos advirtieron que congelar los modelos estadounidenses daba tiempo libre a los rivales para ponerse al día.

Anthropic también propone algo de lo que la industria carecía: una forma compartida de clasificar qué tan peligroso es realmente un jailbreak. Con Amazon, Microsoft, Google y otros socios, quiere puntuar cada uno en cuatro aspectos:

* Ganancia de capacidad: cuánto más lejos lleva el jailbreak al usuario más allá de las herramientas que ya posee.
* Amplitud: cuántos ataques diferentes desbloquea el mismo truco.
* Facilidad de armamentización: cuánta habilidad y esfuerzo se requiere para convertirlo en un ataque real.
* Descubribilidad: qué tan fácil es encontrar o copiar el truco.

Para los peores casos, como un jailbreak que permita ataques a redes eléctricas o bancos, Anthropic dice que empezará a desplegar correcciones en el momento en que se confirme la gravedad, y está creando un equipo para vigilar los informes de jailbreak las 24 horas del día.

También abrió un programa de HackerOne enlace para que los investigadores informen de nuevos jailbreaks de Fable 5, y prometió al gobierno de EE. UU. acceso anticipado para probar futuros modelos frontera antes de su lanzamiento.

Anthropic no es el único laboratorio en esta posición. Días antes, OpenAI presentó GPT-5.6 a un grupo pequeño aprobado por el gobierno en lugar de al público, citando la misma preocupación de doble uso: un modelo lo suficientemente bueno para ayudar a los defensores a parchear errores también es lo suficientemente bueno para ayudar a los atacantes a encontrarlos.

El riesgo no es hipotético. A principios de esta primavera, Anthropic probó un modelo Mythos anterior que encontró y explotó errores de día cero en todos los sistemas operativos y navegadores principales bajo mandato, incluido un fallo de 27 años en OpenBSD. Su "equipo rojo" convirtió errores recién revelados en exploits funcionales en menos de un día.

La crisis inmediata ha terminado. La pregunta más grande no. Una orden ejecutiva del 2 de junio enlace creó una vía voluntaria para que las empresas sometan los modelos frontera a revisión antes de su lanzamiento. También estableció un punto de referencia clasificado para decidir qué modelos se consideran "cubiertos", descartando cualquier licencia obligatoria para lanzar uno. Fable 5 nunca pasó por esa vía.

El gobierno recurrió en su lugar a los controles de exportación. Esa es la señal: cuando Washington quiere actuar rápido con un modelo frontera, todavía no tiene un proceso vinculante, solo procesos improvisados.

Fuente:
THN

Etiquetas: anthropic , claude , gobierno , inteligencia artificial , jailbreak , seguridad

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Etiquetas

Entradas populares

Anthropic reactiva Claude Fable 5 tras el levantamiento de controles de exportación por jailbreak en EE. UU

0 comentarios :

Publicar un comentario