13 de junio de 2026

Claude Fable et l'interface holographique

El gobierno de EE. UU. ordena a Anthropic suspender el acceso a Fable 5 y Mythos 5

Anthropic, la empresa de seguridad en IA detrás de la familia de modelos Claude, recibió una orden del gobierno de Estados Unidos, por motivos de seguridad nacional, para suspender de inmediato todo el acceso a sus modelos Fable 5 y Mythos 5 para cualquier extranjero, ya sea que se encuentre dentro o fuera de Estados Unidos. La directiva, recibida el 14 de julio de 2025 a las 17:21 (hora del Este), obligó a Anthropic a desactivar estos dos modelos para toda su base de clientes global con el fin de garantizar el cumplimiento total, mientras que el acceso a todos los demás modelos Claude quedó sin afectar.

¿Qué ocurrió? Una directiva gubernamental con poca explicación

Anthropic reveló la situación públicamente a través de un comunicado oficial en su sitio web y en sus canales oficiales de redes sociales. Según la empresa, la directiva llegó sin una justificación específica de seguridad nacional incluida en la carta. El gobierno comunicó verbalmente su creencia de que se había identificado un método para eludir, o «jailbreak», Fable 5, lo que generó preocupaciones sobre un posible uso indebido de las capacidades del modelo.

La directiva se emitió invocando las autoridades de control de exportaciones por motivos de seguridad nacional, un marco legal que generalmente se utiliza para restringir la transferencia de tecnologías sensibles a entidades extranjeras. Al aplicarlo al acceso a modelos de IA, el gobierno efectivamente trató Fable 5 y Mythos 5 como tecnologías controladas, obligando a Anthropic a prohibir que cualquier ciudadano extranjero los utilizara, incluidos sus propios empleados con ciudadanía extranjera.

La respuesta de Anthropic: desacuerdo y transparencia

Aunque confirmó el cumplimiento de la orden, Anthropic cuestionó públicamente los motivos detrás de ella. La empresa declaró que revisó la técnica específica de jailbreak mencionada por el gobierno y la consideró limitada en alcance e impacto. Según el comunicado de Anthropic, la técnica demostrada solo reveló un pequeño número de vulnerabilidades menores ya conocidas, todas descritas como relativamente simples y detectables utilizando otros modelos de IA públicos, sin necesidad de eludir Fable 5.

Anthropic también destacó que no ha recibido ninguna divulgación de un jailbreak que haya producido un resultado dañino. La empresa caracterizó los posibles jailbreaks compartidos con ella como generadores de respuestas completamente inofensivas o como hallazgos menores que no ofrecen ninguna ventaja específica única para Mythos 5.

La arquitectura de seguridad detrás de Fable 5

Pruebas exhaustivas de red-teaming antes del lanzamiento

En su comunicado público, Anthropic detalló el importante trabajo de seguridad realizado antes del lanzamiento de Fable 5. En las semanas previas a su lanzamiento, la empresa colaboró con el gobierno de EE. UU., el Instituto de Seguridad de la IA del Reino Unido (AISI), varias organizaciones privadas de terceros y equipos internos para realizar miles de horas de ejercicios de red-teaming enfocados en probar las salvaguardas de Fable. Estas pruebas concluyeron que las protecciones de Fable 5 eran sustancialmente más efectivas que las de cualquier modelo previamente implementado en la industria.

Ningún jailbreak universal encontrado

Un punto clave en la defensa de Anthropic es que ningún evaluador, durante o después del período de evaluación previo al lanzamiento, ha logrado encontrar un jailbreak universal, definido como un método capaz de eludir ampliamente las salvaguardas del modelo para desbloquear una amplia gama de capacidades potencialmente dañinas. La empresa reconoció que los jailbreaks no universales, que pueden extraer información específica bajo circunstancias particulares, son una realidad conocida e inevitable en toda la industria de la IA.

Una estrategia de defensa en profundidad

En lugar de afirmar una resistencia perfecta a los jailbreaks, Anthropic adoptó lo que describe como un enfoque de defensa en profundidad con Fable 5. Esta estrategia está diseñada para garantizar que cualquier jailbreak exitoso siga siendo limitado en alcance o extremadamente costoso de ejecutar. Está acompañada por sistemas de monitoreo continuo destinados a detectar y detener ataques rápidamente después de que ocurran.

Como parte de esta estrategia, Anthropic introdujo una política de retención de datos de clientes de 30 días específicamente para Fable, una decisión que la empresa reconoció que tiene costos comerciales. Esta política se implementó para permitir una investigación continua sobre los intentos de jailbreak y facilitar una mitigación más rápida de cualquier explotación exitosa.

Impacto inmediato en usuarios y desarrolladores

Para los usuarios de los productos de consumo y las herramientas para desarrolladores de Anthropic, la suspensión significa que las nuevas sesiones que antes se ejecutaban en Fable 5 se redirigirán automáticamente a un modelo predeterminado seleccionado por el usuario o a Opus 4.8. Anthropic confirmó, a través de su canal ClaudeDevs para desarrolladores, que todos los demás modelos Claude siguen completamente disponibles.

Esta interrupción es particularmente notable, ya que Fable 5 parecía haber sido posicionado como una de las ofertas estrella de Anthropic. Los usuarios habían señalado aparentemente que sus filtros de seguridad, en algunos casos, se consideraban demasiado amplios, lo que reflejaba los ajustes de protección agresivos que Anthropic había implementado para reducir el riesgo de uso indebido en tareas relacionadas con la ciberseguridad.

Implicaciones más amplias para la gobernanza de la IA y el control de exportaciones

Una medida que sienta precedente

La directiva del gobierno de EE. UU. representa un momento importante en la evolución de la relación entre las autoridades federales y los desarrolladores de IA. Aplicar mecanismos de control de exportaciones al acceso a un modelo de IA específico, en lugar de al hardware o a los pesos subyacentes, es un uso relativamente nuevo de la ley de seguridad nacional. Esto plantea preguntas inmediatas sobre cómo las autoridades definirán y regularán las capacidades avanzadas de IA en el futuro.

Incertidumbre sobre las pruebas

El comunicado de Anthropic señaló que, hasta el momento de la publicación, el gobierno solo había proporcionado pruebas verbales de la técnica de jailbreak preocupante. La falta de una divulgación formal por escrito ha colocado a la empresa en la posición de cumplir con una directiva que considera no justificada por las pruebas disponibles, al tiempo que le impide resolver la disputa subyacente mediante una revisión técnica directa de los hallazgos completos del gobierno.

La empresa ha expresado su disposición a seguir colaborando con las autoridades e indicó que continuará abogando por un proceso transparente y basado en pruebas. Este caso probablemente atraerá la atención de otros desarrolladores de IA, formuladores de políticas y defensores de las libertades civiles, a medida que crecen las preguntas sobre el alcance de la autoridad gubernamental sobre los sistemas de IA comercializados.

El acceso a Fable 5 y Mythos 5 ha sido suspendido a nivel mundial para todos los ciudadanos extranjeros, incluidos los empleados de Anthropic. Todos los demás modelos Claude, incluido Opus 4.8, siguen completamente operativos y no se ven afectados por la directiva.

Anthropic ha declarado que proporcionará actualizaciones adicionales a medida que evolucione la situación. El comunicado completo está disponible en el sitio oficial de la empresa en anthropic.com.

Fuente: https://www.anthropic.com/news/fable-mythos-access

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *