13.06.2026

Claude Fable et l'interface holographique

Правительство США обязало Anthropic приостановить доступ к Fable 5 и Mythos 5 по всему миру

Anthropic, компания, специализирующаяся на безопасности ИИ и стоящая за семейством моделей Claude, получила распоряжение от правительства США по соображениям национальной безопасности немедленно приостановить доступ к своим моделям Fable 5 и Mythos 5 для всех иностранцев, независимо от их местонахождения — внутри или за пределами Соединенных Штатов. Директива, полученная 14 июля 2025 года в 17:21 по восточному времени, заставила Anthropic отключить эти две модели для всей своей глобальной клиентской базы, чтобы обеспечить полное соблюдение требований, в то время как доступ ко всем другим моделям Claude остался неизменным.

Что произошло: правительственная директива с минимальными пояснениями

Anthropic публично раскрыла ситуацию через официальное заявление на своем веб-сайте и в своих официальных каналах в социальных сетях. По словам компании, директива была получена без конкретного обоснования в области национальной безопасности, включенного в письмо. Правительство устно выразило убеждение, что был выявлен метод обхода, или «джейлбрейк», для Fable 5, что вызвало опасения по поводу потенциального злоупотребления возможностями модели.

Директива была издана на основании полномочий по контролю за экспортом в целях национальной безопасности — юридической основы, обычно используемой для ограничения передачи чувствительных технологий иностранным субъектам. Применяя ее к доступу к модели ИИ, правительство фактически отнесло Fable 5 и Mythos 5 к контролируемым технологиям, обязав Anthropic запретить их использование любым иностранным гражданином, включая собственных сотрудников компании с иностранным гражданством.

Реакция Anthropic: несогласие и прозрачность

Подтвердив выполнение распоряжения, Anthropic публично выступила против его обоснования. Компания заявила, что изучила конкретную технику джейлбрейка, упомянутую правительством, и пришла к выводу, что она имеет ограниченный масштаб и влияние. Согласно заявлению Anthropic, продемонстрированная техника выявила лишь небольшое количество ранее известных незначительных уязвимостей, все из которых были описаны как относительно простые и обнаруживаемые с использованием других общедоступных моделей ИИ без необходимости обхода Fable 5.

Anthropic также подчеркнула, что не получила ни одного сообщения о джейлбрейке, приведшем к вредоносному результату. Компания охарактеризовала потенциальные джейлбрейки, о которых ей сообщали, как либо генерирующие полностью безвредные ответы, либо дающие незначительные результаты, не предоставляющие уникальных преимуществ, характерных для Mythos 5.

Архитектура безопасности Fable 5

Обширное тестирование методом «красной команды» перед запуском

В своем публичном заявлении Anthropic подробно описала значительную работу по обеспечению безопасности, предшествовавшую запуску Fable 5. За несколько недель до релиза компания сотрудничала с правительством США, Институтом безопасности ИИ Великобритании (AISI), несколькими частными сторонними организациями и внутренними командами, чтобы провести тысячи часов тестирования методом «красной команды», направленного на проверку защитных механизмов Fable. Эти тесты показали, что защита Fable 5 значительно эффективнее, чем у любых ранее развернутых моделей в отрасли.

Универсальный джейлбрейк не найден

Ключевой момент в защите Anthropic заключается в том, что ни один тестер, ни во время, ни после периода предварительной оценки, не смог найти универсальный джейлбрейк, то есть метод, способный широко обойти защитные механизмы модели, чтобы разблокировать широкий спектр потенциально опасных возможностей. Компания признала, что не универсальные джейлбрейки, которые могут извлекать конкретную информацию при определенных обстоятельствах, являются известной и неизбежной реальностью для всей индустрии ИИ.

Стратегия многоуровневой защиты

Вместо того чтобы заявлять о полной устойчивости к джейлбрейкам, Anthropic применила то, что она называет стратегией многоуровневой защиты в отношении Fable 5. Эта стратегия направлена на то, чтобы любые успешные джейлбрейки оставались либо ограниченными по масштабу, либо крайне затратными для выполнения. Она дополняется системами непрерывного мониторинга, предназначенными для быстрого обнаружения и остановки атак после их совершения.

В рамках этой стратегии Anthropic ввела 30-дневную политику хранения данных клиентов специально для Fable, решение, которое компания признала связанным с коммерческими издержками. Эта политика была внедрена, чтобы позволить продолжать исследования попыток джейлбрейка и ускорить устранение любых успешных эксплойтов.

Немедленное влияние на пользователей и разработчиков

Для пользователей потребительских продуктов и инструментов для разработчиков от Anthropic приостановка означает, что новые сессии, ранее работавшие на Fable 5, будут автоматически перенаправлены на выбранную пользователем модель по умолчанию или на Opus 4.8. Anthropic подтвердила через свой канал ClaudeDevs для разработчиков, что все остальные модели Claude остаются полностью доступными.

Это нарушение особенно примечательно, так как Fable 5, похоже, был позиционирован как один из флагманских продуктов Anthropic. Пользователи отмечали, что в некоторых случаях его фильтры безопасности считались чрезмерно строгими, что отражало агрессивные настройки защиты, которые Anthropic внедрила, чтобы снизить риск злоупотребления в задачах, связанных с кибербезопасностью.

Более широкие последствия для управления ИИ и контроля за экспортом

Прецедентное решение

Директива правительства США представляет собой важный момент в развитии отношений между федеральными властями и разработчиками ИИ. Применение механизмов контроля за экспортом к доступу к конкретной модели ИИ, а не к аппаратному обеспечению или базовым весам, является относительно новым использованием закона о национальной безопасности. Это ставит immediate вопросы о том, как власти будут определять и регулировать передовые возможности ИИ в будущем.

Неопределенность в отношении доказательств

В заявлении Anthropic отмечается, что на момент публикации правительство предоставило только устные доказательства тревожной техники джейлбрейка. Отсутствие формального письменного раскрытия поставило компанию в положение, когда она должна соблюдать директиву, которую считает неоправданной на основании имеющихся доказательств, при этом не имея возможности урегулировать основной спор путем прямого технического обзора полных выводов правительства.

Компания выразила готовность к дальнейшему взаимодействию с властями и заявила, что будет продолжать выступать за прозрачный и основанный на доказательствах процесс. Этот случай, вероятно, привлечет пристальное внимание других разработчиков ИИ, политиков и защитников гражданских свобод по мере роста вопросов о масштабах правительственного контроля над коммерческими системами ИИ.

Доступ к Fable 5 и Mythos 5 был приостановлен во всем мире для всех иностранных граждан, включая сотрудников Anthropic. Все остальные модели Claude, включая Opus 4.8, остаются полностью работоспособными и не затрагиваются директивой.

Anthropic заявила, что будет предоставлять дополнительные обновления по мере развития ситуации. Полное заявление доступно на официальном сайте компании по адресу anthropic.com.

Источник: https://www.anthropic.com/news/fable-mythos-access

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *