Anthropic подтверждает разработку ИИ Claude Mythos после утечки

Компания Anthropic подтвердила, что работает над новым искусственным интеллектом Claude Mythos, который уже проходит тестирование с избранными клиентами раннего доступа. Это стало известно после масштабной утечки данных, которая раскрыла ряд деталей относительно будущих технологических разработок Anthropic, включая новый уровень Capybara и потенциальные киберриски, которые компания назвала беспрецедентными.

Об этом сообщает ProIT

Утечка данных и особенности Claude Mythos

Публичное заявление Anthropic прозвучало после того, как в открытом кэше данных были найдены черновые материалы, детально проанализированные независимыми исследователями. В этих документах Claude Mythos описывается как инновационная ИИ-модель с чрезвычайно мощным киберпотенциалом. После обнаружения утечки Anthropic ограничила доступ к хранилищу и объяснила ситуацию человеческой ошибкой при настройке системы управления контентом.

Общее количество обнародованных материалов составило около 3 000 единиц, среди которых были внутренние документы и черновики блогов. Независимый анализ проводили специалист по кибербезопасности Александр Повелс из Университета Кембриджа и старший исследователь LayerX Security Рой Паз.

Инновации, безопасность и будущие внедрения

В перечне документов также был PDF-файл, посвященный закрытому двухдневному мероприятию для CEO ведущих европейских компаний в Великобритании с участием генерального директора Anthropic Дарио Амодеи. Программа предусматривала обсуждение интеграции искусственного интеллекта в бизнес-стратегии и демонстрацию возможностей новой модели Claude.

В документах упоминается уровень Capybara — он больше и умнее предыдущей модели Opus, но принадлежит к той же технологической основе, что и Mythos. На данный момент Anthropic предлагает три уровня своих моделей: Opus, Sonnet и Haiku, а Capybara, как ожидается, обеспечит еще более широкие возможности и более высокую стоимость лицензии.

Согласно утечке, Claude Mythos демонстрирует значительно лучшую эффективность в тестах на программирование, академическое мышление и кибербезопасность по сравнению с Opus 4.6. Указывается, что обучение модели завершено, и она считается самым сильным разработкой Anthropic. Из-за высокой стоимости эксплуатации планируется ограниченный ранний доступ перед массовым запуском.

Особый акцент в документах сделан на киберрисках: новая модель способна выявлять уязвимости с такой скоростью, что это может превышать возможности современных систем киберзащиты. Именно поэтому ранний доступ к Claude Mythos будет предоставляться специализированным организациям в области кибербезопасности, чтобы они могли заранее подготовить свои защитные системы.

«Черновик также отмечал, что Claude Mythos показывает лучшие результаты в тестах на программирование, академическое рассуждение и кибербезопасность по сравнению с Opus 4.6. Модель прошла завершенное обучение и считается самой мощной в истории компании. Планировался ограниченный ранний доступ из-за высокой стоимости эксплуатации и готовности к массовому запуску».

Такая стратегия соответствует общим тенденциям лидеров отрасли. В феврале текущего года OpenAI представила модель GPT-5.3-Codex с расширенными кибер-возможностями для выявления программных уязвимостей. Тогда же Anthropic выпустила Opus 4.6 с аналогичными функциями, признав, что подобные технологии могут быть использованы как для защиты, так и для атак.

В компании также сообщили, что хакерские группы, включая подозреваемые государственные структуры Китая, пытались использовать Claude для кибератак. Один из зафиксированных случаев затронул около 30 различных организаций, среди которых были технологические, финансовые компании и государственные учреждения. В течение десяти дней Anthropic заблокировала все подозрительные аккаунты и уведомила пострадавшие организации о инциденте.