Клод Мифос: Кто контролирует интернет-безопасность?

Новая мощная модель искусственного интеллекта Anthropic находит уязвимости нулевого дня, но не будет обнародована. Эксперты спорят, кто должен контролировать такую мощную технологию кибербезопасности.
Анонс Клода Мифа из Anthropic представляет собой переломный момент в продолжающихся дебатах о роли искусственного интеллекта в кибербезопасности и цифровом управлении. В этом месяце компания из Кремниевой долины представила свою последнюю революционную модель с поразительной оговоркой: она останется под строгим контролем и никогда не будет представлена широкой публике. Причина этого решения затрагивает самую суть современной технологической тревоги: модель настолько способна выявлять и использовать компьютерные уязвимости, что руководители Anthropic решили, что ее широкое распространение фундаментально поставит под угрозу интернет-безопасность во всем мире.
Claude Mythos представляет собой значительный шаг вперед в возможностях ИИ в области кибербезопасности, демонстрируя автономные функции, которых давно опасались исследователи безопасности. Система может выявлять ранее неизвестные недостатки «нулевого дня» — уязвимости, неизвестные поставщикам программного обеспечения и общественности — и автономно писать код для использования этих слабостей. Еще более тревожно то, что он может объединить несколько уязвимостей для достижения комплексного взлома системы, потенциально захватив контроль над основными операционными системами и веб-браузерами. Эта возможность по существу превращает модель в мастер-отмычку, которая работает практически с любым цифровым замком, понимая, как не только взламывать отдельные защиты, но и объединять эксплойты в разрушительные последовательности атак.
Чтобы понять серьезность того, чего может достичь Mythos, рассмотрим удачную аналогию, предложенную экспертами по безопасности: система действует как высокоинтеллектуальный грабитель, который может нацелиться на любое здание, определить точки входа, отпереть каждую дверь и систематически опустошать каждый сейф, не вызывая тревоги. Это не просто инструмент для ответственного выявления недостатков безопасности — это комплексный наступательный потенциал, который, попав в чужие руки или развернут злонамеренно, может фундаментально дестабилизировать критически важную цифровую инфраструктуру. Автономный характер этих эксплойтов делает угрозу еще более острой, поскольку Mythos не требует человеческого руководства после наведения на целевую систему.
Осознавая как потенциальные преимущества, так и катастрофические риски такой технологии, Anthropic приступила к реализации амбициозной оборонной инициативы под названием Проект Glasswing. В рамках этой структуры компания установила партнерские отношения примерно с 40 организациями, чтобы помочь выявлять и устранять уязвимости до того, как злоумышленники смогут их обнаружить и использовать. Партнерские организации представляют некоторых из наиболее важных поставщиков инфраструктуры в цифровой экосистеме, хотя, в частности, все участники — американские компании, находящиеся в самом ядре цифровой архитектуры под руководством США. Такая географическая концентрация отражает как техническую реальность того, что американские компании доминируют в ключевой интернет-инфраструктуре, так и геополитические аспекты развертывания системы безопасности ИИ.
Процесс исправления уязвимостей в рамках Project Glasswing действует по принципу упреждающей защиты: Anthropic использует Claude Mythos для обнаружения недостатков безопасности, а затем предоставляет эту информацию партнерским организациям, давая им необходимое время для разработки и развертывания исправлений, прежде чем преступники или враждебные субъекты смогут разработать свои собственные эксплойты. Это представляет собой значительную ответственность для Anthropic, поскольку компания должна поддерживать идеальную операционную безопасность вокруг Mythos, чтобы гарантировать, что информация об уязвимостях не попадет к потенциальным злоумышленникам. Единственное нарушение в системах Anthropic может превратить эту оборонительную инициативу в самую разрушительную утечку разведданных в мире.
Участие Великобритании в разработке Mythos, хотя и ограниченное, свидетельствует о важном международном сотрудничестве в управлении безопасностью ИИ. Anthropic поделилась доступом к модели с Британским институтом безопасности искусственного интеллекта, что позволило британским исследователям проводить независимое тестирование и оценку возможностей и рисков технологии. Эта договоренность дает британскому правительству ценную информацию об угрозах кибербезопасности и оборонных возможностях с помощью искусственного интеллекта. После непосредственного изучения Mythos британские министры предупредили бизнес-лидеров о расширяющемся ландшафте угроз, создаваемом все более мощными системами искусственного интеллекта.
Решение ограничить Mythos тщательно контролируемой группой партнеров по безопасности, а не выпускать его открыто, отражает фундаментальную напряженность в современном управлении технологиями. В традиционном движении за программное обеспечение с открытым исходным кодом исследователи в области безопасности утверждают, что прозрачность ускоряет обнаружение и исправление уязвимостей, поскольку большее количество глаз, изучающих код, приводит к более быстрому выявлению недостатков. Однако с помощью такого мощного инструмента, как Claude Mythos, эта логика катастрофически меняется: чем шире доступна возможность обнаружения эксплойтов, тем быстрее злоумышленники смогут использовать ее в качестве оружия. Руководство Anthropic, по сути, пришло к выводу, что традиционная модель безопасности с открытым исходным кодом терпит неудачу в условиях крайней концентрации возможностей.
Эта дилемма поднимает глубокие вопросы о частной власти и общественных рисках, которые выходят далеко за рамки непосредственной ситуации, в которой находится Anthropic. Теперь компания обладает чем-то вроде главного ключа к цифровой инфраструктуре — возможности, которая раньше существовала только в теоретических дискуссиях среди экспертов по безопасности. Концентрация такой власти в частных руках поднимает неизбежные вопросы управления: как государственные учреждения могут проверить, что Anthropic использует Mythos ответственно? Какие механизмы существуют, чтобы гарантировать, что компания не развивает свои собственные наступательные возможности с помощью этого инструмента? Как международному сообществу следует справиться с геополитическими последствиями того, что одна компания контролирует такую стратегическую технологию?
Ответы на эти вопросы остаются, к сожалению, неясными. Ни существующие нормативные базы, ни международные соглашения не обеспечивают адекватных механизмов управления передовыми инструментами безопасности ИИ на этом уровне возможностей. Большинство правил кибербезопасности сосредоточены на предотвращении вреда, а не на регулировании распространения инструментов, способствующих нанесению вреда. Международные договоры по кибербезопасности обычно касаются действий национальных государств, а не частных компаний. Этот пробел в управлении означает, что Anthropic в основном руководствуется собственной оценкой того, что представляет собой ответственное управление этими исключительными возможностями.
В будущем ситуация с Клодом Мифосом, вероятно, станет все более распространенной по мере развития возможностей безопасности искусственного интеллекта. Другие разработчики ИИ преследуют аналогичные наступательные возможности, и кажется неизбежным, что несколько организаций в конечном итоге будут обладать инструментами, сравнимыми с возможностями Mythos или превосходящими их. Эта технологическая траектория поднимает фундаментальные вопросы о том, должна ли какая-либо компания обладать односторонним контролем над инструментами, которые могут поставить под угрозу глобальную цифровую инфраструктуру. Нынешний подход, основанный на индивидуальных корпоративных решениях об ответственном использовании, кажется неадекватным для технологий такого уровня значимости.
Более широкий смысл Клода Мифа распространяется на вопросы о будущем характере самого Интернета. Если наступательные возможности ИИ будут развиваться быстрее, чем оборонительные, мы можем столкнуться со сценарием, при котором ни одна система не может считаться по-настоящему безопасной. Это может фундаментально изменить работу критической инфраструктуры, потенциально потребовав изолированных систем, значительно ухудшив функциональность или организационные стратегии, которые жертвуют удобством ради безопасности. Общий Интернет в его нынешнем виде может просто стать несовместимым с миром, в котором ИИ может использовать уязвимости со скоростью и в масштабе машины.
Anthropic заслуживает похвалы за то, что подошла к этой ответственности с явной серьезностью: решение не публиковать Claude Mythos публично отражает зрелое суждение о последствиях этой технологии. Однако подход компании также представляет собой своего рода технологический феодализм, при котором решения огромной общественной значимости полностью принимаются руководством частных корпораций. Предстоящая задача заключается в разработке структур управления, которые гарантируют, что такие мощные возможности будут служить общественным интересам, оставаясь при этом достаточно эффективными для устранения подлинных угроз безопасности. Смогут ли существующие институты справиться с этой задачей, остается глубоко неясным.
Источник: The Guardian


