Опасная модель искусственного интеллекта Anthropic взломана неавторизованными пользователями

Мощная модель искусственного интеллекта Mythos от Anthropic, разработанная для обеспечения кибербезопасности, получила доступ неавторизованных пользователей через скомпрометированные учетные данные подрядчика и методы интернет-разведки.
В результате серьезного инцидента безопасности, который вызвал тревогу во всей индустрии искусственного интеллекта, модель Mythos AI от Anthropic была скомпрометирована и получила доступ к небольшой группе неавторизованных лиц. Согласно сообщению Bloomberg, взлом произошел, когда участники частного онлайн-форума воспользовались уязвимостями, чтобы получить доступ к сложному инструменту кибербезопасности, который, как ранее предупреждала Anthropic, может представлять серьезную угрозу при неправильном использовании. Несанкционированный доступ был достигнут за счет сочетания тактики, в которой использовались учетные данные стороннего подрядчика, работающего с Anthropic, а также то, что источники описывают как «распространенные инструменты интернет-слежения» и методы разведки.
Это нарушение представляет собой заметный сбой в системе безопасности одной из ведущих организаций безопасности ИИ в отрасли. Anthropic явно отметил модель Mythos как потенциально опасную из-за ее расширенных возможностей и целевого назначения. По словам неназванного подрядчика, который разговаривал с Bloomberg, участники частного онлайн-форума смогли собрать воедино методологии доступа, объединив повышенные привилегии подрядчика со стандартными методами цифрового расследования. Этой комбинации оказалось достаточно, чтобы обойти меры безопасности, которые Anthropic предположительно внедрила для защиты доступа к этой чувствительной системе искусственного интеллекта.
Предварительная версия Claude Mythos представляет собой значительный шаг вперед в возможностях кибербезопасности с помощью искусственного интеллекта. Модель разработана с возможностью выявлять и использовать уязвимости в широком спектре вычислительных сред, включая все основные операционные системы и все основные веб-браузеры, используемые в настоящее время. Такая широта возможностей, ценная для целей защитной безопасности, также делает этот инструмент чрезвычайно опасным, если его используют злоумышленники или отдельные лица без соответствующих этических норм и ответственного обучения искусственному интеллекту.
Различие между моделями искусственного интеллекта общего назначения Anthropic и вариантом Mythos заключается в их специализации на выявлении и использовании уязвимостей. В то время как стандартные языковые модели, такие как Claude, предназначены для широких диалоговых и аналитических задач, Mythos был специально обучен и оптимизирован для понимания слабых мест безопасности на детальном уровне. Эта специализация делает его исключительно эффективным для законных исследований в области кибербезопасности и защитных приложений, но в равной степени опасен и в сценариях, когда злоумышленники получают доступ к его возможностям без наличия механизмов надзора или подотчетности.
Характер взлома сам по себе поднимает важные вопросы об управлении учетными данными подрядчиков и протоколах контроля доступа в компаниях, занимающихся искусственным интеллектом. Тот факт, что доступ стороннего подрядчика может быть использован для компрометации конфиденциальной модели, указывает на потенциальные пробелы в том, как Anthropic управляет безопасностью своей цепочки поставок и процессами привлечения подрядчиков. Сторонние подрядчики часто занимают сложную позицию в системах корпоративной безопасности: им требуется достаточный доступ для выполнения своих обязанностей, однако этот же доступ может стать вектором атаки, если их учетные записи будут скомпрометированы или если они сами станут векторами несанкционированного доступа.
Отраслевые эксперты уже давно подчеркивают, что передовые системы искусственного интеллекта имеют двойное назначение как важнейшую проблему в управлении ИИ. Те же возможности, которые делают такие инструменты, как Mythos, ценными для выявления и устранения уязвимостей безопасности, также делают их по своей сути рискованными при неправильном использовании. Это противоречие между полезными приложениями и возможным злоупотреблением стало центральной темой дискуссий о управлении ИИ и ответственном развертывании моделей. Такие компании, как Anthropic, вложили значительные средства в исследования безопасности искусственного интеллекта специально для решения этих проблем, что делает это нарушение особенно важным как тестовый пример того, насколько хорошо эти системы безопасности действительно работают на практике.
Использование группой несанкционированного доступа «распространенных инструментов интернет-расследования» позволяет предположить, что взлом не потребовал сложных эксплойтов нулевого дня или передовых методов взлома. Вместо этого, похоже, они полагались на более простые методы разведки и социальной инженерии в сочетании со скомпрометированными учетными данными подрядчика. Этот вывод вызывает особую тревогу, поскольку указывает на то, что решительные люди с базовыми техническими знаниями и доступом к стандартным инструментам потенциально могут взломать аналогично защищенные системы. Этот инцидент подчеркивает, насколько важно для компаний, занимающихся искусственным интеллектом, внедрять стратегии глубокоэшелонированной защиты, которые не полагаются на какую-либо единственную точку отказа.
Реакция Anthropic на этот инцидент безопасности, вероятно, создаст прецедент для того, как более широкая индустрия ИИ справляется со взломами конфиденциальных моделей. Компания сталкивается с необходимостью как расследовать весь объем несанкционированного доступа, так и внедрять более надежные меры защиты в будущем. Ключевые вопросы включают определение того, какие именно лица или организации получили доступ, какие действия они могли предпринять при этом доступе и была ли скомпрометирована какая-либо конфиденциальная информация или исследования, помимо самого доступа к модели.
Этот инцидент также подчеркивает более широкие последствия для регулирования и управления передовыми системами искусственного интеллекта. Поскольку модели становятся более мощными и более специализированными для потенциально опасных приложений, вопрос о том, как сбалансировать открытые исследования и разработки с соответствующими мерами безопасности, становится все более актуальным. Политики и лидеры отрасли, скорее всего, будут указывать на подобные инциденты как на свидетельство необходимости ужесточения нормативной базы и обязательных стандартов безопасности для разработчиков ИИ.
В перспективе это нарушение может ускорить дискуссии внутри Anthropic и во всей отрасли о том, как лучше защитить конфиденциальные модели искусственного интеллекта, сохраняя при этом возможность законных исследований и разработок. Компания может внедрить более строгие процессы проверки подрядчиков, более сложные системы мониторинга доступа и дополнительные уровни аутентификации и проверки. В масштабах всей отрасли этот инцидент, вероятно, повлияет на то, как компании оценивают риски, связанные с предоставлением третьим лицам доступа к конфиденциальным системам.
Нарушение модели Mythos служит суровым напоминанием о том, что даже компании с надежными показателями безопасности и продемонстрированной приверженностью ответственной разработке ИИ сталкиваются с серьезными проблемами безопасности. Поскольку возможности искусственного интеллекта продолжают развиваться, обеспечение того, чтобы мощные инструменты оставались в соответствующих руках, становится все более важным. Этот инцидент подчеркивает необходимость комплексных стратегий безопасности, которые устраняют не только внешние угрозы, но и внутренние уязвимости и протоколы управления доступом подрядчиков.
Источник: The Verge


