Модель штучного інтелекту Клода Мітоса: контроль потужності безпеки в Інтернеті

Нова потужна модель штучного інтелекту від Anthropic знаходить уразливості нульового дня, але не буде опублікована. Експерти сперечаються, хто повинен контролювати таку потужну технологію кібербезпеки.

Оголошення Claude Mythos з Anthropic є переломним моментом у триваючих дебатах про роль штучного інтелекту в кібербезпеці та цифровому управлінні. Цього місяця компанія з Силіконової долини представила свою останню революційну модель із вражаючим застереженням: вона залишатиметься під суворим контролем і ніколи не буде випущена для широкого загалу. Аргументація цього рішення врізається в суть сучасної технологічної тривоги — модель настільки здатна виявляти та використовувати вразливості комп’ютера, що керівники Anthropic вирішили, що її широка доступність фундаментально поставить під загрозу безпеку в Інтернеті в усьому світі.

Claude Mythos представляє драматичний крок вперед у можливостях штучного інтелекту в кібербезпеці, демонструючи автономні функції, яких дослідники безпеки давно боялися. Система може ідентифікувати раніше невідомі недоліки «нульового дня» — уразливості, невідомі постачальникам програмного забезпечення та громадськості, — і автономно писати код для використання цих недоліків. Більш тривожним є те, що він може об’єднати кілька вразливостей разом, щоб досягти повного зламу системи, потенційно переймаючи контроль над основними операційними системами та веб-браузерами. Ця можливість фактично перетворює модель на майстер-відмичок, який працює практично з будь-яким цифровим замком, розуміючи, як не лише зламувати індивідуальний захист, але й об’єднувати експлойти в руйнівні послідовності атак.

Щоб зрозуміти серйозність того, чого може досягнути Mythos, розглянемо влучну аналогію, запропоновану експертами з безпеки: система функціонує як високоінтелектуальний грабіжник, який може націлитися на будь-яку будівлю, визначити точки входу, відчинити всі двері та систематично спустошувати кожен сейф, не запускаючи сигналізацію. Це не просто інструмент для відповідального виявлення недоліків у безпеці — це комплексна наступальна здатність, яка може, потрапивши в чужі руки або використана зловмисно, фундаментально дестабілізувати критичну цифрову інфраструктуру. Автономний характер цих експлойтів робить загрозу ще гострішою, оскільки Mythos не потребує вказівок людини після того, як він спрямований на цільову систему.

Антропічний штаб-квартира та дослідницький центр ШІ

Усвідомлюючи потенційні переваги та катастрофічні ризики такої технології, Anthropic розпочав амбітну оборонну ініціативу під назвою Проект Glasswing. Відповідно до цієї структури компанія співпрацює з приблизно 40 організаціями, щоб допомогти виявити та усунути вразливості до того, як зловмисники зможуть їх виявити та використовувати. Партнерські організації представляють деяких із найважливіших постачальників інфраструктури в цифровій екосистемі, хоча, зокрема, усі учасники є американськими компаніями, які знаходяться в самому центрі цифрової архітектури під керівництвом США. Ця географічна концентрація відображає як технічну реальність, коли американські компанії домінують у ключовій інтернет-інфраструктурі, так і геополітичні виміри розгортання безпеки ШІ.

Процес виправлення вразливостей у рамках проекту Glasswing працює за принципом превентивного захисту — Anthropic використовує Claude Mythos для виявлення недоліків у безпеці, а потім надає цю інформацію партнерським організаціям, даючи їм важливий час для розробки та розгортання виправлень, перш ніж злочинці або ворожі особи зможуть створити власні експлойти. Це несе значну відповідальність для Anthropic, оскільки компанія повинна підтримувати бездоганну операційну безпеку навколо Mythos, щоб гарантувати, що інформація про вразливості не потрапить до потенційних зловмисників. Один пролом у системах Anthropic може перетворити цю оборонну ініціативу на найбільш руйнівний у світі витік розвідданих.

Участь Великобританії в розробці Mythos, хоч і обмежена, свідчить про важливу міжнародну співпрацю в керуванні безпекою ШІ. Anthropic поділився доступом до моделі з Інститутом безпеки штучного інтелекту Великобританії, що дозволило британським дослідникам проводити незалежне тестування та оцінювати можливості та ризики технології. Ця домовленість надає британському уряду важливе уявлення про передові загрози кібербезпеці та оборонні можливості з підтримкою ШІ. Після безпосереднього ознайомлення з Mythos британські міністри попередили керівників компаній щодо розширення ландшафту загроз, створюваних все більш потужними системами ШІ.

Рішення обмежити Mythos ретельно контрольованою групою партнерів із безпеки замість того, щоб відкрити його випуск, відображає фундаментальну напругу в сучасному управлінні технологіями. У традиційному русі програмного забезпечення з відкритим вихідним кодом дослідники безпеки стверджують, що прозорість прискорює виявлення вразливостей і виправлення, оскільки більше очей перевіряє код, що призводить до швидшого виявлення недоліків. Однак із таким потужним інструментом, як Claude Mythos, ця логіка катастрофічно змінюється: чим ширше доступна функція пошуку експлойтів, тим швидше зловмисники можуть використовувати її як зброю. Керівництво Anthropic фактично дійшло висновку, що традиційна модель безпеки з відкритим вихідним кодом не працює в умовах надзвичайної концентрації можливостей.

Ця дилема породжує глибокі запитання щодо приватної влади та суспільного ризику, які виходять далеко за рамки безпосередньої ситуації Anthropic. Тепер компанія володіє чимось, що наближається до головного ключа до цифрової інфраструктури, можливостей, які раніше існували лише в теоретичних дискусіях серед експертів з безпеки. Концентрація такої влади в приватних руках викликає неминучі питання щодо управління: як державні установи можуть перевірити, що Anthropic використовує Mythos відповідально? Які існують механізми, щоб гарантувати, що компанія не розвиває власні наступальні можливості за допомогою цього інструменту? Як міжнародне співтовариство має керувати геополітичними наслідками контролю однієї компанії за такою стратегічною технологією?

Відповіді на ці запитання залишаються надзвичайно незрозумілими. Ані існуючі нормативні рамки, ані міжнародні угоди не забезпечують адекватних механізмів керування розширеними інструментами безпеки ШІ на цьому рівні можливостей. Більшість нормативних актів у сфері кібербезпеки зосереджуються на запобіганні шкоди, а не на регулюванні розповсюдження інструментів, що сприяють завданню шкоди. Міжнародні угоди з кібербезпеки зазвичай стосуються дій національних держав, а не приватних компаній. Ця прогалина в управлінні означає, що Anthropic працює переважно на основі власної оцінки того, що є відповідальним управлінням цією надзвичайною здатністю.

Дивлячись у майбутнє, ситуація з Клодом Мітосом, імовірно, ставатиме все більш поширеною в міру розвитку можливостей безпеки ШІ. Інші розробники штучного інтелекту прагнуть до подібних наступальних можливостей, і здається неминучим, що кілька організацій зрештою матимуть інструменти, які можна порівняти з можливостями Mythos або перевищити їх. Ця технологічна траєкторія викликає фундаментальні питання про те, чи повинна будь-яка компанія мати односторонній контроль над інструментами, які можуть скомпрометувати глобальну цифрову інфраструктуру. Нинішній підхід, який покладається на індивідуальні корпоративні рішення щодо відповідального використання, здається неадекватним для технологій такого рівня значущості.

Ширші наслідки Клода Мітоса поширюються на питання про майбутній характер самого Інтернету. Якщо наступальні можливості штучного інтелекту продовжуватимуть розвиватися швидше, ніж захисні, ми можемо зіткнутися зі сценарієм, коли жодна система не може вважатися справді безпечною. Це може докорінно змінити роботу критичної інфраструктури, потенційно вимагаючи систем із зазором, значно погіршеною функціональністю або організаційних стратегій, які обмінюють зручність на безпеку. Спільний Інтернет у його нинішньому вигляді може просто стати несумісним зі світом, де штучний інтелект може використовувати вразливості на машинній швидкості та в масштабі.

Anthropic заслуговує на похвалу за підхід до цієї відповідальності з очевидною серйозністю — рішення не випускати Клода Мітоса публічно відображає зріле судження щодо наслідків технології. Однак підхід компанії також є своєрідним технологічним феодалізмом, коли рішення величезної суспільної значущості повністю покладаються на приватне корпоративне керівництво. Попереднє завдання передбачає розробку структур управління, які гарантують, що такі потужні можливості служать суспільним інтересам, залишаючись при цьому достатньо ефективними для боротьби зі справжніми загрозами безпеці. Чи зможуть існуючі інституції впоратися з цим викликом, залишається глибоко невизначеним.

Клод Мітос: Хто контролює безпеку в Інтернеті?

Коментарі (0)

Схожі статті

AI Nobel Prize Discovery Within Year, Says Anthropic

Imperagen Secures £5M Funding for Quantum AI Enzyme

Nvidia CEO Projects $200B Market for AI Agent CPUs