У 2025 році системи маркування зі штучним інтелектом піддадуться критичному випробуванню

Облікові дані Google SynthID і C2PA Content Credentials розширюють можливості ідентифікації контенту, створеного штучним інтелектом. Чи можуть ці технології зупинити дипфейки від обману громадськості?
Індустрія штучного інтелекту стоїть на ключовому роздоріжжі, оскільки системи маркування штучного інтелекту готуються до найзначнішого розширення. Дві революційні технології — SynthID і C2PA Content Credentials — готові змінити те, як люди ідентифікують контент, створений штучним інтелектом в Інтернеті, потенційно переломивши ситуацію проти лавини оманливих глибоких фейків і синтетичних медіа, які безконтрольно поширилися на платформах соціальних мереж і стрічках новин по всьому світу.
Неможливо переоцінити актуальність цього моменту. Оскільки штучний інтелект стає все більш досконалим, громадськість стикається з безпрецедентною проблемою, пов’язаною з тим, щоб відрізнити справжній вміст від ретельно створених підробок. Вірусні зображення Папи Франциска в дорогому вуличному одязі, створені за допомогою таких інструментів штучного інтелекту, як Midjourney, служать яскравим нагадуванням про те, як легко синтетичний контент може ввести в оману мільйони користувачів і поширитися в цифрових мережах, перш ніж будь-які механізми перевірки фактів зможуть втрутитися. Без надійних систем ідентифікації суспільству загрожує криза автентичності інформації.
Оголошення Google під час щорічної конференції I/O стало переломним моментом для зусиль перевірки цифрового вмісту. Технологічний гігант повідомив, що незабаром користувачі матимуть можливість перевірити, чи містять зображення маркери SynthID — невидиму систему водяних знаків, яка вбудована безпосередньо в контент, створений моделями штучного інтелекту Google. Цей прогрес являє собою фундаментальну зміну в тому, як компанії штучного інтелекту підходять до підзвітності та прозорості в своїх генеративних інструментах.
SynthID працює за допомогою геніального механізму, який додає непомітні цифрові сигнали до згенерованих ШІ зображень, відео та аудіофайлів у момент створення. На відміну від традиційних водяних знаків, які видно на вмісті, маркери SynthID залишаються невидимими для людського ока, але їх можна виявити системами перевірки. Цей підхід вирішує критичну проблему: дипфейки та синтетичні носії не можуть бути легко виявлені випадковими глядачами, але невидимі маркери можуть бути миттєво автентифіковані будь-ким, хто має доступ до інструментів перевірки.
Система облікових даних C2PA Content Credentials працює у взаємодоповнюючий спосіб, створюючи повний цифровий запис, який документує походження, історію редагування та метод створення будь-якого медіафайлу. Ця технологія, по суті, забезпечує прозорий ланцюг зберігання цифрового вмісту, дозволяючи глядачам відстежувати, звідки саме походить зображення, відео чи аудіофайл і як він змінювався з часом. Разом ці дві системи створюють багаторівневий підхід до автентифікації вмісту, який усуває багато аспектів проблеми deepfake.
Час для цього розширення навряд чи може бути критичнішим. Дослідження задокументували драматичний сплеск створення синтетичного контенту, за оцінками, які свідчать про те, що підроблені відео та маніпульовані зображення розмножуються швидше, ніж Інтернет може створити механізми виявлення. Виборчий цикл 2024 року показав тривожні приклади використання глибоких фейків у політичних цілях, а оманливі зображення, створені штучним інтелектом, завдали реальної шкоди, поширюючи неправдиву інформацію про катастрофи, громадських діячів і поточні події.
Тим не менш, перед тим, як ці технології зможуть досягти широкого впровадження та ефективності, ще постають серйозні проблеми. Інфраструктура для маркування вмісту AI вимагає участі всіх основних технологічних платформ, розробників вмісту та соціальних мереж. Зараз у цифровій екосистемі впровадження залишається нерівним і нерівномірним. Багатьом користувачам досі не вистачає інструментів або знань для перевірки вмісту за допомогою цих систем, створюючи постійний розрив між можливостями технології та її застосуванням у реальному світі.
Крім того, не весь синтетичний вміст походить із основних платформ, оснащених SynthID або подібними системами. Погані актори, які використовують моделі штучного інтелекту з відкритим кодом або створені на замовлення генеративні інструменти, можуть створювати переконливі дипфейки без будь-яких вбудованих маркерів перевірки. Це створює сценарій, коли спроби глибокого виявлення фейків залишаються незавершеними, виловлюючи деякі фейки, тоді як незліченна кількість інших прослизає без ідентифікації. Динаміка кота-мишки між творцями вмісту та системами перевірки продовжує посилюватися.
Оглядачі галузі відзначають, що успіх значною мірою залежить від того, як основні засоби масової інформації, соціальні платформи та користувачі Інтернету сприймають ці технології перевірки. Якщо основні платформи, такі як Facebook, Instagram, TikTok і X, інтегрують перевірку SynthID безпосередньо у свої інтерфейси, що полегшить звичайним користувачам перевірку автентичності зображення, впровадження може значно прискоритися. Однак якщо ці інструменти залишаться похованими в технічних налаштуваннях, доступних лише для досвідчених користувачів, їхній вплив залишатиметься обмеженим.
Розширення Google SynthID є підтвердженням того, що компанія усвідомлює свою відповідальність у сфері синтетичних медіа. Застосовуючи невидимі водяні знаки до вмісту, створеного Bard та іншими системами штучного інтелекту Google, компанія встановлює чіткий ланцюжок відповідальності. Якщо зображення, створене Google, з’являється в Інтернеті та завдає шкоди, системи перевірки можуть відстежити його джерело. Такий підхід стимулює відповідальне використання та перешкоджає навмисному поширенню оманливого синтетичного вмісту ідентифікованими каналами.
Ширші наслідки виходять за межі простого відлову нечесних акторів. Оскільки створені штучним інтелектом медіафайли дедалі більше не відрізняються від автентичного вмісту, здатність остаточно ідентифікувати синтетичний матеріал набуває першочергового значення. Новинні організації, спеціалісти з перевірки фактів і дослідники залежать від надійних систем автентифікації, щоб відокремити законну журналістику від маніпуляційного контенту. Навчальним закладам може знадобитися навчити студентів користуватися інструментами перевірки в рамках навчальної програми цифрової грамотності.
Заглядаючи вперед, успіх цих ініціатив із маркування, швидше за все, визначить, чи стане штучний інтелект надійним інструментом, який покращує людську креативність і комунікацію, чи він перетвориться на інструмент обману, який підриває довіру суспільства до ЗМІ та джерел інформації. Прийдешні місяці стануть важливим полігоном для перевірки того, чи зможе технологія перевірки вмісту ефективно масштабуватися та відповідати викликам, які постають перед швидким прогресом інструментів створення синтетичних медіа.
Те, що залишається впевненим, так це те, що цей момент є переломним моментом для всієї екосистеми штучного інтелекту та цифрової автентичності. Якщо Google, Meta, OpenAI та інші основні гравці зможуть скоординувати зусилля щодо загального впровадження стандартів маркування, запровадити зручні інтерфейси перевірки та переконати платформи віддавати пріоритет автентифікованому вмісту, стане можливим справжній прогрес у боротьбі з глибокими фейками. І навпаки, якщо впровадження залишатиметься фрагментарним і непослідовним, синтетичні медіа продовжуватимуть процвітати в середовищі, де пересічна людина не зможе достовірно відрізнити вигадку від правди в Інтернеті.
Джерело: The Verge


