Як працівники навчають ШІ виявляти об’єкти

Дізнайтеся, як тисячі працівників позначають фотографії та відео, щоб навчити системи ШІ ідентифікувати повсякденні предмети. Дослідіть людську робочу силу, що стоїть за штучним інтелектом.
Кістяк сучасних систем штучного інтелекту спирається на напрочуд людський фактор: тисячі працівників ретельно позначають фотографії та відеокадри, щоб навчити машини розпізнавати об’єкти в реальному світі. Цей процес маркування даних, хоча його часто забувають, є важливою основою, на якій будуються найскладніші сучасні моделі комп’ютерного зору. Без цих відданих працівників, які ретельно коментують зображення, інтелектуальним системам, які працюють у всьому, від автономних транспортних засобів до програмного забезпечення для медичних зображень, бракувало б навчальних даних, необхідних для ефективного функціонування.
Процес навчання штучному інтелекту за допомогою анотацій зображень став важливою галузевою практикою для технологічних компаній будь-якого розміру. Робітники щодня годинами сидять за комп’ютерами, кадр за кадром розглядаючи фотографії та відео, ідентифікуючи та позначаючи все: від пішоходів і транспортних засобів до вуличних знаків і будівель. Кожна мітка представляє точку даних, яка допомагає алгоритмам машинного навчання зрозуміти шаблони та відмінності між різними об’єктами. Цей орієнтований на людей підхід до машинного навчання залишається в основному непомітним для споживачів, але він є абсолютно фундаментальним для функціональності розширених програм штучного інтелекту в повсякденному використанні.
Значення цієї роботи виходить далеко за межі простих завдань розпізнавання зображень. Системи комп’ютерного бачення, навчені на ретельно позначених наборах даних, забезпечують роботу найважливіших програм у сфері охорони здоров’я, транспорту, безпеки та багатьох інших галузей. Коли медичні працівники використовують штучний інтелект для діагностики захворювань на основі сканованих зображень, ця система була навчена працівниками, які позначили тисячі схожих зображень. Коли автономні транспортні засоби безпечно пересуваються міськими вулицями, вони покладаються на можливості розпізнавання, відточені за допомогою широкого маркування реальних сценаріїв водіння. Якість і повнота цих міток безпосередньо впливають на ефективність роботи систем штучного інтелекту в призначених для них програмах.
Робоча сила, яка займається анотаціями зображень, надзвичайно різноманітна та розподілена по всьому світу. Багато компаній передають цю роботу спеціалізованим фірмам і платформам, які об’єднують працівників із завданнями маркування. Ці платформи зробили можливим швидко масштабувати анотаційні зусилля, дозволяючи компаніям відносно швидко маркувати мільйони зображень. Працівники мають різну освіту та професійну освіту, привносячи різні точки зору та увагу до деталей у своїй роботі з етикетування. Демократизація навчальної роботи зі штучного інтелекту через ці платформи створила нові можливості працевлаштування в регіонах по всьому світу.
Механіка роботи з маркуванням часто складніша, ніж здається на перший погляд. Працівники повинні розуміти та застосовувати докладні системи класифікації, іноді використовуючи спеціалізовані програмні інтерфейси, призначені для ефективного анотування. Наприклад, маркування фотографії вуличної сцени може вимагати ідентифікації не лише наявності автомобілів, але й їх типу, кольору, орієнтації та часткової видимості. Відеоанотація додає ще один рівень складності, оскільки працівники повинні відстежувати об’єкти в кількох кадрах і підтримувати узгодженість у їх позначенні протягом послідовності. Ця точність є важливою, оскільки будь-які помилки чи невідповідності в навчальних даних можуть погіршити продуктивність кінцевої моделі ШІ.
Різні типи об’єктів мають різні рівні складності анотацій. Деякі предмети, як-от добре видимі транспортні засоби чи люди, відносно легко визначити та позначити. Інші об’єкти виявляються набагато складнішими: частково затемнені предмети, об’єкти під незвичайними кутами або предмети, класифікація яких може бути неоднозначною, потребує навченого судження та ретельного розгляду. Працівники повинні розвинути навички розрізнення схожих об’єктів і розуміння контекстних підказок, які допомагають ідентифікувати те, що інакше могло б бути неоднозначним елементом на зображенні. Це тонке розуміння неможливо автоматизувати, що робить людське судження неоціненним для процесу навчання.
Структура винагороди за роботу з анотуванням даних значно відрізняється залежно від складності завдань, географічного розташування працівників і платформи, яка керує роботою. Деякі працівники отримують скромну погодинну оплату праці, а інші отримують винагороду за зображення або виконане завдання. Економічний вплив на окремих працівників коливається від додаткового доходу в розвинених країнах до значної основної зайнятості в регіонах, що розвиваються. Незважаючи на важливий характер цієї роботи, правозахисні групи висловлюють занепокоєння щодо забезпечення справедливої оплати праці та належних умов праці для зростаючої глобальної робочої сили, яка займається підготовкою даних ШІ.
Гарантія якості є ще одним важливим виміром екосистеми анотацій. Платформи маркування даних штучного інтелекту зазвичай використовують кілька механізмів перевірки для забезпечення точності та узгодженості. Це часто передбачає те, що кілька робочих осіб позначають однакові зображення незалежно, із консенсусним підходом до визначення остаточної мітки. Рецензенти-експерти періодично перевіряють зразки виконаної роботи, щоб виявити моделі помилок або непорозумінь. Ці заходи контролю якості є важливими, оскільки вся ефективність кінцевої системи штучного інтелекту залежить від точності її навчальних даних. Garbage in, garbage out залишається актуальним у машинному навчанні, як і в будь-якій іншій області обчислень.
Масштаб роботи з маркування, необхідної для сучасних систем ШІ, майже незбагненно великий. Великі технологічні компанії та дослідницькі установи штучного інтелекту керують проектами анотацій, що включають мільйони зображень і відео. Один проект розробки автономного транспортного засобу може вимагати маркування мільйонів кадрів реального водіння. Великі мовні моделі, навчені на візуальній інформації, потребують величезних наборів даних із анотованими зображеннями, щоб засвоїти надійне представлення об’єктів і сцен. Величезний обсяг необхідної анотаційної роботи означає, що це залишається у сфері людських працівників, незважаючи на значні дослідження щодо автоматизації різних аспектів процесу.
Нові технології починають доповнювати традиційні ручні методи анотацій. Напівавтоматичні інструменти маркування використовують попередні моделі штучного інтелекту для створення початкових анотацій, які працівники можуть потім переглянути та виправити, що потенційно прискорює загальний процес. Методи активного навчання намагаються визначити, які зображення є найціннішими для позначення, зосереджуючи людські зусилля на найбільш інформативних прикладах. Ці гібридні підходи спрямовані на підвищення ефективності та зниження загальної вартості створення навчальних наборів даних, зберігаючи при цьому стандарти якості, необхідні для високопродуктивних систем ШІ. Однак людське судження та нагляд залишаються важливими компонентами цих робочих процесів.
Етичні аспекти навчання штучному інтелекту за допомогою людських анотацій стають дедалі важливішими, оскільки зростає обізнаність про практику. Працівники заслуговують на справедливу винагороду, розумні умови праці та ясність щодо того, як використовуються їхні внески. Самі дані викликають питання щодо конфіденційності, згоди та того, як зображення реальних людей і місць перепрофільовуються для комерційної розробки ШІ. Організації, які працюють у цьому просторі, зобов’язані прозоро вирішувати ці проблеми та встановлювати етичні принципи, які поважають як залучених працівників, так і суб’єктів, чиї зображення з’являються в наборах навчальних даних.
Заглядаючи вперед, роль людей у навчанні ШІ швидше розвиватиметься, ніж зникне. Оскільки системи штучного інтелекту стають все більш складними, потреба в високоякісних навчальних даних тільки зростає. Постійно з’являються нові додатки та варіанти використання, для кожного з яких потрібні належним чином анотовані набори даних для навчання систем, які надійно працюють у певних областях. Удосконалені інструменти, які підвищують продуктивність працівників, кращі структури винагороди, які відображають цінність їхнього внеску, чи автоматизація, яка обробляє рутинні аспекти, зберігаючи людське судження у складних випадках, перетин людської праці та штучного інтелекту залишатиметься визначальною рисою розвитку ШІ в найближчі роки. Працівники, які маркують наш світ, багато в чому є неоспіваними архітекторами інтелектуальних систем, які дедалі більше формують наш технологічний ландшафт.
Джерело: BBC News


