Как рабочие обучают ИИ обнаруживать объекты

Узнайте, как тысячи рабочих маркируют фотографии и видео, чтобы научить системы искусственного интеллекта распознавать повседневные предметы. Исследуйте человеческую рабочую силу, стоящую за искусственным интеллектом.
В основе современных систем искусственного интеллекта лежит удивительно человеческий фактор: тысячи рабочих тщательно маркируют фотографии и видеокадры, чтобы научить машины распознавать объекты в реальном мире. Этот процесс разметки данных, хотя его часто упускают из виду, представляет собой важнейшую основу, на которой строятся современные самые сложные модели компьютерного зрения. Без этих преданных своему делу работников, тщательно комментирующих изображения, интеллектуальным системам, на которых работает все, от автономных транспортных средств до программного обеспечения для медицинских изображений, не хватит обучающих данных, необходимых для эффективной работы.
Процесс обучения ИИ посредством аннотирования изображений стал важной отраслевой практикой в технологических компаниях всех размеров. Рабочие часами сидят за компьютерами каждый день, кадр за кадром просматривая фотографии и видеозаписи, идентифицируя и отмечая все: от пешеходов и транспортных средств до уличных знаков и особенностей зданий. Каждая метка представляет собой точку данных, которая помогает алгоритмам машинного обучения понимать закономерности и различия между различными объектами. Этот управляемый человеком подход к машинному обучению по большей части остается невидимым для потребителей, однако он абсолютно необходим для функциональности продвинутых приложений искусственного интеллекта в повседневном использовании.
Значение этой работы выходит далеко за рамки простых задач распознавания изображений. Системы компьютерного зрения, обученные на тщательно размеченных наборах данных, используются в важнейших приложениях в здравоохранении, транспорте, безопасности и многих других секторах. Когда медицинские работники используют ИИ для диагностики заболеваний на основе изображений, эта система была обучена работниками, которые маркировали тысячи похожих изображений. Когда беспилотные транспортные средства безопасно передвигаются по городским улицам, они полагаются на возможности распознавания, отточенные за счет обширной маркировки реальных сценариев вождения. Качество и полнота этих ярлыков напрямую влияют на то, насколько хорошо системы ИИ работают в своих предполагаемых приложениях.
Персонал, занимающийся аннотированием изображений, чрезвычайно разнообразен и распределен по всему миру. Многие компании передают эту работу специализированным фирмам и платформам, которые помогают работникам выполнять задачи по маркировке. Эти платформы позволили быстро масштабировать усилия по аннотированию, позволяя компаниям относительно быстро маркировать миллионы изображений. Сотрудники имеют различное образование и профессиональную подготовку, привнося разные точки зрения и внимание к деталям в своей работе по маркировке. Демократизация обучения искусственному интеллекту с помощью этих платформ создала новые возможности трудоустройства в регионах по всему миру.
Механика работы с маркировкой часто оказывается более сложной, чем кажется на первый взгляд. Работники должны понимать и применять подробные системы классификации, иногда используя специализированные программные интерфейсы, предназначенные для эффективного аннотирования. Например, маркировка фотографии уличной сцены может потребовать идентификации не только присутствия автомобилей, но также их типа, цвета, ориентации и частичной видимости. Видеоаннотации добавляют еще один уровень сложности, поскольку работникам приходится отслеживать объекты в нескольких кадрах и поддерживать согласованность их маркировки на протяжении всей последовательности. Эта точность очень важна, поскольку любые ошибки или несоответствия в обучающих данных могут снизить производительность полученной модели ИИ.
Различные типы объектов представляют разный уровень сложности аннотаций. Некоторые предметы, например хорошо видимые транспортные средства или люди, относительно легко идентифицировать и маркировать. Другие объекты оказываются гораздо более сложными: частично затемненные предметы, объекты под необычными углами или предметы, классификация которых может быть неоднозначной, требуют квалифицированного суждения и тщательного рассмотрения. Рабочие должны развивать навыки различения похожих объектов и понимания контекстных подсказок, которые помогают идентифицировать элементы изображения, которые в противном случае могли бы оказаться неоднозначными. Это тонкое понимание невозможно автоматизировать, поэтому человеческое суждение становится неоценимым для процесса обучения.
Структура вознаграждения за работу по аннотированию данных значительно варьируется в зависимости от сложности задач, географического расположения работников и платформы, управляющей работой. Некоторые работники получают скромную почасовую оплату, в то время как другие получают вознаграждение за изображение или за выполненное задание. Экономическое воздействие на отдельных работников варьируется от дополнительного дохода в развитых странах до значительной первичной занятости в развивающихся регионах. Несмотря на существенный характер этой работы, правозащитные группы выражают обеспокоенность по поводу обеспечения справедливой заработной платы и надлежащих условий труда для растущей глобальной рабочей силы, занимающейся подготовкой данных ИИ.
Обеспечение качества представляет собой еще один важный аспект экосистемы аннотаций. Платформы маркировки данных искусственного интеллекта обычно реализуют несколько механизмов проверки для обеспечения точности и согласованности. Это часто предполагает, что несколько работников независимо маркируют одни и те же изображения, а окончательная маркировка определяется консенсусным подходом. Эксперты-рецензенты периодически проверяют образцы выполненной работы, чтобы выявить закономерности ошибок или недоразумений. Эти меры контроля качества необходимы, поскольку вся эффективность получаемой системы ИИ зависит от точности ее обучающих данных. «Мусор на входе, мусор на выходе» остается таким же актуальным в машинном обучении, как и в любой другой области вычислений.
Масштаб работ по маркировке, необходимых для современных систем искусственного интеллекта, почти непостижимо велик. Крупные технологические компании и исследовательские институты искусственного интеллекта управляют проектами аннотаций, включающими миллионы изображений и видео. Один проект разработки беспилотного транспортного средства может потребовать маркировки миллионов кадров реальных видеозаписей вождения. Большим языковым моделям, обученным на визуальной информации, необходимы обширные наборы данных аннотированных изображений для изучения надежных представлений объектов и сцен. Огромный объем необходимой работы по аннотированию означает, что она по-прежнему остается прерогативой людей, несмотря на значительные исследования по автоматизации различных аспектов процесса.
Новые технологии начинают дополнять традиционные методы ручного аннотирования. Полуавтоматические инструменты маркировки используют предварительные модели искусственного интеллекта для создания первоначальных аннотаций, которые рабочие могут затем просмотреть и исправить, что потенциально ускоряет весь процесс. Методы активного обучения пытаются определить, какие изображения наиболее ценны для маркировки, концентрируя усилия человека на наиболее информативных примерах. Эти гибридные подходы направлены на повышение эффективности и снижение общей стоимости создания наборов обучающих данных при сохранении стандартов качества, необходимых для высокопроизводительных систем искусственного интеллекта. Однако человеческое мнение и контроль остаются важными компонентами этих рабочих процессов.
Этические аспекты обучения ИИ с помощью человеческих аннотаций становятся все более важными по мере роста осведомленности об этой практике. Работники заслуживают справедливой компенсации, разумных условий труда и ясности в отношении того, как используются их вклады. Сами данные поднимают вопросы о конфиденциальности, согласии и о том, как изображения реальных людей и мест перепрофилируются для коммерческой разработки ИИ. Организации, работающие в этой сфере, обязаны открыто решать эти проблемы и устанавливать этические принципы, уважающие как участвующих работников, так и субъектов, чьи изображения появляются в наборах обучающих данных.
В будущем роль людей в обучении ИИ, скорее всего, будет развиваться, а не исчезать. По мере того как системы искусственного интеллекта становятся все более сложными, потребность в высококачественных обучающих данных только возрастает. Постоянно появляются новые приложения и варианты использования, каждый из которых требует соответствующих аннотированных наборов данных для обучения систем, которые надежно работают в определенных областях. Будь то улучшенные инструменты, повышающие производительность труда работников, лучшие структуры вознаграждения, отражающие ценность их вклада, или автоматизация, которая обрабатывает рутинные аспекты, сохраняя при этом человеческое суждение в сложных случаях, пересечение человеческого труда и искусственного интеллекта останется определяющей чертой развития ИИ в ближайшие годы. Рабочие, которые навешивают ярлыки на наш мир, во многом являются незамеченными архитекторами интеллектуальных систем, которые все больше формируют наш технологический ландшафт.
Источник: BBC News


