Apple расширяет возможности доступа к искусственному интеллекту на всех устройствах

Apple представляет передовые инструменты доступности на базе искусственного интеллекта, включая распознавание речи для видео, улучшенные описания VoiceOver и функции интеллектуального увеличения.
Apple объявила о комплексном обновлении своих функций специальных возможностей во всей своей экосистеме, ознаменовав значительный сдвиг в сторону интеграции обработки искусственного интеллекта на устройстве с инструментами, предназначенными для пользователей с ограниченными возможностями. Последнее обновление компании предназначено для пользователей iPhone, Mac и Vision Pro, демонстрируя новое стремление сделать технологии более инклюзивными за счет интеллектуальной автоматизации и возможностей машинного обучения.
В центре этого объявления рассказывается о том, как Apple Intelligence трансформирует вспомогательные технологии на нескольких платформах. Вместо того чтобы полагаться на облачную обработку, Apple отдала приоритет обработке искусственного интеллекта на устройстве, чтобы обеспечить конфиденциальность пользователей и одновременно предоставить мощные функциональные возможности. Такой подход позволяет таким функциям, как VoiceOver, Magnifier, Voice Control и недавно представленному средству чтения специальных возможностей, работать бесперебойно, не передавая конфиденциальные пользовательские данные на внешние серверы.
Среди наиболее привлекательных нововведений можно отметить появление функции распознавания речи на устройстве для видеоконтента без субтитров. Эта функция представляет собой большой прорыв для глухих или слабослышащих пользователей, поскольку она автоматически генерирует субтитры для видео, в которых отсутствуют профессиональные субтитры. Эта функциональность будет реализована на iPhone, iPad, Mac, Apple TV и Apple Vision Pro, обеспечивая единый уровень доступности независимо от того, какое устройство предпочитают пользователи.
Техническая реализация этой системы распознавания речи демонстрирует инвестиции Apple в возможности обработки в реальном времени. Запуская распознавание речи локально на устройствах, а не отправляя видеоконтент на облачные серверы, Apple гарантирует, что конфиденциальные видеоматериалы останутся конфиденциальными, но при этом получат точные и немедленные субтитры. Система постоянно обучается и совершенствуется посредством машинного обучения на устройстве, адаптируясь к различным акцентам, языкам и качеству звука без сбора внешних данных.
Помимо субтитров к видео, Apple расширяет Проводник изображений VoiceOver, добавляя существенно улучшенные описательные возможности на основе искусственного интеллекта. Обновленная функция будет генерировать более подробные и контекстно-релевантные описания изображений, что позволит пользователям с нарушениями зрения лучше понимать визуальный контент, встречающийся в приложениях и на веб-сайтах. Эти описания выходят за рамки простого распознавания объектов и предоставляют повествовательный контекст о пространственных отношениях, цветах и композиции, который помогает пользователям создать более богатую мысленную картину содержания изображения.
Усовершенствование VoiceOver представляет собой месяцы разработки, направленной на понимание того, какие описания оказываются наиболее полезными для слепых и слабовидящих пользователей. Apple работала с защитниками доступности и самими пользователями над обучением этих моделей искусственного интеллекта, гарантируя, что в создаваемых описаниях приоритет отдается информации, которая улучшает понимание, а не перегружает пользователей ненужными техническими деталями. Система учится на отзывах пользователей, со временем повышая точность описания.
Приложение Apple Magnifier также претерпело значительные улучшения благодаря интеллектуальной обработке ИИ. Обновленная лупа теперь может анализировать текст в режиме реального времени, предоставляя контекстную информацию, которая помогает пользователям понять, что они просматривают. Одним из особенно полезных примеров является сканирование счетов за коммунальные услуги или финансовых документов: теперь система может идентифицировать и объяснять ключевую информацию, преобразуя сложный визуальный документ в понятную устную информацию. Эта возможность распространяется на квитанции, флаконы с лекарствами и другие предметы с большим количеством текста, которые пользователям часто приходится быстро интерпретировать.
Время для этих объявлений подчеркивает признание Apple того, что доступность не следует рассматривать как второстепенную мысль, а, скорее, следует интегрировать в разработку платформы с самого начала. Встраивая расширенные возможности искусственного интеллекта в функции специальных возможностей, Apple гарантирует, что вспомогательные технологии будут идти в ногу со сложностью основных функций, избегая двухуровневой системы, в которой специальные возможности отстают от общей функциональности.
Голосовое управление получает существенные обновления благодаря улучшениям ИИ на устройстве. Теперь система предлагает улучшенное понимание команд на естественном языке, позволяя пользователям с двигательными нарушениями или тем, кто предпочитает голосовое взаимодействие, управлять своими устройствами с большей точностью и гибкостью. Вместо необходимости жесткой структуры команд улучшенное голосовое управление может интерпретировать различные фразы, делая взаимодействие более естественным и менее разочаровывающим.
<изображение src="https://platform.theverge.com/wp-content/uploads/sites/2/2026/05/Apple-accessibility-features-g enered-subtitles.jpg?quality=90&strip=all&crop=0%2C23.350694444444%2C100%2C53.298611111111&w=2400" alt="Голосовое управление AI обеспечивает доступность настроек iPhone iPad Mac" />Недавно представленная Apple программа Accessibility Reader расширяет возможности чтения во всей экосистеме платформы. Эта функция использует обработку естественного языка для чтения текстового содержимого вслух естественным голосом, одновременно выделяя читаемый текст. Система может работать с несколькими приложениями и веб-сайтами, обеспечивая постоянную помощь при чтении, независимо от того, сталкиваются ли пользователи с документами, статьями или текстом интерфейса в течение дня.
Реализация этих функций отражает более широкую философию Apple в отношении искусственного интеллекта и конфиденциальности. Вместо того, чтобы рассматривать доступность как отдельную проблему от конфиденциальности и безопасности, компания разработала эти инструменты для защиты пользовательской информации, обеспечивая при этом сложные функциональные возможности. Эта интеграция гарантирует, что доступность не требует ущерба конфиденциальности, что очень важно для пользователей, которые могут чувствовать себя уязвимыми, полагаясь на вспомогательные технологии.
Забегая вперед, Apple сообщает, что большинство этих функций станут доступны в течение 2026 года, а их поэтапное внедрение призвано обеспечить стабильность и качество. Компания тесно сотрудничает с организациями, занимающимися вопросами специальных возможностей, и группами пользователей, чтобы собирать отзывы в ходе разработки и гарантировать, что окончательные реализации действительно будут учитывать потребности пользователей, а не просто устанавливать галочки для специальных возможностей.
Расширение функций доступности на основе искусственного интеллекта делает Apple лидером в области разработки инклюзивных технологий. Демонстрируя, что сложный искусственный интеллект может улучшить, а не усложнить вспомогательные технологии, Apple предлагает модель, которой могут следовать другие технологические компании. Эти заявления предполагают, что будущее доступности заключается не в выборе между расширенными функциями и поддержкой специальных возможностей, а в признании того, что продуманная реализация искусственного интеллекта может служить обеим группам населения одновременно.
Источник: The Verge


