Окуляри AI від Google: ми тестуємо майбутнє

Прототип окулярів Android XR від Google накладає такі функції Gemini, як переклад у реальному часі та навігація. Ось що ми виявили під час нашого практичного тесту.
Google тихо працював над майбутнім носимих технологій і нещодавно оприлюднив захоплюючий погляд на те, як це майбутнє може виглядати. Компанія продемонструвала свій останній прототип окулярів Android XR, пару інноваційних розумних окулярів, які обіцяють змінити те, як ми взаємодіємо з цифровою інформацією в реальному світі. Це не типові пристрої доповненої реальності. Натомість вони являють собою складну інтеграцію штучного інтелекту безпосередньо в поле зору, що робить інформацію доступною без потреби діставати смартфон.
Під час нашої практичної оцінки прототипу ми виявили, що Google досягла значних успіхів у наближенні окулярів зі штучним інтелектом до стандартної життєздатності. Пристрій плавно накладає цифровий вміст на ваше природне поле зору за допомогою вдосконаленої технології Gemini AI від Google. Найбільше нас вразило те, як система розумно керує щільністю інформації, показуючи релевантні деталі саме тоді і там, де вони вам потрібні, не перевантажуючи ваш візуальний простір і не створюючи відчуття постійного цифрового втручання, яке переслідувало попередні спроби AR.
Можливості перекладу, вбудовані в ці окуляри, представляють одне з найбільш практичних застосувань, які ми бачили. У режимі реального часу, коли хтось розмовляє з вами іноземною мовою, система відображає перекладену версію його слів у нижній частині вашого поля зору. Ця функція виходить за рамки простого перекладу тексту — система інтерпретує контекст, ідіоми та культурні нюанси, роблячи розмову між людьми, які розмовляють різними мовами, надзвичайно природною. Для професіоналів міжнародного бізнесу, мандрівників і мультикультурних спільнот лише ця функція може виявитися кардинальною.
Навігація — ще одна наріжна функція платформи Android XR. Замість того, щоб постійно перевіряти програму карти вашого телефону, маршрути природно відображаються у вашому полі зору у вигляді стрілок напрямків і контекстних орієнтирів, накладених на фактичні вулиці попереду. Система розпізнає важливі будівлі, перехрестя та географічні об’єкти в режимі реального часу, забезпечуючи інтуїтивно зрозумілі навігаційні підказки та інтегровані в ваше оточення. Під час нашого тестування в міському середовищі цей підхід виявився набагато менш відволікаючим, ніж традиційна навігація на основі смартфона, але залишався надзвичайно точним.
Саме апаратне забезпечення забезпечує цікавий баланс між функціональністю та можливістю носіння. Інженери Google розробили окуляри значно легшими та менш вражаючими, ніж апаратне забезпечення AR попередніх поколінь, хоча вони все одно помітно суттєвіші за звичайні окуляри. Оправи мають ретельно розташовані оптичні елементи, які проектують цифрові зображення на прозорі лінзи, дозволяючи користувачам бачити як фізичний світ, так і цифрові накладки одночасно. Термін служби батареї залишається проблемою — під час наших сеансів тестування було виявлено приблизно чотири-п’ять годин безперервного використання, перш ніж вимагати підзарядки, хоча це є значним прогресом порівняно з попередніми прототипами.
Що дійсно відрізняє ці окуляри, так це базова інтеграція ШІ через Gemini. Система не просто відображає статичну інформацію; натомість він активно розуміє контекст і передбачає потреби користувачів. Наприклад, коли ви дивитесь на вітрину ресторану, окуляри можуть розпізнати її та негайно вивести відповідну інформацію: години роботи, відгуки клієнтів, основні моменти меню та наявність бронювання. Це контекстне усвідомлення поширюється на незліченну кількість сценаріїв, від визначення видів рослин під час прогулянок на природі до надання технічних характеристик під час огляду продуктів.
Дизайн інтерфейсу користувача демонструє значну продуманість у тому, як інформація повинна бути представлена в середовищах AR. Замість того щоб захаращувати все ваше поле зору даними, система використовує інтелектуальне визначення пріоритетів. Більшість інформації з’являється у вашому периферичному зорі, стаючи більш помітним лише тоді, коли ви спрямовуєте на неї увагу. Голосові команди доповнюють розпізнавання жестів, забезпечуючи природню та ненав’язливу взаємодію без використання рук. Під час нашого тестування ми виявили, що крива навчання була напрочуд мінімальною — більшість користувачів навчилися працювати з інтерфейсом за кілька хвилин, а не за години.
Функції камери, інтегровані в окуляри, відкривають додаткові можливості, окрім тих, які ми спостерігали на поточній стадії прототипу. Система може фіксувати те, що ви бачите, записувати відео з вашої реальної перспективи та використовувати комп’ютерне бачення для визначення об’єктів, тексту та місць у реальному часі. Це перетворює окуляри на комплексний інструмент документування, який фіксує не лише те, що сталося, але й те, на що ви дивитесь і на чому зосереджуєтеся у важливі моменти.
З технічної точки зору, система штучного інтелекту Gemini, яка працює в цих окулярах, демонструє надзвичайні можливості обробки. Система обробляє складні завдання локально на пристрої, плавно перевантажуючи складніші обчислення на хмарні сервери, коли це необхідно. Цей гібридний підхід забезпечує швидке реагування на негайні завдання, як-от переклад, і водночас забезпечує більш складний аналіз для таких дій, як розуміння сцени в реальному часі та пошук контекстної інформації.
Однак наше тестування виявило області, де технологія все ще потребує вдосконалення. Умови освітлення суттєво впливають на видимість дисплея — при яскравому сонячному світлі на відкритому повітрі деякий вміст стає важче читати, хоча це радше є інженерною проблемою, ніж основним недоліком. Крім того, система розпізнавання жестів іноді неправильно інтерпретувала рухи рук, вимагаючи голосового підтвердження для виконання певних команд. Здається, що ці проблеми можна вирішити за допомогою оновлень програмного забезпечення та вдосконалення апаратного забезпечення, а не через нездоланні перешкоди.
З будь-яким пристроєм, який постійно спостерігає за навколишнім світом, важливі питання конфіденційності. Google включив функції захисту конфіденційності, зокрема чіткі індикатори, коли запис активний, і користувач контролює, які дані обробляє та зберігає пристрій. Тим не менш, сама концепція постійного візуального запису викликає законне занепокоєння, яке суспільство має вирішити, оскільки ця технологія розвивається та потенційно стане основною.
Розвиток технології окулярів AR також піднімає важливі питання щодо цифрової справедливості та доступності. Якщо ці пристрої врешті-решт стануть звичайним явищем, вони можуть надати надзвичайну користь людям із вадами слуху через субтитри в реальному часі або особам із відмінностями у візуальній обробці завдяки налаштованому представленню інформації. І навпаки, якщо доступ залишатиметься обмеженим для заможних перших користувачів, технологія може посилити існуючу нерівність у доступі до інформації та комунікаційних можливостях.
Дивлячись у майбутнє, схоже, що платформа Android XR від Google може стати значним гравцем у сфері носимих технологій. Інтеграція компанією своїх потужних можливостей штучного інтелекту з продуманим апаратним забезпеченням і принципами користувальницького інтерфейсу створює переконливе бачення того, як цифрова інформація може бути бездоганно вплетена в повсякденне життя. Технологія все ще потребує додаткового вдосконалення, зокрема щодо тривалості роботи батареї, яскравості дисплея та точності розпізнавання жестів, але фундаментальний підхід здається надійним і багатообіцяючим.
Конкурентний ландшафт також заслуговує на увагу. Apple розробляє власну гарнітуру Vision Pro, тоді як Meta продовжує інвестувати значні кошти в доповнену реальність, орієнтовану на метавсесвіт. Однак підхід Google до окулярів Android XR націлений на інший сегмент ринку — пристрої для щоденного носіння, призначені для практичних реальних застосувань, а не для розширених сеансів занурення чи спеціалізованих випадків використання. Таке позиціонування може виявитися вигідним, якщо компанія успішно мініатюризує технологію та зменшить витрати на комерційний випуск.
На завершення наша практична оцінка прототипу окулярів штучного інтелекту від Google залишила нас щиро враженими тим, наскільки далеко просунулася ця технологія. Хоча нинішнє покоління залишається прототипом, який потребує додаткового вдосконалення, основні концепції здаються зрілими та реалізованими. Інтеграція інтелекту на базі Gemini з продумано розробленим обладнанням та елементами інтерфейсу створює щось справді корисне, а не просто нове. Якщо Google успішно подолає решту технічних проблем і вирішить законні проблеми конфіденційності, ці окуляри можуть стати справжньою точкою перелому в тому, як ми взаємодіємо з інформацією та орієнтуємось у світі навколо нас.
Джерело: TechCrunch


