Дивні китайські примхи ChatGPT розчаровують користувачів

ChatGPT OpenAI демонструє незвичайні лінгвістичні шаблони китайською мовою, викликаючи розчарування серед користувачів. Дізнайтеся, що спричиняє ці дивні лінгвістичні тики та чим вони відрізняються від англійської.
ChatGPT OpenAI продовжує домінувати в глобальних дискусіях про можливості штучного інтелекту, але популярний чат-бот відчуває неочікуваний культурний розрив, коли йдеться про мовну продуктивність. У той час як англомовні користувачі звикли до певних поведінкових примх у відповідях штучного інтелекту, китайськомовні користувачі стикаються з власним набором незвичайних мовних моделей, які однаково розчаровують і спантеличують.
Це явище підкреслює важливу проблему мовних моделей штучного інтелекту: адаптацію до нюансів різних мов і культурних контекстів. Вражаюча продуктивність ChatGPT в англійській мові зробила його загальновідомим, але його подорож на неанглійські ринки виявляє прогалини в тому, як модель обробляє та генерує текст у різних мовних системах. Для китайських користувачів ці прогалини проявлялися в особливий спосіб, який свідчить про те, що модель може боротися з тонкощами мови в специфічні та вимірювані способи.
Що робить цю ситуацію особливо цікавою, так це те, що лінгвістичні тики, які з’являються у відповідях ChatGPT китайською мовою, не просто представляють помилки чи непорозуміння. Натомість вони виглядають як систематичні шаблони, які повторюються в різних розмовах і контекстах. Користувачі задокументували випадки, коли відповіді чат-ботів містять незвичайні фрази, незграбні конструкції або вибір лексики, які носіям китайської мови здаються явно неприродними та дратівливими під час тривалих розмов.
Один особливо помітний лінгвістичний тик, який привернув увагу користувачів, стосується схильності чат-бота використовувати надто формальні чи архаїчні вирази в невідповідному контексті. Відповідаючи на випадкові або розмовні запити китайською мовою, ChatGPT іноді використовує надзвичайно формальні конструкції, які рідко з’являються в природній розмові. Це створює дисонанс між тим, що користувачі очікують від розмовного ШІ, і тим, що вони насправді отримують, що призводить до розчарування та зниження активності.
Це питання виходить за межі простих формальностей. Користувачі повідомили, що ChatGPT час від часу створює китайські речення з незручним порядком слів, незвичайним використанням частинок або граматично сумнівними конструкціями, які носій мови одразу визнав би неоптимальними. Ці помилки не перешкоджають розумінню, але вони позначають відповіді як явно нерідні та підривають користувальницький досвід для тих, хто прагне природної, вільної взаємодії з технологією.
Це явище представляє ширшу проблему, яка стоїть перед розробкою багатомовного штучного інтелекту. Незважаючи на те, що ChatGPT навчався на величезних наборах даних, які включали текст китайською мовою, якість і репрезентативність цих навчальних даних, здається, має обмеження. Можливо, модель піддавалася більшій кількості англомовного вмісту під час фази навчання, або алгоритми, які оптимізують роботу англійською мовою, можуть не перекладатися ефективно на китайські мовні структури, які працюють за принципово іншими лінгвістичними принципами.
Порівняння продуктивності ChatGPT різними мовами виявляє цікаві моделі того, як модель обробляє лінгвістичну інформацію. Англійською мовою користувачі часто повідомляють, що чат-бот створює граматично правильний, відповідний контексту та плавний текст. Проте та сама модель демонструє помітно різні характеристики під час генерування китайської мови, що свідчить про те, що механізми, що лежать в основі генерації мови, можуть залежати від мови за своєю ефективністю та надійністю.
Спеціальна фраза «постійно ловлю вас», яка з’явилася в деяких китайських відповідях ChatGPT, є прикладом незвичайних фраз, які спантеличують і засмучують користувачів. Такі вирази, незважаючи на те, що вони є технічно зрозумілими, здаються носіям мови чужими та вказують на те, що модель може генерувати відповіді за допомогою механізмів прямого перекладу, а не створення дійсно рідної мови. Ця відмінність має велике значення для користувачів, які покладаються на чат-бота для справжнього, природного спілкування.
OpenAI визнала існування лінгвістичних варіацій у різних мовних реалізаціях ChatGPT, хоча компанія не надала публічних детальних пояснень, чому ці варіації зберігаються. Організація продовжує інвестувати в покращення багатомовності за допомогою різних методів оптимізації та постійного коригування навчання. Однак темпи вдосконалення неанглійських мов, здається, відстають від швидких покращень, досягнутих у продуктивності англійської мови.
Для китайських користувачів і ширшої спільноти розробників ці лінгвістичні примхи піднімають важливі питання про те, як компанії штучного інтелекту надають пріоритет мовній підтримці та гарантії якості. Різниця в продуктивності між англійською та китайською мовами свідчить про те, що більше ресурсів і уваги було приділено вдосконаленню англійської версії моделі. Це відображає ширші галузеві тенденції, де розвитку англійської мови часто приділяється непропорційна увага порівняно з іншими основними мовами світу.
Вплив цих лінгвістичних тиків виходить за рамки простого роздратування користувача. Компанії, викладачі та професіонали, які намагаються використовувати ChatGPT для китайськомовних програм, стикаються з проблемами надійності. Якщо модель створює неприродний або технічно сумнівний китайський текст, її корисність значно зменшується для випадків використання, які вимагають високоякісного результату, наприклад, професійний письмовий текст, переклад або офіційне спілкування. Це обмеження спонукало деякі організації розробити обхідні шляхи або шукати альтернативні рішення для своїх китайськомовних потреб.
У перспективі вирішення цих лінгвістичних проблем вимагатиме постійних зусиль від OpenAI та інших організацій, які розробляють мовні моделі. Потенційні рішення включають збільшення доступу до високоякісних навчальних даних китайської мови, розробку методів оптимізації, характерних для китайської мови, а також більш суворе тестування та механізми зворотного зв’язку за участю носіїв мови. Метою має бути досягнення паритету між англійською та китайською мовами, гарантуючи, що всі користувачі зможуть отримати однаково природне та ефективне спілкування за допомогою штучного інтелекту незалежно від їхніх мовних уподобань.
Ситуація з китайською лінгвістичною технікою ChatGPT зрештою ілюструє важливий урок у розробці штучного інтелекту: створення справді глобальної технології вимагає уваги до специфічних характеристик, нюансів і вимог різноманітних мов і культур. Оскільки штучний інтелект все більше інтегрується в глобальну комунікацію та торгівлю, забезпечення однаково ефективної роботи цих систем усіма основними мовами стає не лише технічною проблемою, але й питанням справедливості та доступу. Найближчі місяці та роки покажуть, чи зможуть OpenAI і ширша спільнота штучного інтелекту належним чином усунути ці багатомовні прогалини в продуктивності.
Джерело: Wired


