Нові TPU від Google починають еру AI Agent

Google представляє процесори TPU8t і TPU8i восьмого покоління, розроблені спеціально для систем агентного штучного інтелекту, які пропонують швидше навчання та ефективні можливості висновку.
Спеціальні блоки обробки тензорів Google протягом тривалого часу слугували основою хмарної інфраструктури компанії, пропонуючи переконливу альтернативу прискорювачам Nvidia, які домінують у більшості галузі. У той час як конкуренти намагаються захистити кожен доступний графічний процесор, Google постійно інвестує в розробку власного спеціалізованого кремнію, спеціально розробленого для робочих навантажень штучного інтелекту. Після успішного запуску процесорів Ironwood TPU сьомого покоління в 2025 році Google анонсує процесори TPU восьмого покоління, знаменуючи значний крок вперед у прагненні компанії створювати апаратне забезпечення, розроблене з нуля для передових програм ШІ.
Нове покоління представляє фундаментальну зміну в підходах Google до розробки процесорів для штучного інтелекту. Замість того, щоб просто повторювати існуючу архітектуру з вищими тактовими частотами та більшою кількістю транзисторів, команди інженерів Google визнали, що нова ера агентних систем штучного інтелекту вимагає повністю переосмисленого апаратного підходу. Компанія представляє два різних варіанти TPU восьмого покоління: TPU8t, оптимізований для операцій навчання моделей, і TPU8i, розроблений спеціально для завдань логічного висновку. Ця роздвоєна філософія дизайну відображає віру Google у те, що сучасні робочі навантаження штучного інтелекту мають різні вимоги, які вимагають спеціалізованих апаратних рішень, а не універсальних процесорів.
TPU8t було розроблено з особливою метою: прискорення етапу інтенсивного обчислення, який перетворює необроблений код моделі у функціональні системи ШІ. Перш ніж будь-яку модель штучного інтелекту можна буде розгорнути для аналізу даних, створення прогнозів або створення контенту, вона має пройти тривале навчання на масивних наборах даних у сотнях чи тисячах процесорів. Ця фаза навчання історично була однією з найдовших вузьких місць у розробці штучного інтелекту, оскільки для граничних моделей іноді потрібні місяці безперервних обчислень. Google стверджує, що, використовуючи спеціалізовану архітектуру TPU8t, розробники можуть скоротити ці багатомісячні цикли навчання лише до тижнів, докорінно змінюючи темп, з яким організації можуть ітерувати та вдосконалювати свої системи ШІ.
TPU8i, орієнтований на логічні висновки, вирішує не менш важливе, але принципово інше завдання в життєвому циклі ШІ. Після того, як модель навчена та готова до розгортання у виробництві, фокус зміщується з простої обчислювальної пропускної здатності на ефективність, затримку та економічну ефективність. TPU8i був спеціально оптимізований для обробки робочих навантажень висновків — фактичного виконання навчених моделей, які обробляють запити користувачів і генерують вихідні дані. У контексті агентних систем штучного інтелекту, які повинні працювати безперервно та майже в реальному часі реагувати на взаємодії користувача, ефективність висновків стає критичною. Завдяки спеціалізації апаратного забезпечення для цього конкретного випадку використання Google може забезпечити швидший час відповіді, споживаючи менше енергії на операцію висновку, безпосередньо покращуючи взаємодію з користувачем і операційні витрати.
Рішення Google розробити окремі процесори навчання та логічного висновку відображає глибше розуміння того, чим «ера агентів» відрізняється від попередніх поколінь технології ШІ. В епоху великих мовних моделей і базових моделей різниця між навчанням і висновком була менш критичною, оскільки моделі навчалися один раз, а потім розгорталися відносно незмінними. Однак агентські системи — агенти ШІ, здатні виконувати незалежні дії, планувати багатоетапні операції та адаптуватися до нової інформації — мають принципово інші вимоги до продуктивності. Ці системи можуть постійно оновлювати свої моделі, експериментувати з новими підходами та вимагати можливості миттєвого прийняття рішень. Нова філософія дизайну TPU визнає ці реалії, забезпечуючи апаратне забезпечення, яке перевершує кожну конкретну фазу, а не компроміси на обох.
Стратегічну важливість спеціального кремнію неможливо переоцінити в контексті амбіцій Google щодо ШІ. У той час як графічні процесори Nvidia стали фактичним стандартом для навчання та розгортання штучного інтелекту в більшості індустрії технологій, Google постійно зосереджується на розробці власних альтернатив. Такий підхід надає Google кілька переваг: повний контроль над апаратними планами, можливості оптимізації, характерні для стека програмного забезпечення Google, і можливість інтегрувати нові функції, адаптовані до конкретних програм AI від Google. TPU восьмого покоління є кульмінацією років інвестицій у цю стратегію вертикальної інтеграції.
Покращення продуктивності, які забезпечує нове покоління TPU, виходять за межі простого збільшення швидкості. Google вклав значні зусилля у вдосконалення підсистеми пам’яті, архітектури зв’язку та енергоефективності процесорів. Ці цілісні вдосконалення означають, що організації, які використовують TPU8t і TPU8i, можуть досягти кращої продуктивності на ватт — критично важливий показник в епоху, коли енергоспоживання та охолодження центрів обробки даних є основними операційними витратами. Оскільки витрати на інфраструктуру штучного інтелекту продовжують зростати, підвищення ефективності стає все більш цінним як для постачальників хмарних технологій, так і для підприємств.
У перспективі стратегія Google щодо цих нових процесорів відображає впевненість компанії у своїй позиції на ринку ШІ, що швидко розвивається. Продовжуючи інвестувати в користувацькі прискорювачі штучного інтелекту, Google не лише підтримує власні дослідження та розробки штучного інтелекту, але й пропонує клієнтам Google Cloud альтернативу ландшафту, де домінує GPU. Організації, які побудували свою інфраструктуру на базі Google Cloud і TPU, можуть негайно використати ці вдосконалення, водночас потенційно отримуючи конкурентні переваги завдяки кращому часу навчання та ефективнішим операціям висновків.
Оголошення TPU восьмого покоління також свідчить про довгострокове зобов’язання Google бути не просто хмарним постачальником, що пропонує стороннє обладнання. Розробляючи спеціалізовані процесори, розроблені для конкретних вимог агентських систем штучного інтелекту, Google позиціонує себе як постачальника комплексних рішень для організацій, які здійснюють перехід до цієї нової обчислювальної парадигми. Клієнти тепер можуть отримати доступ до спеціально створеного апаратного забезпечення, яке обіцяє максимально підвищити продуктивність і ефективність у всьому спектрі робочих навантажень штучного інтелекту, чи то для навчання, чи для висновків, чи для обох.
Джерело: Ars Technica


