Новые TPU от Google положили начало эре AI-агентов

Google представляет процессоры TPU8t и TPU8i восьмого поколения, разработанные специально для систем агентного искусственного интеллекта и предлагающие более быстрое обучение и эффективные возможности вывода.
Специальные тензорные процессоры Google уже давно служат основой облачной инфраструктуры компании, предлагая убедительную альтернативу ускорителям Nvidia, которые доминируют в большей части отрасли. В то время как конкуренты изо всех сил пытаются защитить каждый доступный графический процессор, Google постоянно инвестирует в разработку собственного специализированного чипа, специально предназначенного для рабочих нагрузок искусственного интеллекта. После успешного запуска Ironwood TPU седьмого поколения в 2025 году Google анонсирует процессоры TPU восьмого поколения, что знаменует собой значительный шаг вперед в стремлении компании создавать оборудование, разработанное с нуля для передовых приложений искусственного интеллекта.
Новое поколение представляет собой фундаментальный сдвиг в подходе Google к разработке процессоров для искусственного интеллекта. Вместо того, чтобы просто повторять существующую архитектуру с более высокими тактовыми частотами и большим количеством транзисторов, команда инженеров Google осознала, что наступающая эра агентных систем искусственного интеллекта требует полностью переосмысленного аппаратного подхода. Компания представляет два различных варианта TPU восьмого поколения: TPU8t, оптимизированный для операций обучения моделей, и TPU8i, разработанный специально для задач вывода. Эта философия раздвоенного дизайна отражает убеждение Google в том, что современные рабочие нагрузки искусственного интеллекта предъявляют разные требования, которые требуют специализированных аппаратных решений, а не универсальных процессоров.
TPU8t был разработан с единственной целью: ускорить этап интенсивного вычислительного обучения, который преобразует необработанный код модели в функциональные системы искусственного интеллекта. Прежде чем любую модель ИИ можно будет использовать для анализа данных, генерации прогнозов или создания контента, она должна пройти обширное обучение на огромных наборах данных на сотнях или тысячах процессоров. Этот этап обучения исторически был одним из самых длительных узких мест в разработке ИИ: передовые модели иногда требовали месяцев непрерывных вычислений. Google утверждает, что, используя специализированную архитектуру TPU8t, разработчики могут сократить эти многомесячные циклы обучения до нескольких недель, что фундаментально изменит скорость, с которой организации могут выполнять итерации и совершенствовать свои системы искусственного интеллекта.
TPU8i, ориентированный на логический вывод, решает не менее важную, но принципиально другую задачу жизненного цикла искусственного интеллекта. После того как модель обучена и готова к промышленному развертыванию, акцент смещается с чистой вычислительной производительности на эффективность, задержку и экономичность. TPU8i был специально оптимизирован для обработки рабочих нагрузок вывода — фактического выполнения обученных моделей, обработки запросов пользователей и генерации выходных данных. В контексте агентных систем искусственного интеллекта, которые должны работать непрерывно и реагировать на взаимодействия с пользователем практически в реальном времени, эффективность вывода становится критически важной. Специализируя оборудование для этого конкретного случая использования, Google может обеспечить более быстрое время отклика, потребляя при этом меньше энергии на операцию вывода, что напрямую улучшает как удобство работы пользователей, так и эксплуатационные расходы.
Решение Google разработать отдельные процессоры обучения и вывода отражает более глубокое понимание того, чем «эра агентов» отличается от предыдущих поколений технологий искусственного интеллекта. В эпоху больших языковых моделей и базовых моделей различие между обучением и выводом было менее критичным, поскольку модели обучались один раз, а затем применялись относительно без изменений. Однако агентные системы — агенты ИИ, способные предпринимать независимые действия, планировать многоэтапные операции и адаптироваться к новой информации — имеют принципиально иные требования к производительности. Эти системы могут постоянно обновлять свои модели, экспериментировать с новыми подходами и требовать возможности мгновенного принятия решений. Новая философия проектирования TPU учитывает эти реалии, предоставляя оборудование, которое превосходно работает на каждом конкретном этапе, а не идет на компромисс в обоих случаях.
Стратегическую важность специализированных микросхем невозможно переоценить в контексте амбиций Google в области искусственного интеллекта. Хотя графические процессоры Nvidia стали де-факто стандартом для обучения и развертывания искусственного интеллекта в большинстве технологических компаний, Google постоянно уделяет внимание разработке собственных альтернатив. Такой подход дает Google несколько преимуществ: полный контроль над аппаратными планами, возможности оптимизации, специфичные для программного стека Google, а также возможность интеграции новых функций, адаптированных к конкретным приложениям искусственного интеллекта Google. TPU восьмого поколения представляют собой кульминацию многолетних инвестиций в эту стратегию вертикальной интеграции.
Повышение производительности, обеспечиваемое новым поколением TPU, выходит за рамки простого увеличения скорости. Google вложила значительные инженерные усилия в улучшение подсистемы памяти, коммуникационной архитектуры и энергоэффективности процессоров. Эти комплексные улучшения означают, что организации, использующие TPU8t и TPU8i, могут добиться более высокой производительности на ватт — важнейшего показателя в эпоху, когда энергопотребление и охлаждение центров обработки данных представляют собой основные эксплуатационные расходы. Поскольку расходы на инфраструктуру искусственного интеллекта продолжают расти, повышение эффективности становится все более ценным как для поставщиков облачных услуг, так и для предприятий.
В перспективе стратегия Google в отношении этих новых процессоров отражает уверенность компании в своей позиции на быстро развивающемся рынке искусственного интеллекта. Продолжая инвестировать в специальные ускорители искусственного интеллекта, Google не только поддерживает свои собственные исследования и разработки в области искусственного интеллекта, но и предлагает клиентам Google Cloud альтернативу сфере, где доминируют графические процессоры. Организации, построившие свою инфраструктуру на основе Google Cloud и TPU, могут немедленно воспользоваться этими улучшениями, потенциально получая при этом конкурентные преимущества за счет сокращения времени обучения и более эффективных операций вывода.
Анонс TPU восьмого поколения также свидетельствует о долгосрочном стремлении Google стать больше, чем просто поставщиком облачных услуг, предлагающим оборудование сторонних производителей. Разрабатывая специализированные процессоры, предназначенные для конкретных требований агентных систем искусственного интеллекта, Google позиционирует себя как поставщика комплексных решений для организаций, осуществляющих переход к этой новой вычислительной парадигме. Будь то обучение, вывод или и то, и другое, клиенты теперь могут получить доступ к специально созданному оборудованию, которое обещает максимизировать производительность и эффективность во всем спектре рабочих нагрузок ИИ.
Источник: Ars Technica


