Google представила восьмое поколение TPU с разделением на чипы для обучения и вывода
На конференции Google Cloud Next 2026 компания Google официально анонсировала восьмое поколение своих тензорных процессоров (TPU). Впервые в истории компании задачи обучения и вывода ИИ были разделены на два независимых чипа: TPU 8t для обучения моделей и TPU 8i для вывода.
Старший вице-президент Google по ИИ и инфраструктуре Амин Вахдат объяснил, что такой подход обусловлен растущей фрагментацией вычислительных нагрузок. Обучение требует максимальной пропускной способности для обработки триллионов параметров, в то время как вывод критически зависит от скорости отклика и параллельного выполнения множества запросов.
TPU 8t, разработанный совместно с Broadcom, является флагманским чипом для обучения. Суперкомпьютерный узел может объединять до 9600 таких чипов с 2 ПБ высокоскоростной памяти, обеспечивая производительность 121 эксафлопс (FP4) на один Pod. Это примерно в 2,8 раза быстрее предыдущего поколения Ironwood при той же цене.
TPU 8i, созданный в сотрудничестве с MediaTek, оптимизирован для сценариев вывода и призван устранить «эффект ожидания». Один Pod масштабируется до 1152 чипов, обеспечивая 11,6 экзафлопс производительности (FP8), что на 80% выше, чем у Ironwood при той же цене.
Оба чипа производятся по 2-нм техпроцессу TSMC, работают на базе процессора Google Axion (архитектура Arm) и используют жидкостное охлаждение четвёртого поколения. Серийное производство запланировано на конец 2027 года. В программном плане новинки поддерживают фреймворки JAX, PyTorch, Keras и vLLM.
Параллельно с аппаратным обеспечением Google представила платформу Gemini Enterprise Agent Platform и набор инструментов для работы с ИИ-агентами. Новые функции, такие как Memory Bank и Agent Simulation, призваны помочь предприятиям внедрять автономных «цифровых сотрудников» для автоматизации сложных задач.









0 комментариев