Китайские ученые создали чип с производительностью в 1000 раз выше топовых GPU
Исследовательская группа из Пекинского университета под руководством исследователя Сунь Чжуна совместно с командой из Института интегральных схем разработала высокоточный и масштабируемый аналоговый матричный вычислительный чип на основе мемристоров.
Новый чип впервые реализует систему аналоговых вычислений, способную по точности конкурировать с цифровыми вычислениями. При решении ключевых научных задач, таких как обнаружение сигналов в системах MIMO с массовым количеством антенн, вычислительная пропускная способность и энергоэффективность чипа превосходят современные топовые цифровые процессоры (GPU) в сотни и тысячи раз.
Соответствующая научная работа была опубликована 13 октября в журнале Nature Electronics.
Обработка сигналов в базовых станциях связи, оптимизация параметров при обучении больших языковых моделей ИИ — по своей сути все эти задачи сводятся к решению сложных матричных уравнений. Цифровые методы решения таких задач с высокой точностью требуют огромных вычислительных затрат, много времени и энергии.
В связи с этим аналоговые вычисления, ранее считавшиеся устаревшей технологией, вновь привлекли внимание исследователей. Они напрямую используют физические законы для параллельных операций, обеспечивая низкую задержку и энергопотребление, что дает им преимущество в условиях современных вычислительных ограничений.
Однако проблема достижения высокой точности и масштабируемости аналоговых вычислений для использования в современных вычислительных задачах оставалась нерешенной глобальной научной проблемой на протяжении многих лет.
Команда Сунь Чжуна выбрала путь интеграционных инноваций, создав высокоточный и масштабируемый полностью аналоговый решатель матричных уравнений на основе массива мемристоров. Впервые точность аналоговых вычислений была повышена до 24-битной фиксированной точности.
Исследователи разработали схему решения матричных уравнений с полной аналоговой матричной операцией, основанную на итерационном алгоритме, который сочетает аналоговое матричное обращение низкой точности и аналоговое матрично-векторное умножение высокой точности. Сначала быстро вычисляется «приблизительное решение» матричного уравнения, а затем метод «битового среза» используется для итерационного уточнения.
В экспериментах команда успешно реализовала инверсию матрицы 16×16 с 24-битной точностью фиксированной точки. После 10 итераций относительная ошибка решения матричного уравнения может быть снижена до уровня 10⁻⁷.
Что касается производительности, при решении задачи инверсии матрицы 32×32 вычислительная мощность чипа уже превосходит производительность одного ядра высокопроизводительного GPU. Когда размер задачи увеличивается до 128×128, вычислительная пропускная способность становится более чем в 1000 раз выше, чем у топовых цифровых процессоров. При этом энергоэффективность решения в 100 раз выше, чем у традиционных цифровых процессоров при той же точности, что обеспечивает ключевую технологическую поддержку для высокоэффективных вычислительных центров.
Команда применила разработку для «обнаружения сигналов в системах MIMO с массовым количеством антенн» — всего за 3 итерации восстановленное изображение стало практически идентичным исходному, а уровень ошибок оказался сопоставим с 32-битными цифровыми вычислениями, что подчеркивает потенциал технологии для обработки сигналов в реальном времени.
«Мы доказали, что аналоговые вычисления могут решать ключевые вычислительные задачи современной науки и техники с чрезвычайно высокой эффективностью и точностью», — подчеркнул Сунь Чжун.
Он отметил, что это прорывное решение имеет широкие перспективы применения в различных вычислительных сценариях и может изменить ландшафт вычислительных мощностей. Исследование открывает многообещающий путь для повышения производительности вычислений и может положить конец долгосрочной монополии цифровых вычислений, открыв новую эру повсеместных, экологичных и высокоэффективных вычислений.
0 комментариев