Alibaba Cloud заявляет, что её новая система пулинга Aegaeon сократила количество GPU Nvidia, необходимых для работы больших языковых моделей, на 82% в ходе многомесячного бета-тестирования внутри её маркетплейса Model Studio. Результаты, опубликованные в рецензируемой статье, представленной на
Читать дальше →