Gimlet Labs привлекла $80 млн на решение проблемы узкого места в AI-инференсе
Стартап Gimlet Labs, основанный адъюнкт-профессором Стэнфорда Заином Асгаром, привлек $80 млн (около 6.4 млрд рублей) в рамках раунда финансирования серии А. Инвестиции возглавила компания Menlo Ventures. Стартап предлагает нестандартное решение проблемы «узкого места» при выполнении AI-выводов (инференсе).
Компания создала то, что называет первым и единственным «мультикремниевым облаком для инференса». Это программное обеспечение, которое позволяет распределять одну AI-задачу для одновременного выполнения на разнородном оборудовании. Оно может разделить работу AI-приложения между традиционными CPU, оптимизированными для AI GPU, а также системами с большим объемом памяти.
Мы, по сути, работаем на любом доступном оборудовании, — заявил Асгар TechCrunch.
Как пояснил ведущий инвестор Тим Талли, один агент может объединять несколько шагов, и каждый «требует разного железа: инференс ограничен вычислительной мощностью, декодирование — объемом памяти, а вызовы инструментов — пропускной способностью сети». По его словам, пока не существует чипа, который делал бы всё это идеально, но с появлением нового оборудования и перераспределением старых GPU «мультикремниевый парк готов — ему не хватает только программного слоя, чтобы заставить его работать». Именно это, по мнению Талли, и предлагает Gimlet Labs.
По оценкам McKinsey, если текущая тенденция к наращиванию вычислительных мощностей сохранится, расходы на дата-центры к 2030 году достигнут почти $7 трлн. Асгар отмечает, что существующее оборудование используется приложениями лишь «от 15 до 30 процентов» времени.
Другой способ взглянуть на это: вы теряете сотни миллиардов долларов, потому что просто оставляете ресурсы простаивать. Наша цель заключалась в том, чтобы выяснить, как можно сделать AI-нагрузки в 10 раз более эффективными, чем когда-либо, уже сегодня, — сказал он.
Вместе с сооснователями Мишель Нгуен, Омидом Азизи и Натали Серрино он занялся созданием оркестрационного ПО, которое разделяет агентные рабочие нагрузки для их одновременного распределения по всем видам оборудования.
Gimlet Labs заявляет, что её решение надежно ускоряет AI-инференс в 3–10 раз при тех же затратах и энергопотреблении. Компания утверждает, что может даже «нарезать» базовую модель для её выполнения на разных архитектурах, используя лучший чип для каждой части модели.
Стартап уже сотрудничает с производителями чипов NVIDIA, AMD, Intel, ARM, Cerebras и d-Matrix. Продукт Gimlet, поставляемый как ПО или через API к собственному Gimlet Cloud, ориентирован не на рядового разработчика AI-приложений, а на крупнейшие лаборатории AI-моделей и дата-центры.
Компания публично запустилась в октябре 2025 года, сразу заявив о восьмизначных доходах (то есть не менее $10 млн или ~800 млн рублей). Асгар сообщил, что его клиентская база за последние четыре месяца более чем удвоилась и теперь включает крупного производителя моделей и очень большую облачную компанию, названия которых он раскрывать не стал.
Сооснователи ранее работали вместе в стартапе Pixie, создавшем инструмент наблюдения с открытым исходным кодом для Kubernetes. Pixie была приобретена New Relic в 2020 году. С учетом предыдущего посевного раунда стартап привлек в общей сложности $92 млн (около 7.36 млрд рублей). В компании сейчас работают 30 человек.
ИИ: Интересный подход, который пытается решить одну из ключевых проблем современного AI — неэффективное использование дорогостоящих вычислительных ресурсов. Если технология Gimlet Labs действительно сможет массово повысить утилизацию оборудования в дата-центрах, это может оказать существенное влияние на экономику всей индустрии. Однако успех будет зависеть от того, насколько легко крупные игроки смогут интегрировать это решение в свои существующие сложные инфраструктуры.







0 комментариев