Xiaomi представила OneVL — фреймворк для автономного вождения с открытым исходным кодом
Китайский технологический гигант Xiaomi официально выпустил и сделал открытым исходным кодом свой новый фреймворк Xiaomi OneVL. Это система, предназначенная для улучшения того, как модели автономного вождения понимают, анализируют и прогнозируют дорожные ситуации.
По словам компании, Xiaomi OneVL — это первый в отрасли фреймворк, объединяющий несколько ключевых технологий в единую систему. К ним относятся VLA (Vision-Language-Action — «зрение-язык-действие»), world models (модели мира) и логический вывод в латентном пространстве. Компания утверждает, что фреймворк основан на возможностях рассуждения модели XLA, одновременно повышая как скорость вывода, так и точность.
В исследованиях автономного вождения VLA и world models обычно рассматривались как отдельные подходы. Системы VLA в первую очередь сосредоточены на понимании дорожной обстановки и генерации действий по управлению автомобилем, тогда как world models прогнозируют, как может развиваться сцена. Xiaomi заявляет, что OneVL — это первый фреймворк, объединяющий оба метода посредством логического вывода в латентном пространстве.
Компания также утверждает, что фреймворк показывает высокую производительность на нескольких основных эталонных тестах для восприятия, рассуждения и планирования. Xiaomi говорит, что OneVL расширяет границы методов латентного вывода и обеспечивает более высокую точность, чем явное рассуждение по цепочке мыслей (Chain-of-Thought, CoT), сохраняя при этом скорость, аналогичную системам CoT в латентном пространстве, которые сосредоточены только на прогнозировании конечных ответов.
Xiaomi OneVL также создан с упором на интерпретируемость
Еще одним важным направлением фреймворка является интерпретируемость. Xiaomi заявляет, что OneVL может объяснять свой процесс принятия решений как в текстовой, так и в визуальной форме. На практике это означает, что система может описать, почему автомобиль должен предпринять определенное действие по управлению, а также показать прогнозы того, что может произойти дальше на дороге.
OneVL был представлен вскоре после того, как Xiaomi недавно открыла исходный код своей модели генерации звука под названием Omnivoice. Открывая исходный код OneVL, Xiaomi также более агрессивно позиционирует себя в более широкой сфере ИИ и интеллектуальной мобильности — областях, где конкуренция среди крупных технологических компаний продолжает усиливаться.







0 комментариев