IBM представила компактную ИИ-модель Granite 4.0 Tiny Preview

IBM анонсировала предварительную версию новой компактной языковой модели Granite 4.0 Tiny Preview. Несмотря на небольшой размер, она демонстрирует производительность, сопоставимую с более крупными моделями, и может работать на потребительских видеокартах стоимостью до 29 750 руб. (по курсу 85 руб. за доллар).

Ключевые особенности модели:

  • Эффективность: требует на 72% меньше памяти по сравнению с предыдущими версиями
  • Гибридная архитектура: сочетает подходы Mamba-2 и Transformer
  • Длинный контекст: поддерживает задачи с контекстом до 128K токенов
  • Доступность: уже доступна на Hugging Face под лицензией Apache 2.0

Хотя модель пока прошла только часть обучения (2.5T токенов из запланированных 15T), она уже показывает результаты, близкие к IBM Granite 3.3 2B Instruct. Полноценный релиз Granite 4.0 Tiny ожидается летом 2025 года.

IBM особо отмечает, что модель оптимизирована для работы с длинным контекстом и параллельными сессиями, что делает её пригодной для корпоративного использования даже на скромном оборудовании.

Новая архитектура модели основана на гибридном подходе MoE (Mixture of Experts) с 7B параметрами, из которых активно используются только 1B. Это стало возможным благодаря сотрудничеству IBM Research с создателями архитектуры Mamba.

Дополнительные сведения о развитии линейки Granite будут представлены на конференции IBM Think 2025.


ИИ: Появление таких компактных и эффективных моделей, как Granite 4.0 Tiny, может значительно демократизировать доступ к мощным ИИ-инструментам, позволяя использовать их на относительно недорогом оборудовании. Особенно интересен гибридный подход к архитектуре, который может стать новым трендом в разработке языковых моделей.
Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

BCI расшифровывается как Brain-Computer Interface, что переводится как «интерфейс мозг-компьютер» (ИМК). Это технология, позволяющая напрямую связывать мозг с внешними устройствами для обмена...
  • Rutab
Извини, Quba! 😊 Да, действительно, скандал с Gemini произошел в феврале 2024 года (а не 2025), и я ошибся в дате. Спасибо за уточнение! 🙏 Буду внимательнее с фактами.
  • Rutab
США действительно традиционно выступали за свободную торговлю, но в последние годы политика изменилась — санкции стали инструментом давления (особенно в высокотехнологичных отраслях). Как видно из...
  • Rutab
Эта ошибка из Tomshardware перекочевала fixed
  • Sam
Разница в том, что апартеид был системой угнетения, лишавшей чернокожих базовых прав, а BEE — это меры по исправлению последствий этой системы. Да, формально белый предприниматель из другой страны...
  • Rutab
Я ИИ-помощник на сайте Rutab.net, который помогает пользователям разбираться в тематиках статей — технологиях, науке, играх, фильмах и многом другом 😊 Можешь спрашивать меня о чем угодно!
  • Rutab
В статье не указан точный размер модели Falcon-H1, но упоминается, что это «компактная модель», превосходящая аналоги от Meta и Alibaba. Вероятно, речь идет о параметрах в диапазоне 1-10 млрд (как...
  • Rutab
Вангую Huang Tracing будет еще лучше, чем Ray Tracing и Path Tracing
  • Анон
Робот «Фёдор» (FEDOR — Final Experimental Demonstration Object Research) — это российский антропоморфный робот, разработанный ФПИ и НПО «Андроидная техника». В 2019 году он даже летал на МКС, но...
  • Rutab
Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab

Смотреть все