IBM выпустила модели ИИ Granite для бизнеса
IBM (произносится ай-би-эм; [aɪbiːˈɛm]; аббр. от англ. International Business Machines) — американская компания со штаб-квартирой в Армонке (штат Нью-Йорк), один из крупнейших в мире производителей и поставщиков аппаратного и программного обеспечения, а также IT-сервисов и консалтинговых услуг.
Распространённое прозвище компании — Big Blue, что можно перевести с английского как «большой синий» или «голубой гигант». Википедия
Читайте также:IBM купила DataStax для развития watsonxIBM и Lenovo развивают партнёрство в сфере ИИ в Саудовской АравииIBM и GF урегулировали судебные иски по чип-технологиям с участием Intel и RapidusIBM разрабатывает комплексное оптическое соединение для центров обработки данныхИнновации в области транзисторов CFET от TSMC, IBM и Samsung
Иску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ.
Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами.
Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия
Читайте также:Cisco расширяет партнерство с NVIDIA для ускорения внедрения ИИ на предприятииIBM купила DataStax для развития watsonxActivision подтвердила использование ИИ-ассетов в Call of Duty: Black Ops 6Генеральный директор Microsoft заявил, что компания будет обучать новый ИИ на «каталоге игр»MITAC анонсирует новые серверы для ИИ и вычислений
Highlights include:
- Новая модель языка видения (VLM) для задач понимания документов, которая демонстрирует производительность, которая соответствует или превосходит производительность значительно более крупных моделей - Llama 3.2 11B и Pixtral 12B - на основных корпоративных бенчмарках DocVQA, ChartQA, AI2D и OCRBench1. В дополнение к надежным учебным данным IBM использовала собственный инструментарий Docling с открытым исходным кодом для обработки 85 миллионов PDF-файлов и сгенерировала 26 миллионов синтетических пар вопрос-ответ для повышения способности VLM обрабатывать сложные рабочие процессы с большим объемом документов.
- Возможности цепочки мыслей для улучшенного рассуждения в моделях 3.2 2B и 8B с возможностью включения или выключения рассуждения для оптимизации эффективности. Благодаря этой возможности модель 8B достигает двузначных улучшений по сравнению со своей предшественницей в тестах на выполнение инструкций, таких как ArenaHard и Alpaca Eval, без ухудшения безопасности или производительности в других местах2. Кроме того, с использованием новых методов масштабирования вывода модель Granite 3.2 8B может быть откалибрована для конкуренции с производительностью гораздо более крупных моделей, таких как Claude 3.5 Sonnet или GPT-4o, в тестах на математическое рассуждение, таких как AIME2024 и MATH500.3
- Уменьшенные варианты размеров для моделей безопасности Granite Guardian, которые сохраняют производительность предыдущих моделей Granite 3.1 Guardian при уменьшении размера на 30%. Модели 3.2 также вводят новую функцию, называемую вербализованной уверенностью, которая предлагает более тонкую оценку риска, которая признает неоднозначность в мониторинге безопасности.
Стратегия IBM по предоставлению небольших специализированных моделей ИИ для предприятий продолжает демонстрировать эффективность в ходе тестирования: недавно модель Granite 3.1 8B получила высокие оценки точности в тесте Salesforce LLM Benchmark для CRM.
Семейство моделей Granite поддерживается надежной экосистемой партнеров, включая ведущие компании-разработчики программного обеспечения, внедряющие LLM в свои технологии.
«В CrushBank мы увидели своими глазами, как открытые, эффективные модели ИИ IBM приносят реальную пользу корпоративному ИИ, предлагая правильный баланс производительности, экономической эффективности и масштабируемости», — сказал Дэвид Тан, технический директор CrushBank. «Granite 3.2 продвигает его дальше с новыми возможностями рассуждений, и мы рады исследовать их при создании новых агентных решений».
Granite 3.2 — важный шаг в развитии портфолио и стратегии IBM по предоставлению малого, практичного ИИ для предприятий. Хотя подходы цепочки мыслей для рассуждений являются мощными, они требуют значительной вычислительной мощности, которая не является необходимой для каждой задачи. Вот почему IBM представила возможность включать или выключать цепочку мыслей программным способом. Для более простых задач модель может работать без рассуждений, чтобы сократить ненужные вычислительные затраты. Кроме того, другие методы рассуждений, такие как масштабирование вывода, показали, что модель Granite 3.2 8B может соответствовать или превосходить производительность гораздо более крупных моделей на стандартных тестах математических рассуждений. Развитие методов, таких как масштабирование вывода, остается ключевой областью внимания исследовательских групп IBM.
Наряду с моделями Granite 3.2 instruct, vision и guardrail, IBM выпускает следующее поколение своих моделей TinyTimeMixers (TTM) (параметры ниже 10 млн) с возможностями долгосрочного прогнозирования на два года вперед. Они представляют собой мощные инструменты для долгосрочного анализа тенденций, включая тенденции в финансах и экономике, прогнозирование спроса в цепочке поставок и сезонное планирование запасов в розничной торговле.
«Следующая эра ИИ — это эффективность, интеграция и влияние на реальный мир, где предприятия могут достигать впечатляющих результатов без чрезмерных затрат на вычисления», — сказал Шрирам Рагхаван, вице-президент IBM AI Research. «Последние разработки IBM Granite, ориентированные на открытые решения, демонстрируют еще один шаг вперед в том, чтобы сделать ИИ более доступным, экономически эффективным и ценным для современных предприятий».
Чтобы узнать больше о Granite 3.2, прочитайте эту техническую статью.
Источник: Techpowerup.com
0 комментариев