Xiaomi представила свою «рассуждающую» нейросеть MiMo


Xiaomi представила свою «рассуждающую» нейросеть MiMo

Компания Xiaomi впервые выпустила собственную открытую языковую модель — MiMo.

В пресс-релизе её называют «рассуждающей»: по словам разработчиков, она лучше справляется с задачами, где нужно логическое и математическое мышление.

Читайте также: 10 курсов по чат-ботам на базе ИИ

Что известно о MiMo

  • MiMo — это семейство из четырёх моделей: базовая (MiMo-7B-Base), с дообучением под задачи RLHF (MiMo-7B-RL-Zero и MiMo-7B-RL), и SFT-версия (MiMo-7B-SFT);
  • Архитектура — 7 миллиардов параметров, как у многих современных «малых» LLM;
  • Области применения: генерация и объяснение кода, решение математических задач, задачи с несколькими логическими шагами;
  • По заявлению Xiaomi, MiMo опережает модели o1-mini, GPT-4o и QwQ в внутренних тестах по математике и коду. Однако независимых сравнений пока не опубликовано.

Модель обучала недавно сформированная команда Xiaomi по направлению искусственного интеллекта. Компания открыто признала, что начала гонку за AGI позже других, но видит в этом стратегическое направление — наряду с бытовой электроникой и экосистемными сервисами. Модель уже доступна на GitHub и Hugging Face.

Для Xiaomi это первый публичный шаг в сторону генеративного ИИ — и заявка на собственную платформу, а не только на использование сторонних моделей в смартфонах и гаджетах. Открытый выпуск модели — редкий ход среди китайских компаний, особенно в сфере reasoning-моделей.

Ранее стоковый сервис Freepik представил собственную генеративную модель F-Lite.


Source: https://postium.ru/xiaomi-predstavila-svoyu-rassuzhdayushhuyu-nejroset-mimo/

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Xiaomi представила свою «рассуждающую» нейросеть MiMo

Xiaomi представила свою «рассуждающую» нейросеть MiMo Компания Xiaomi впервые выпустила собственную открытую языковую модель — MiMo. В пресс-релизе...

Этика искусственного интеллекта: философские дилеммы цифровой эпохи

Современная цивилизация переживает беспрецедентную трансформацию, в центре которой находится стремительное развитие искусственного интеллекта. Технологии, которые еще недавно казались...

Кто такие AI-тренеры, чем они занимаются и сколько зарабатывают

Кто такие AI-тренеры, чем они занимаются и сколько зарабатывают ИИ — это магия? Не совсем. Нейросети обучают люди....

Исследование: Как бизнес использует нейросети

Исследование: Как бизнес использует нейросети Большинство крупных компаний в России уже внедряют генеративный ИИ — но не разрабатывают...

Компьютерное зрение в медицине: как нейросети революционизируют диагностику и лечение

Современная медицина переживает фундаментальную трансформацию благодаря внедрению технологий искусственного интеллекта. Компьютерное зрение становится одним из ключевых инструментов, способных...

OpenAI открыла бесплатный доступ к «продвинутому» голосовому режиму ChatGPT

OpenAI открыла бесплатный доступ к «продвинутому» голосовому режиму ChatGPT OpenAI объявила о запуске Advanced Voice Mode на базе...

Anthropic научила чат-бот Claude искать в интернете

Anthropic научила чат-бот Claude искать в интернете Чат-бот Claude от Anthropic получил долгожданную функцию веб-поиска — теперь он...

Freepik выпустила «этичную» модель генерации изображений F-Lite — её обучали только на лицензированном контенте

Freepik выпустила «этичную» модель генерации изображений F-Lite — её обучали только на лицензированном контенте Freepik — один из...

OpenAI открыла доступ к API для создания ИИ-агентов

OpenAI открыла доступ к API для создания ИИ-агентов OpenAI представила новые инструменты для разработчиков, позволяющие создавать интеллектуальных агентов...

KOLORS 2.0 — нейросеть Kling обновила генератор изображений

KOLORS 2.0 — нейросеть Kling обновила генератор изображений Kling AI представили KOLORS 2.0 — мощное обновление генератора изображений,...

Ideogram 3.0 — новая ИИ-модель для генерации изображений

Ideogram 3.0 — новая ИИ-модель для генерации изображений Сервис Ideogram, созданный бывшими сотрудниками Google Brain, объявил о масштабном...

Сбер выпустил GigaChat 2.0 — нейросеть стала умнее, быстрее и продуктивнее

Сбер выпустил GigaChat 2.0 — нейросеть стала умнее, быстрее и продуктивнее Сбер официально представил второе поколение своей флагманской...

OpenAI представила GPT-4.5

OpenAI представила GPT-4.5 OpenAI официально представила GPT-4.5 — свою самую продвинутую языковую модель. Она стала доступна пользователям ChatGPT...

20 крутых фишек ChatGPT, про которые ты не знал

20 крутых фишек ChatGPT, про которые ты не знал Представь, что ты контент-мейкер, сммщик или копирайтер, и твой...

Roblox выпустила Cube 3D — нейросеть для генерации 3D-объектов по тексту

Roblox выпустила Cube 3D — нейросеть для генерации 3D-объектов по тексту Roblox представила Cube 3D — свой первый...

Manus AI: что это за ИИ-агент, что умеет, как получить приглашение

Manus AI: что это за ИИ-агент, что умеет, как получить приглашение Автономные ИИ-ассистенты уже не фантастика, а реальность....

Runway представила Gen-4 — ИИ-модель, которая сохраняет персонажей в кадре без искажений

Runway представила Gen-4 — ИИ-модель, которая сохраняет персонажей в кадре без искажений Стартап Runway выпустил новую версию своего...

Яндекс научил Поиск объяснять сложные задачи по алгебре для старшеклассников

Яндекс научил Поиск объяснять сложные задачи по алгебре для старшеклассников Яндекс продолжает развивать интеллектуальные функции своего Поиска: теперь...

Qwen представила «думающую» модель QwQ-Max-Preview и режим «Thinking QwQ»

Qwen представила «думающую» модель QwQ-Max-Preview и режим «Thinking QwQ» Команда нейросети Qwen AI анонсировала QwQ-Max-Preview — новую модель...

Вышла нейросеть Suno v4.5 — увеличили длину треков, добавили «персонажей» и каверы

Вышла нейросеть Suno v4.5 — увеличили длину треков, добавили «персонажей» и каверы Suno представила обновление своей нейросети —...