Французский стартап Kyutai представил Moshi - конкурента GPT-4o с открытым исходным кодом

Все о блокчейн, мозге и WEB 3.0 в России и мире

Kyutai французский конкурент OpenAI представил Moshi - конкурента GPT-4o с открытым исходным кодом Moshi — это мультимодальная ИИ модель, которая может слушать, слышать и говорить. Код, модель и paper скоро выйдут. Демонстрация полностью комплексной аудиомодели сегодня — это огромное событие. Демо-версия Moshi уже доступна в сети, а версия GPT4o все еще находится в подвешенном состоянии. Модель отвечает на ваш вопрос еще до того, как вы закончили его задавать, когда вы прерываете модель, она реагирует… Прогнозирующее кодирование в модели. Эта интерактивная голосовая технология будет повсюду. Скоро это станет обычным товаром. О Kyutai мы писали тут.

Технологии681 день назад

Video is not supported

Не баг, а фича

Невозможно: французский стартап Kyutai этой ночью уделал OpenAI. Ребята показали голосового ассистента, который идентичен тому, что должен появиться в ChatGPT, но до сих пор не появился. Moshi — это нейронка, которая говорит с использованием 70 разных эмоций и акцентов. Код обещают опубликовать в опенсорсе, а сам ИИ сделать проще, чтобы запускался даже на ноутбуках. Русский язык тулза пока не понимает, но зато у неё уже есть демо — чекаем тут. Не баг, а фича

Технологии681 день назад

Video is not supported

Техномотель

ChatGPT, подвинься: стартап из Франции дропнул ИИ-ассистента Moshi, который поддерживает 70+ эмоций и акцентов. Революционная нейросеть может быть в роли тренера, компаньона, или проявлять креативность в ролевых играх, создавая персонажей. ИИ построила команда из 8 человек всего за полгода. Русский язык — пока не поддерживается.

Технологии680 дней назад

Video is not supported

Нейродвиж

OpenAI только что урыли — французский стартап Kyutai презентовал голосового ассистента. Того самого, что должен появиться в ChatGPT, но раньше OpenAI. Модель называется Moshi — под капотом у нее 70 различных эмоций и акцентов. Что еще круче — обещают опубликовать код в open source, и даже сделать облегченную версию, которую можно будет гонять на ноутбуках. Среди плюсов — уже есть онлайн-демо, среди минусов — русский пока не понимает.

Технологии681 день назад

Video is not supported

Data Secrets

Французская лаборатория Kyutai представила конкурента GPT-4o с открытым исходным кодом! Пока все третий месяц ждут голосовой режим ChatGPT, стартап Kyutai привлек $300 млн. инвестиций и выпустил модель Moshi: Moshi – мультимодальная модель, способная слушать, говорить и видеть Выражает и понимает эмоции Может одновременно слушать и говорить Задержка ответа всего 160 мс, то есть ее вообще нет И все это в опенсорс! Просто удивительно. Статью, код и веса обещают выпустить скоро. Кстати, уже доступны некоторые детали реализации. Базовая текстовая модель Helium имеет 7В параметров. После предобучения на текстах она обучалась совместно на аудио и текстах. Аудио прогоняются через Mimi – модель сжатия на основе VQ-VAE от той же лаборатории. Файнтюнилась на 20 часах аудио и синтетических транскрипциях, сгенерированных самим Helium. Кстати, говорят, что для домашнего файнтюнинга модели понадобится менее 30 минут аудио И главное: с моделью уже можно поговорить здесь!

Технологии681 день назад

Video is not supported

GPT BOT News | chatGPT | OpenAI

Технологии680 дней назад

Французский стартап Kyutai представил Moshi - конкурента GPT-4o с открытым исходным кодом

Источники

OpenAI интегрировала Codex в мобильное приложение ChatGPT

OpenAI рассматривает иск против Apple из-за неудачного партнерства

Программист создал ИИ-клона для борьбы с одиночеством и улучшения психического здоровья

Россияне сталкиваются с ростом поддельных мессенджеров и киберугроз

Сотрудники крупных компаний используют ИИ для накрутки внутренних метрик

Глобальный диктант по осетинскому языку пройдет 14 мая в прямом эфире

Французский стартап Kyutai представил Moshi - конкурента GPT-4o с открытым исходным кодом

Ещё по теме

Источники

OpenAI интегрировала Codex в мобильное приложение ChatGPT

OpenAI рассматривает иск против Apple из-за неудачного партнерства

Программист создал ИИ-клона для борьбы с одиночеством и улучшения психического здоровья

Россияне сталкиваются с ростом поддельных мессенджеров и киберугроз

Сотрудники крупных компаний используют ИИ для накрутки внутренних метрик

Глобальный диктант по осетинскому языку пройдет 14 мая в прямом эфире