4 июля, 12:36

Французский стартап Kyutai представил Moshi - конкурента GPT-4o с открытым исходным кодом

Все о блокчейн, мозге и WEB 3.0 в России и мире
Kyutai французский конкурент OpenAI представил Moshi - конкурента GPT-4o с открытым исходным кодом Moshi — это мультимодальная ИИ модель, которая может слушать, слышать и говорить. Код, модель и paper скоро выйдут. Демонстрация полностью комплексной аудиомодели сегодня — это огромное событие. Демо-версия Moshi уже доступна в сети, а версия GPT4o все еще находится в подвешенном состоянии. Модель отвечает на ваш вопрос еще до того, как вы закончили его задавать, когда вы прерываете модель, она реагирует… Прогнозирующее кодирование в модели. Эта интерактивная голосовая технология будет повсюду. Скоро это станет обычным товаром. О Kyutai мы писали тут.
Video is not supported
Не баг, а фича
Невозможно: французский стартап Kyutai этой ночью уделал OpenAI. Ребята показали голосового ассистента, который идентичен тому, что должен появиться в ChatGPT, но до сих пор не появился. Moshi — это нейронка, которая говорит с использованием 70 разных эмоций и акцентов. Код обещают опубликовать в опенсорсе, а сам ИИ сделать проще, чтобы запускался даже на ноутбуках. Русский язык тулза пока не понимает, но зато у неё уже есть демо — чекаем тут. Не баг, а фича
Video is not supported
Техномотель
ChatGPT, подвинься: стартап из Франции дропнул ИИ-ассистента Moshi, который поддерживает 70+ эмоций и акцентов. Революционная нейросеть может быть в роли тренера, компаньона, или проявлять креативность в ролевых играх, создавая персонажей. ИИ построила команда из 8 человек всего за полгода. Русский язык — пока не поддерживается.
Video is not supported
Нейродвиж
OpenAI только что урыли — французский стартап Kyutai презентовал голосового ассистента. Того самого, что должен появиться в ChatGPT, но раньше OpenAI. Модель называется Moshi — под капотом у нее 70 различных эмоций и акцентов. Что еще круче — обещают опубликовать код в open source, и даже сделать облегченную версию, которую можно будет гонять на ноутбуках. Среди плюсов — уже есть онлайн-демо, среди минусов — русский пока не понимает.
Video is not supported
Data Secrets
Французская лаборатория Kyutai представила конкурента GPT-4o с открытым исходным кодом! Пока все третий месяц ждут голосовой режим ChatGPT, стартап Kyutai привлек $300 млн. инвестиций и выпустил модель Moshi: Moshi – мультимодальная модель, способная слушать, говорить и видеть Выражает и понимает эмоции Может одновременно слушать и говорить Задержка ответа всего 160 мс, то есть ее вообще нет И все это в опенсорс! Просто удивительно. Статью, код и веса обещают выпустить скоро. Кстати, уже доступны некоторые детали реализации. Базовая текстовая модель Helium имеет 7В параметров. После предобучения на текстах она обучалась совместно на аудио и текстах. Аудио прогоняются через Mimi – модель сжатия на основе VQ-VAE от той же лаборатории. Файнтюнилась на 20 часах аудио и синтетических транскрипциях, сгенерированных самим Helium. Кстати, говорят, что для домашнего файнтюнинга модели понадобится менее 30 минут аудио И главное: с моделью уже можно поговорить здесь!
Video is not supported
GPT BOT News | chatGPT | OpenAI
OpenAI только что урыли — французский стартап Kyutai презентовал голосового ассистента. Того самого, что должен появиться в ChatGPT, но раньше OpenAI. Модель называется Moshi — под капотом у нее 70 различных эмоций и акцентов. Что еще круче — обещают опубликовать код в open source, и даже сделать облегченную версию, которую можно будет гонять на ноутбуках. GPT News ChatGPT BOT