14 августа, 12:50

Google представляет голосовой режим Gemini Live для улучшенного общения с ИИ

GPT/ChatGPT/AI Central Александра Горного
Google показал продвинутый голосовой режим для общения с чат-ботом Gemini По своей сути, Gemini Live повторяет функционал недавно вышедшего расширенного голосового режима ChatGPT. Он поддерживает более последовательный, эмоциональный и реалистичный диалог с пользователем. В процессе разговора Gemini можно перебивать и задавать уточняющие вопросы. Gemini Live будет доступен в рамках пакета Google One AI Premium Plan за 20 долларов в месяц. — GPT-4o и Midjourney v6.1 доступны в c.aiacademy.me
Video is not supported
Hi, AI! | медиа
Google представила голосового ассистента Gemini Live В Калифорнии прошла презентация Made By Google 2024. Главным фокусом компании в этом году ожидаемо стал AI и его применение в области голосового общения, создания изображений и умного дома. Привет, OpenAI! Gemini Live — новая функция для голосового общения от Google. Ассистент может взаимодействовать с различными приложениями Google, такими как Gmail, YouTube Music, Google Maps, что позволяет выполнять сложные задачи, например, находить рецепты, составлять плейлисты и маршруты. Это ответ компании на голосовой режим от OpenAI, который сейчас проходит ограниченное альфа-тестирование. Доступна Gemini Live подписчикам Google One AI Premium ≈$20 . Что умеет Gemini Live Отвечает менее чем за две секунды. Быстро реагирует, если ее перебивают, умеет менять тему разговора. Запоминает несколько часов разговора. 10 голосов на выбор для общения. Над созданием каждого голоса Google работала с актерами озвучивания. В компании уверяют, что проблем с авторскими правами не возникнет. Наконец-то, можно делать общие фото на вечеринках Функция Add Me позволяет фотографу стать частью группового снимка, используя AI и дополненную реальность. Пользователю нужно сделать два снимка: один без него, а на другом — поменяться с кем-то местами. Смартфон совместит два снимка, и на итоговом изображении будут все участники, включая фотографа. Pixel Studio — еще одна опция от Google, которая появится на новой линейке смартфонов Pixel 9. Приложение позволит генерировать изображения по текстовому промпту. Однако, из-за скандалов, возникших в начале года из-за «слишком толерантных снимков», человеческие лица пока запрещены к генерации. Дом с человеческим... голосом Внедрили Gemini и в устройства для умного дома. Умные термостаты Nest и прочие домашние гаджеты из этой линейки теперь будут коммуницировать с пользователем более органично и менее роботизированно. А вы пользовались Gemini? — да, отличная модель — пользуюсь другими нейросетями #Google #news
Все о блокчейн, мозге и WEB 3.0 в России и мире
Вчера Google дал ответ OpenAI, представив голосового ИИ-помощника Gemini Live – это новая функция от Google, которая позволяет вести голосовые разговоры с искусственным интеллектом. По сути, это ответ Google на подобную функцию, недавно представленную в ChatGPT. Это значит, что теперь можно вести свободный разговор с ИИ, как с обычным человеком. ИИ будет использовать 10 разных голосов, чтобы сделать разговор более естественным. Самое главное, что он сможет понимать, чего ты хочешь, даже если ты не будешь говорить четко и полностью, и подстраиваться под твой стиль разговора. Что умеет Gemini Live: 1. Естественные диалоги: Благодаря голосовому движку, разговоры с Gemini Live становятся более похожими на общение с реальным человеком. ИИ может поддерживать длительные беседы, выражать эмоции и адаптироваться под ваш стиль общения. 2. Вы можете перебивать ИИ в любой момент, чтобы задать уточняющие вопросы или изменить тему разговора. 3. На данный момент функция доступна для владельцев телефонов Pixel 8. Это связано с тем, что в этих устройствах уже интегрированы необходимые для работы Gemini Live технологии. Gemini Live открывает новые горизонты для использования искусственного интеллекта в повседневной жизни. Например, вы можете использовать его для обучения языкам, получения рекомендаций или просто для компании.
Video is not supported
Чёрный Треугольник
Google Gemini получает режим голосового чата На мероприятии Pixel 9 корпорация Google представила функцию голосового чата Gemini Live, доступную для подписчиков Gemini Advanced. Эта функция позволяет вести беседы в стиле голосового чата ChatGPT, но уже с ИИ Gemini, включая возможность перебивать собеседника. Gemini Live работает в фоновом режиме и предлагает 10 новых голосов. В данный момент функция доступна только на английском для Android, с будущими планами на iOS и поддержку других языков. Gemini также теперь может учитывать контекст экрана смартфона. ================
Медиастанция
На презентации MadeByGoogle компания представила свои новые языковые модели: Gemini Nano и Gemini Live. Новые модели станут доступны на некоторых Android-смартфонах в течение месяца. Gemini Nano — легковесная многофункциональная модель, глубоко интегрированная в экосистему Android. Она может работать с изображениями, видео и аудио. Gemini Live, в свою очередь, заменит привычный нам Google Ассистент. Модель не сможет похвастаться широким функционалом, но с ней можно будет обсудить что угодно, как с человеком. Ну, что, Альтман, у конкурентов всё схвачено, где GPT-5?
Хайтек+
Google запустила голосового ИИ-помощника Gemini Live Google некоторое время отставал в гонке генеративного ИИ от таких конкурентов, как Meta, OpenAI, Anthropic и Mistral. Но теперь поисковый гигант готов наверстать упущенное. Компания представила Gemini Live — голосовой режим, встроенный в чат-бота Gemini. Эта функция, доступная для подписчиков Gemini Advanced, позволяет пользователям вести непринужденные беседы с ИИ, получать ответы с реалистичной интонацией и даже перебивать его. Пока функция доступна только в мобильном приложении и на английском языке. Похожий голосовой режим весной представила OpenAI, но из-за проблем с безопасностью массовый запуск был отложен.
Video is not supported
Droider
Gemini Live: смотрим демки На Made by Google произошёл любопытный анонс – Gemini Live. Это голосовой ассистент, который умеет общаться естественным и понятным языком с пользователем. Примерно так-же как у OpenAI. Журналисты The Verge провели тестирование и поделились впечатлениями. Главное преимущество Gemini Live - скорость и точность ответов. В тесте он за 15 секунд нашел решение проблемы с аудиосистемой автомобиля. Однако взаимодействие с ассистентом оказалось неоднозначным для авторов The Verge : Слишком человечный голос создает ощущение разговора с реальным человеком, что вызывает дискомфорт при необходимости прерывать ассистента. Gemini Live не умеет считывать невербальные сигналы и может продолжать говорить, даже когда пользователь потерял интерес. Ассистент не всегда точно интерпретирует контекст последовательных вопросов, что может приводить к путанице. Gemini Live доступен пользователям с подпиской Gemini Advanced. Версия для iOS появится позже.