14 августа, 12:50

Google представляет голосовой режим Gemini Live для улучшенного общения с ИИ

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

GPT/ChatGPT/AI Central Александра Горного

Google показал продвинутый голосовой режим для общения с чат-ботом Gemini По своей сути, Gemini Live повторяет функционал недавно вышедшего расширенного голосового режима ChatGPT. Он поддерживает более последовательный, эмоциональный и реалистичный диалог с пользователем. В процессе разговора Gemini можно перебивать и задавать уточняющие вопросы. Gemini Live будет доступен в рамках пакета Google One AI Premium Plan за 20 долларов в месяц. — GPT-4o и Midjourney v6.1 доступны в c.aiacademy.me

Технологии643 дня назад

Video is not supported

Hi, AI! | медиа

Google представила голосового ассистента Gemini Live В Калифорнии прошла презентация Made By Google 2024. Главным фокусом компании в этом году ожидаемо стал AI и его применение в области голосового общения, создания изображений и умного дома. Привет, OpenAI! Gemini Live — новая функция для голосового общения от Google. Ассистент может взаимодействовать с различными приложениями Google, такими как Gmail, YouTube Music, Google Maps, что позволяет выполнять сложные задачи, например, находить рецепты, составлять плейлисты и маршруты. Это ответ компании на голосовой режим от OpenAI, который сейчас проходит ограниченное альфа-тестирование. Доступна Gemini Live подписчикам Google One AI Premium ≈$20 . Что умеет Gemini Live Отвечает менее чем за две секунды. Быстро реагирует, если ее перебивают, умеет менять тему разговора. Запоминает несколько часов разговора. 10 голосов на выбор для общения. Над созданием каждого голоса Google работала с актерами озвучивания. В компании уверяют, что проблем с авторскими правами не возникнет. Наконец-то, можно делать общие фото на вечеринках Функция Add Me позволяет фотографу стать частью группового снимка, используя AI и дополненную реальность. Пользователю нужно сделать два снимка: один без него, а на другом — поменяться с кем-то местами. Смартфон совместит два снимка, и на итоговом изображении будут все участники, включая фотографа. Pixel Studio — еще одна опция от Google, которая появится на новой линейке смартфонов Pixel 9. Приложение позволит генерировать изображения по текстовому промпту. Однако, из-за скандалов, возникших в начале года из-за «слишком толерантных снимков», человеческие лица пока запрещены к генерации. Дом с человеческим... голосом Внедрили Gemini и в устройства для умного дома. Умные термостаты Nest и прочие домашние гаджеты из этой линейки теперь будут коммуницировать с пользователем более органично и менее роботизированно. А вы пользовались Gemini? — да, отличная модель — пользуюсь другими нейросетями #Google #news

Технологии642 дня назад

Все о блокчейн, мозге и WEB 3.0 в России и мире

Вчера Google дал ответ OpenAI, представив голосового ИИ-помощника Gemini Live – это новая функция от Google, которая позволяет вести голосовые разговоры с искусственным интеллектом. По сути, это ответ Google на подобную функцию, недавно представленную в ChatGPT. Это значит, что теперь можно вести свободный разговор с ИИ, как с обычным человеком. ИИ будет использовать 10 разных голосов, чтобы сделать разговор более естественным. Самое главное, что он сможет понимать, чего ты хочешь, даже если ты не будешь говорить четко и полностью, и подстраиваться под твой стиль разговора. Что умеет Gemini Live: 1. Естественные диалоги: Благодаря голосовому движку, разговоры с Gemini Live становятся более похожими на общение с реальным человеком. ИИ может поддерживать длительные беседы, выражать эмоции и адаптироваться под ваш стиль общения. 2. Вы можете перебивать ИИ в любой момент, чтобы задать уточняющие вопросы или изменить тему разговора. 3. На данный момент функция доступна для владельцев телефонов Pixel 8. Это связано с тем, что в этих устройствах уже интегрированы необходимые для работы Gemini Live технологии. Gemini Live открывает новые горизонты для использования искусственного интеллекта в повседневной жизни. Например, вы можете использовать его для обучения языкам, получения рекомендаций или просто для компании.

Технологии642 дня назад

Video is not supported

Чёрный Треугольник

Google Gemini получает режим голосового чата На мероприятии Pixel 9 корпорация Google представила функцию голосового чата Gemini Live, доступную для подписчиков Gemini Advanced. Эта функция позволяет вести беседы в стиле голосового чата ChatGPT, но уже с ИИ Gemini, включая возможность перебивать собеседника. Gemini Live работает в фоновом режиме и предлагает 10 новых голосов. В данный момент функция доступна только на английском для Android, с будущими планами на iOS и поддержку других языков. Gemini также теперь может учитывать контекст экрана смартфона. ================

Технологии643 дня назад

Медиастанция

На презентации MadeByGoogle компания представила свои новые языковые модели: Gemini Nano и Gemini Live. Новые модели станут доступны на некоторых Android-смартфонах в течение месяца. Gemini Nano — легковесная многофункциональная модель, глубоко интегрированная в экосистему Android. Она может работать с изображениями, видео и аудио. Gemini Live, в свою очередь, заменит привычный нам Google Ассистент. Модель не сможет похвастаться широким функционалом, но с ней можно будет обсудить что угодно, как с человеком. Ну, что, Альтман, у конкурентов всё схвачено, где GPT-5?

Технологии642 дня назад

Хайтек+

Google запустила голосового ИИ-помощника Gemini Live Google некоторое время отставал в гонке генеративного ИИ от таких конкурентов, как Meta, OpenAI, Anthropic и Mistral. Но теперь поисковый гигант готов наверстать упущенное. Компания представила Gemini Live — голосовой режим, встроенный в чат-бота Gemini. Эта функция, доступная для подписчиков Gemini Advanced, позволяет пользователям вести непринужденные беседы с ИИ, получать ответы с реалистичной интонацией и даже перебивать его. Пока функция доступна только в мобильном приложении и на английском языке. Похожий голосовой режим весной представила OpenAI, но из-за проблем с безопасностью массовый запуск был отложен.

Технологии642 дня назад

Video is not supported

Droider

Gemini Live: смотрим демки На Made by Google произошёл любопытный анонс – Gemini Live. Это голосовой ассистент, который умеет общаться естественным и понятным языком с пользователем. Примерно так-же как у OpenAI. Журналисты The Verge провели тестирование и поделились впечатлениями. Главное преимущество Gemini Live - скорость и точность ответов. В тесте он за 15 секунд нашел решение проблемы с аудиосистемой автомобиля. Однако взаимодействие с ассистентом оказалось неоднозначным для авторов The Verge : Слишком человечный голос создает ощущение разговора с реальным человеком, что вызывает дискомфорт при необходимости прерывать ассистента. Gemini Live не умеет считывать невербальные сигналы и может продолжать говорить, даже когда пользователь потерял интерес. Ассистент не всегда точно интерпретирует контекст последовательных вопросов, что может приводить к путанице. Gemini Live доступен пользователям с подпиской Gemini Advanced. Версия для iOS появится позже.

Технологии642 дня назад

Источники

GPT/ChatGPT/AI Central Александра Горного

Все о блокчейн, мозге и WEB 3.0 в России и мире

Droider

Похожие новости

Apple анонсирует новое приложение Siri с функцией автоматического удаления истории диалогов

Технологии

23 часа назад

Основатель OpenClaw Петер Стайнбергер инвестирует в автоматизацию разработки с помощью ИИ

Технологии

3 часа назад

Михаил Мишустин анонсировал разработку российских программ для проектирования авиадвигателей

Технологии

3 часа назад

Google представляет голосовой режим Gemini Live для улучшенного общения с ИИ

Ещё по теме

Источники

Apple анонсирует новое приложение Siri с функцией автоматического удаления истории диалогов

Сбер анонсирует запуск новой коммуникационной платформы к 2027 году

Violin: Новый опенсорсный инструмент для дубляжа видео на 33 языка

Microsoft исследует ограничения ИИ в офисной работе

Основатель OpenClaw Петер Стайнбергер инвестирует в автоматизацию разработки с помощью ИИ

Михаил Мишустин анонсировал разработку российских программ для проектирования авиадвигателей