10 апреля, 10:08

Google обновил Gemini 1.5 Pro: нейронка теперь обрабатывает аудио

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

Google обновил Gemini 1.5 Pro и теперь нейронка умеет обрабатывать аудио! Вариантов применения масса: получить краткую выжимку из любого подкаста сразу на нужном языке, превратить видео-курс в тестовый или загрузить любимую песню и попросить проанализировать её. Работает бесплатно тут, но придётся подрубить VPN с сервером в Турции.

Технологии764 дня назад

Технопроходцы

Gemini теперь с ушами Google представила обновление для своей языковой модели Gemini 1.5 Pro. Теперь модель умеет обрабатывать аудиофайлы без текстовой расшифровки. Так, нейросеть может, например, подготовить сводку пресс-конференции, просто прослушав её. Обновление также затронуло генератор изображений Imagen 2, который теперь способен добавлять и удалять элементы на изображениях. Кроме того, Gemini 1.5 Pro станет доступной для широкой публики через облачную платформу Vertex AI. Сейчач же, в то время как большинство пользователей работают с моделями через чат-бот, самая мощная модель, Gemini Ultra, доступна только с платным чат-ботом Gemini Advanced. Источник

Технологии764 дня назад

Технологии | Нейросети | Боты

‍ Новости из мира LLM: Google обновили Gemini 1.5 Pro. Теперь нейронка умеет понимать аудио: она распознает слова, тон, эмоции и другие звуки. За раз можно загрузить до 11 часов аудио и задавать любые вопросы по содержанию. • Попробовать Mistral залили новую модель на торренты. Файл под названием mixtral-8x22b наталкивает на мысль, что модель MoE Mixture of Experts на 176B параметров если активны все 8 экспертов . Весит 281 GB. • Подробнее Вышла новая версия GPT-4-Turbo. GPT-4 Turbo с функцией Vision теперь широко доступен в API. Плюс ИИ теперь щелкает как орешки олимпиадные задачи по математике. И делает это гораздо лучше, чем предыдущая версия. • Подробнее

Технологии763 дня назад

TrendWatching

Новый гигант в мире нейросетей: Gemini 1.5 Pro научилась распознавать подкасты, лекции и даже ! Zoom-созвоны. Достаточно загрузить до 11 часов аудио-материала, чтобы ИИ распознал не только слова, но и палитру эмоций. Также Gemini поможет собрать саммари из нескольких часов обучающих лекций. Тестируем — здесь.

Технологии763 дня назад

GigaChat

На ежегодной конференции по облачным технологиям Google Cloud Next 2024 компания презентовала множество обновлений для своих продуктов с AI. Рассказываем о самом интересном: Выложили небольшие языковые модели CodeGemma для генерации кода на локальных машинах — 7B и 2B, а также маленькие общие модели для локального использования — Gemma 1.1 Разработали удобный Vertex AI Agent Builder — конструктор AI-агентов хорошего качества с большим количеством опций и готовых модулей Языковая модель Google Gemini 1.5 Pro научилась понимать аудио. Теперь нейросеть может распознавать слова, тон и эмоции и даже подготовить выжимку из подкастов или лекций Представили Google Vids — продвинутый AI-сервис для создания и редактирования видеопрезентаций Кроме того, в Gemini повысили качество написания кода, а также добавили основанную на модели систему Gemini Code Assist. Этот модуль может встраиваться как плагин в популярные платформы и помогать разработчикам писать код быстрее и безопаснее А ещё Google планирует использовать Gemini, чтобы создавать рекламу для Coca-Cola и Nestle В заключение Google представил новый Central processing unit CPU Axion — мощный и энергоэффективный процессор с производительностью на 30% больше, чем у аналогичных устройств

Технологии762 дня назад

Neural Brain - Нейросети

Google обновил Gemini 1.5 Pro Теперь нейронка понимает аудио. Фича была анонсирована раньше, но кнопки не было. ИИ распознает не только слова, но даже тон, эмоции и все звуки. Можно скинуть лекцию и получить викторину по содержанию за пару секунд, как на видео. Другой пример — суммировать многочасовые подкасты, уроки и совещания до кратких выжимок. Можно загрузить до 11 часов аудио за раз! Скорость обработки сумасшедшая. Также добавили режим JSON и открыли API без листа ожидания. Пользуемся бесплатно с VPN тут ChatGPT4.0 без ограничений и бесплатно для всех подписчиков канала. Бесплатный Бот Для Генерации Текста, Изображений, Видео и Аудио

Технологии764 дня назад

Папаха Нурмагомедова

Google обновил свою нейросеть Gemini 1.5 Pro, добавив функцию обработки аудио. Теперь с её помощью можно легко создавать текстовые выжимки из подкастов на любом языке, а также преобразовывать аудио и видео курсы в текстовый формат. Пошли расшифровывать доктора Берга и Хубермана

Технологии764 дня назад

AI Insider

Технологии764 дня назад

GPT | ChatGPT | Midjourney — GPTMain News

Самая мощная нейронка в мире Gemini 1.5 Pro научилась понимать аудио! Теперь этот монстр прожует вам многочасовые лекции, подкасты, созвоны и диктофонные записи. Смело лейте в неё до 11 часов аудио за раз! Другие возможности тоже поистине удивляют: • ИИ распознает не только слова, но даже тон и эмоции, с которыми они были произнесены • Нейронка в принципе понимает любые звуки — не только речь • Можно скинуть Gemini лекцию и получить мощный тест для самопроверки • Сократить многочасовые подкасты и лекции до коротких саммари — тоже не проблема.

Технологии763 дня назад

Не баг, а фича

Gemini 1.5 Pro научили анализировать многочасовые видосы на любую тему. Цепочка из ИИ-агентов изучит до 11 часов видео и подгонит подробный отчет на заданную тему. Первый ИИ ищет релевантные видео на YouTube, второй ИИ суммирует каждый ролик, а третий собирает всё в идеальный результат. На это уходит пару секунд. Поможет выбрать главное из обзоров, лекций, интервью, подкастов и чего угодно. Спасение для всех, у кого горят дедлайны — тут.

Технологии763 дня назад