26 августа, 15:05
Илон Маск подал антимонопольный иск против Apple и OpenAI на 1 миллиард долларов

Machinelearning
Microsoft выпустила открытую TTS VibeVoice VibeVoice опенсорсная система синтеза речи на английском и китайском языках для создания выразительного аудиоконтента длиной до 90 минут с участием до 4 различных спикеров В системе используются непрерывные токенизаторы речи на сверхнизкой частоте 7 5 Гц и комбинация из LLM для понимания контекста и диффузионная модель для генерации высококачественного аудио Код для инференса уже доступен на GitHub а модель на 1 5 млрд параметров и токенизатор на Hugging Face Обещают более крупную 7B и компактную 0 5B версии модели microsoft github io NotebookLM научился создавать видеообзоры на 80 языках включая русский Теперь возможность превращать загруженные документы и заметки в короткие видеопрезентации доступна на 80 языках включая русский Ранее функция работала только на английском Одновременно компания улучшила и Audio Overviews позволив создавать более длинные и детализированные аудиосводки на разных языках Оба обновления уже начали развертываться и по заявлению Google станут доступны всем пользователям по всему миру в течение недели blog google Nvidia анонсировала Jetson AGX Thor Jetson AGX Thor наиболее производительный на сегодняшний день компьютер для периферийных ИИ вычислений и робототехники Платформа обещает производительность в 2070 терафлопс FP4 что примерно в 7 5 раз превосходит предыдущее поколение Jetson Orin В основе системы GPU на архитектуре Blackwell 14 ядерный процессор Arm и 128 ГБ памяти LPDDR5X Это позволяет запускать большие языковые и мультимодальные модели локально обрабатывая данные с нескольких сенсоров с минимальной задержкой Платформа совместима с программными стеками Nvidia Isaac Metropolis и Holoscan Набор для разработчиков уже доступен для заказа по цене 3499 а поставки начнутся в следующем месяце Серийные модули Jetson T5000 для готовых роботов появятся в конце 2025 года по цене 2999 за штуку при заказе от 1000 единиц cnbc com Илон Маск подал иск на 1 млрд против Apple и OpenAI xAI и X подали в федеральный суд США антимонопольный иск на сумму 1 млрд долларов против Apple и OpenAI В иске утверждается что компании вступили в незаконный сговор с целью захвата рынков смартфонов и генеративного ИИ нарушая антимонопольное законодательство США Согласно 61 страничному документу эксклюзивная интеграция ChatGPT в iOS и манипуляции с ранжированием в App Store целенаправленно занижают позиции конкурирующих чат ботов Это по мнению Маска делает невозможным для любой другой ИИ компании кроме OpenAI достичь первого места в магазине приложений В Apple отказались от комментариев В OpenAI назвали иск продолжением систематических нападок со стороны господина Маска wsj com Brave обнаружили уязвимость в Comet от Perplexity Проблема по словам Brave заключается в так называемых непрямых инъекциях промптов Злоумышленники могут встраивать вредоносные команды в веб страницы которые ИИ ассистент Comet при анализе контента воспринимает как инструкции от пользователя В ходе тестов Brave продемонстрировала как можно заставить Comet прочитать и отправить атакующим конфиденциальные данные email адреса и одноразовые пароли Perplexity выпустила обновления однако проблема все еще не решена полностью brave com ai machinelearning big data news ai ml
Технологии122 дня назад


godnoTECH - Новости IT
Microsoft научила ИИ читать подкасты до полутора часов Microsoft выкатили новый проект VibeVoice с открытым исходным кодом Это система синтеза речи которая превращает текст в полноценные подкасты длительностью до 90 минут Работает пока только на английском и китайском но уже доступна онлайн и для локальной установки Главная фишка до четырёх разных голосов в одном диалоге В отличие от старых TTS систем тут диалоги звучат естественнее а реплики не похожи на робота из 2000 х Есть две версии 1 5 млрд параметров 90 минут окно 64k токенов и 7 млрд 45 минут окно 32k Для локального запуска понадобится от 7 до 18 ГБ видеопамяти Облегчённая версия на 0 5 млрд параметров обещает работать в реальном времени Код и инструкции уже лежат на GitHub и Hugging Face godnoTECH Новости IT
Технологии119 дней назад


OMG GPT: Midjourney, DeepSeek, IT
Microsoft выпустила VibeVoice 1 5B бесплатную голосовую нейросеть Компания представила модель которая умеет превращать текст в 90 минутный диалог с четырьмя голосами Получается имитация живого разговора без перебиваний и постороннего шума словно дружеское радио шоу Поддержка двух языков английский и китайский Минимальные требования к железу достаточно RTX 3060 и 8 ГБ видеопамяти Исходный код доступен на GitHub так что можно запускать локально Для русскоязычных пользователей остаётся ждать расширения языковой поддержки но сама идея впечатляет диалоговая генерация теперь становится доступной буквально каждому
Технологии110 дней назад

Machine learning Interview
Microsoft выкатил VibeVoice новую SoTA модель Text to Speech TTS на 1 5B параметров под лицензией MIT Возможности Генерация до 90 минут аудио за раз Поддержка 4 голосов одновременно Режим стриминга готовится версия на 7B Кросс языковая генерация и даже синтез пения Управление эмоциями и экспрессивностью речи Это делает VibeVoice одним из самых мощных и доступных open source TTS решений прямо сейчас Огромный шаг от Microsoft в сторону открытых голосовых технологий huggingface co microsoft VibeVoice 1 5B machinelearning interview
Технологии121 день назад


vc.ru
Microsoft выпустила ИИ инструмент для вайб подкастинга Модель VibeVoice по текстовым запросам может генерировать разговорные аудио длиной до 90 минут максимум с четырьмя персонажами В демоверсии пока доступны английский и китайский языки vc ru ai 2180738
Технологии121 день назад


iPhones.ru
Microsoft выпустила бесплатную нейросеть VibeVoice Она создает аудио длиной 90 минут с диалогами на 4 человек Модель имитирует естественный разговор но без перебиваний При этом нейросеть не умеет добавлять фоновые звуки музыку и звуковые эффекты VibeVoice 1 5B поддерживает только английский и китайский языки Модель выложена на GitHub Для её работы потребуется минимум 7 ГБ видеопамяти поэтому подойдёт любая видеокарта с 8 ГБ например RTX 3060 Также протестировать VibeVoice 1 5B можно бесплатно на отдельном сайте достаточно вставить текст сценария выбрать число спикеров и их голоса www iphones ru iNotes microsoft vypustila besplatnuyu neyroset vibevoice ona sozdaet audio dlinoy 90 minut s dialogami na 4 chelovek новости iphonesru
Технологии121 день назад


Big Geek
Microsoft выпустила ИИ модель VibeVoice для создания подкастов по текстовым запросам Бесплатная демоверсия позволяет создать аудиозапись длиной до 90 минут по собственному текстовому запросу Модель имитирует естественный разговор с участием до четырёх собеседников что идеально подходит для создания нейросетевых подкастов Важно отметить что во время воспроизведения есть предупреждение о том что запись сгенерирована нейросетью В сам файл также встроен водяной знак сообщающий что это продукт ИИ Открытый код модели опубликован на GitHub Пока поддерживается только английский и китайский языки
Технологии121 день назад


Программист * Все о компьютерах
Microsoft научила ИИ читать подкасты до полутора часов Microsoft выкатили новый проект VibeVoice с открытым исходным кодом Это система синтеза речи которая превращает текст в полноценные подкасты длительностью до 90 минут Работает пока только на английском и китайском но уже доступна онлайн и для локальной установки Главная фишка до четырёх разных голосов в одном диалоге В отличие от старых TTS систем тут диалоги звучат естественнее а реплики не похожи на робота из 2000 х Есть две версии 1 5 млрд параметров 90 минут окно 64k токенов и 7 млрд 45 минут окно 32k Для локального запуска понадобится от 7 до 18 ГБ видеопамяти Облегчённая версия на 0 5 млрд параметров обещает работать в реальном времени
Технологии118 дней назад

Квест Теории Каст и Ролей
Microsoft выпустила открытую TTS VibeVoice VibeVoice опенсорсная система синтеза речи на английском и китайском языках для создания выразительного аудиоконтента длиной до 90 минут с участием до 4 различных спикеров В системе используются непрерывные токенизаторы речи на сверхнизкой частоте 7 5 Гц и комбинация из LLM для понимания контекста и диффузионная модель для генерации высококачественного аудио Код для инференса уже доступен на GitHub а модель на 1 5 млрд параметров и токенизатор на Hugging Face Обещают более крупную 7B и компактную 0 5B версии модели microsoft github io NotebookLM научился создавать видеообзоры на 80 языках включая русский Теперь возможность превращать загруженные документы и заметки в короткие видеопрезентации доступна на 80 языках включая русский Ранее функция работала только на английском Одновременно компания улучшила и Audio Overviews позволив создавать более длинные и детализированные аудиосводки на разных языках Оба обновления уже начали развертываться и по заявлению Google станут доступны всем пользователям по всему миру в течение недели blog google Nvidia анонсировала Jetson AGX Thor Jetson AGX Thor наиболее производительный на сегодняшний день компьютер для периферийных ИИ вычислений и робототехники Платформа обещает производительность в 2070 терафлопс FP4 что примерно в 7 5 раз превосходит предыдущее поколение Jetson Orin В основе системы GPU на архитектуре Blackwell 14 ядерный процессор Arm и 128 ГБ памяти LPDDR5X Это позволяет запускать большие языковые и мультимодальные модели локально обрабатывая данные с нескольких сенсоров с минимальной задержкой Платформа совместима с программными стеками Nvidia Isaac Metropolis и Holoscan Набор для разработчиков уже доступен для заказа по цене 3499 а поставки начнутся в следующем месяце Серийные модули Jetson T5000 для готовых роботов появятся в конце 2025 года по цене 2999 за штуку при заказе от 1000 единиц cnbc com Илон Маск подал иск на 1 млрд против Apple и OpenAI xAI и X подали в федеральный суд США антимонопольный иск на сумму 1 млрд долларов против Apple и OpenAI В иске утверждается что компании вступили в незаконный сговор с целью захвата рынков смартфонов и генеративного ИИ нарушая антимонопольное законодательство США Согласно 61 страничному документу эксклюзивная интеграция ChatGPT в iOS и манипуляции с ранжированием в App Store целенаправленно занижают позиции конкурирующих чат ботов Это по мнению Маска делает невозможным для любой другой ИИ компании кроме OpenAI достичь первого места в магазине приложений В Apple отказались от комментариев В OpenAI назвали иск продолжением систематических нападок со стороны господина Маска wsj com Brave обнаружили уязвимость в Comet от Perplexity Проблема по словам Brave заключается в так называемых непрямых инъекциях промптов Злоумышленники могут встраивать вредоносные команды в веб страницы которые ИИ ассистент Comet при анализе контента воспринимает как инструкции от пользователя В ходе тестов Brave продемонстрировала как можно заставить Comet прочитать и отправить атакующим конфиденциальные данные email адреса и одноразовые пароли Perplexity выпустила обновления однако проблема все еще не решена полностью brave com ai machinelearning big data news ai ml
Технологии118 дней назад
Похожие новости






+2






+3






+22

Hugging Face предлагает бесплатные курсы и обширную библиотеку нейронных сетей
Технологии
18 часов назад


Яндекс интегрирует Алису AI в поиск для улучшения взаимодействия с пользователями
Технологии
18 часов назад


+2
Google представила гайд по чат ботам с рекомендациями на 2025 год
Технологии
22 часа назад


Китай вводит строгие правила для ИИ, чтобы сохранить контроль и конкурентоспособность
Технологии
21 час назад


+3
Запуск каталога из 33 тысяч скиллов для Claude и OpenAI Codex
Технологии
1 час назад


Путин инициирует переквалификацию работников в условиях роста искусственного интеллекта
Общество
22 часа назад


+22