26 августа, 15:05

Илон Маск подал антимонопольный иск против Apple и OpenAI на 1 миллиард долларов

Video is not supported
Machinelearning
Machinelearning
Microsoft выпустила открытую TTS VibeVoice VibeVoice опенсорсная система синтеза речи на английском и китайском языках для создания выразительного аудиоконтента длиной до 90 минут с участием до 4 различных спикеров В системе используются непрерывные токенизаторы речи на сверхнизкой частоте 7 5 Гц и комбинация из LLM для понимания контекста и диффузионная модель для генерации высококачественного аудио Код для инференса уже доступен на GitHub а модель на 1 5 млрд параметров и токенизатор на Hugging Face Обещают более крупную 7B и компактную 0 5B версии модели microsoft github io NotebookLM научился создавать видеообзоры на 80 языках включая русский Теперь возможность превращать загруженные документы и заметки в короткие видеопрезентации доступна на 80 языках включая русский Ранее функция работала только на английском Одновременно компания улучшила и Audio Overviews позволив создавать более длинные и детализированные аудиосводки на разных языках Оба обновления уже начали развертываться и по заявлению Google станут доступны всем пользователям по всему миру в течение недели blog google Nvidia анонсировала Jetson AGX Thor Jetson AGX Thor наиболее производительный на сегодняшний день компьютер для периферийных ИИ вычислений и робототехники Платформа обещает производительность в 2070 терафлопс FP4 что примерно в 7 5 раз превосходит предыдущее поколение Jetson Orin В основе системы GPU на архитектуре Blackwell 14 ядерный процессор Arm и 128 ГБ памяти LPDDR5X Это позволяет запускать большие языковые и мультимодальные модели локально обрабатывая данные с нескольких сенсоров с минимальной задержкой Платформа совместима с программными стеками Nvidia Isaac Metropolis и Holoscan Набор для разработчиков уже доступен для заказа по цене 3499 а поставки начнутся в следующем месяце Серийные модули Jetson T5000 для готовых роботов появятся в конце 2025 года по цене 2999 за штуку при заказе от 1000 единиц cnbc com Илон Маск подал иск на 1 млрд против Apple и OpenAI xAI и X подали в федеральный суд США антимонопольный иск на сумму 1 млрд долларов против Apple и OpenAI В иске утверждается что компании вступили в незаконный сговор с целью захвата рынков смартфонов и генеративного ИИ нарушая антимонопольное законодательство США Согласно 61 страничному документу эксклюзивная интеграция ChatGPT в iOS и манипуляции с ранжированием в App Store целенаправленно занижают позиции конкурирующих чат ботов Это по мнению Маска делает невозможным для любой другой ИИ компании кроме OpenAI достичь первого места в магазине приложений В Apple отказались от комментариев В OpenAI назвали иск продолжением систематических нападок со стороны господина Маска wsj com Brave обнаружили уязвимость в Comet от Perplexity Проблема по словам Brave заключается в так называемых непрямых инъекциях промптов Злоумышленники могут встраивать вредоносные команды в веб страницы которые ИИ ассистент Comet при анализе контента воспринимает как инструкции от пользователя В ходе тестов Brave продемонстрировала как можно заставить Comet прочитать и отправить атакующим конфиденциальные данные email адреса и одноразовые пароли Perplexity выпустила обновления однако проблема все еще не решена полностью brave com ai machinelearning big data news ai ml
Microsoft запустила проект VibeVoice ИИ который способен превращать текст в аудиоподкасты длительностью до 90 минут на английском и китайском языках Ключевые характеристики VibeVoice Генерация аудио с участием до 4 уникальных голосов Модели с 1 5 и 7 млрд параметров позволяющие создавать контент с длиной контекста до 64 тыс токенов Поддержка эмоций и управление диалогом в то время как интеграция голосов в потоковые сервисы возможна без использования внешних серверов Текущие ограничения Опубликованные голоса звучат реалистично но их искусственное происхождение заметно По состоянию на данный момент доступна поддержка только двух языков но в будущем планируется расширение Дополнительные сведения и инструкции доступны в репозитории на GitHub и на платформе Hugging Face Unlim AI
Unlim AI
Unlim AI
Microsoft запустила проект VibeVoice ИИ который способен превращать текст в аудиоподкасты длительностью до 90 минут на английском и китайском языках Ключевые характеристики VibeVoice Генерация аудио с участием до 4 уникальных голосов Модели с 1 5 и 7 млрд параметров позволяющие создавать контент с длиной контекста до 64 тыс токенов Поддержка эмоций и управление диалогом в то время как интеграция голосов в потоковые сервисы возможна без использования внешних серверов Текущие ограничения Опубликованные голоса звучат реалистично но их искусственное происхождение заметно По состоянию на данный момент доступна поддержка только двух языков но в будущем планируется расширение Дополнительные сведения и инструкции доступны в репозитории на GitHub и на платформе Hugging Face Unlim AI
Microsoft научила ИИ читать подкасты до полутора часов Microsoft выкатили новый проект VibeVoice с открытым исходным кодом Это система синтеза речи которая превращает текст в полноценные подкасты длительностью до 90 минут Работает пока только на английском и китайском но уже доступна онлайн и для локальной установки Главная фишка до четырёх разных голосов в одном диалоге В отличие от старых TTS систем тут диалоги звучат естественнее а реплики не похожи на робота из 2000 х Есть две версии 1 5 млрд параметров 90 минут окно 64k токенов и 7 млрд 45 минут окно 32k Для локального запуска понадобится от 7 до 18 ГБ видеопамяти Облегчённая версия на 0 5 млрд параметров обещает работать в реальном времени
Программист * Все о компьютерах
Программист * Все о компьютерах
Microsoft научила ИИ читать подкасты до полутора часов Microsoft выкатили новый проект VibeVoice с открытым исходным кодом Это система синтеза речи которая превращает текст в полноценные подкасты длительностью до 90 минут Работает пока только на английском и китайском но уже доступна онлайн и для локальной установки Главная фишка до четырёх разных голосов в одном диалоге В отличие от старых TTS систем тут диалоги звучат естественнее а реплики не похожи на робота из 2000 х Есть две версии 1 5 млрд параметров 90 минут окно 64k токенов и 7 млрд 45 минут окно 32k Для локального запуска понадобится от 7 до 18 ГБ видеопамяти Облегчённая версия на 0 5 млрд параметров обещает работать в реальном времени
Microsoft выпустила VibeVoice 1 5B бесплатную голосовую нейросеть Компания представила модель которая умеет превращать текст в 90 минутный диалог с четырьмя голосами Получается имитация живого разговора без перебиваний и постороннего шума словно дружеское радио шоу Поддержка двух языков английский и китайский Минимальные требования к железу достаточно RTX 3060 и 8 ГБ видеопамяти Исходный код доступен на GitHub так что можно запускать локально Для русскоязычных пользователей остаётся ждать расширения языковой поддержки но сама идея впечатляет диалоговая генерация теперь становится доступной буквально каждому
OMG GPT: Midjourney, DeepSeek, IT
OMG GPT: Midjourney, DeepSeek, IT
Microsoft выпустила VibeVoice 1 5B бесплатную голосовую нейросеть Компания представила модель которая умеет превращать текст в 90 минутный диалог с четырьмя голосами Получается имитация живого разговора без перебиваний и постороннего шума словно дружеское радио шоу Поддержка двух языков английский и китайский Минимальные требования к железу достаточно RTX 3060 и 8 ГБ видеопамяти Исходный код доступен на GitHub так что можно запускать локально Для русскоязычных пользователей остаётся ждать расширения языковой поддержки но сама идея впечатляет диалоговая генерация теперь становится доступной буквально каждому
Loading indicator gif
Video is not supported
Machine learning Interview
Machine learning Interview
Microsoft выкатил VibeVoice новую SoTA модель Text to Speech TTS на 1 5B параметров под лицензией MIT Возможности Генерация до 90 минут аудио за раз Поддержка 4 голосов одновременно Режим стриминга готовится версия на 7B Кросс языковая генерация и даже синтез пения Управление эмоциями и экспрессивностью речи Это делает VibeVoice одним из самых мощных и доступных open source TTS решений прямо сейчас Огромный шаг от Microsoft в сторону открытых голосовых технологий huggingface co microsoft VibeVoice 1 5B machinelearning interview
Microsoft выпустила ИИ инструмент для вайб подкастинга Модель VibeVoice по текстовым запросам может генерировать разговорные аудио длиной до 90 минут максимум с четырьмя персонажами В демоверсии пока доступны английский и китайский языки vc ru ai 2180738
vc.ru
vc.ru
Microsoft выпустила ИИ инструмент для вайб подкастинга Модель VibeVoice по текстовым запросам может генерировать разговорные аудио длиной до 90 минут максимум с четырьмя персонажами В демоверсии пока доступны английский и китайский языки vc ru ai 2180738
Microsoft выпустила бесплатную нейросеть VibeVoice Она создает аудио длиной 90 минут с диалогами на 4 человек Модель имитирует естественный разговор но без перебиваний При этом нейросеть не умеет добавлять фоновые звуки музыку и звуковые эффекты VibeVoice 1 5B поддерживает только английский и китайский языки Модель выложена на GitHub Для её работы потребуется минимум 7 ГБ видеопамяти поэтому подойдёт любая видеокарта с 8 ГБ например RTX 3060 Также протестировать VibeVoice 1 5B можно бесплатно на отдельном сайте достаточно вставить текст сценария выбрать число спикеров и их голоса   www iphones ru iNotes microsoft vypustila besplatnuyu neyroset vibevoice ona sozdaet audio dlinoy 90 minut s dialogami na 4 chelovek новости iphonesru
iPhones.ru
iPhones.ru
Microsoft выпустила бесплатную нейросеть VibeVoice Она создает аудио длиной 90 минут с диалогами на 4 человек Модель имитирует естественный разговор но без перебиваний При этом нейросеть не умеет добавлять фоновые звуки музыку и звуковые эффекты VibeVoice 1 5B поддерживает только английский и китайский языки Модель выложена на GitHub Для её работы потребуется минимум 7 ГБ видеопамяти поэтому подойдёт любая видеокарта с 8 ГБ например RTX 3060 Также протестировать VibeVoice 1 5B можно бесплатно на отдельном сайте достаточно вставить текст сценария выбрать число спикеров и их голоса www iphones ru iNotes microsoft vypustila besplatnuyu neyroset vibevoice ona sozdaet audio dlinoy 90 minut s dialogami na 4 chelovek новости iphonesru
Microsoft выпустила ИИ модель VibeVoice для создания подкастов по текстовым запросам Бесплатная демоверсия позволяет создать аудиозапись длиной до 90 минут по собственному текстовому запросу Модель имитирует естественный разговор с участием до четырёх собеседников что идеально подходит для создания нейросетевых подкастов Важно отметить что во время воспроизведения есть предупреждение о том что запись сгенерирована нейросетью В сам файл также встроен водяной знак сообщающий что это продукт ИИ Открытый код модели опубликован на GitHub Пока поддерживается только английский и китайский языки
Big Geek
Big Geek
Microsoft выпустила ИИ модель VibeVoice для создания подкастов по текстовым запросам Бесплатная демоверсия позволяет создать аудиозапись длиной до 90 минут по собственному текстовому запросу Модель имитирует естественный разговор с участием до четырёх собеседников что идеально подходит для создания нейросетевых подкастов Важно отметить что во время воспроизведения есть предупреждение о том что запись сгенерирована нейросетью В сам файл также встроен водяной знак сообщающий что это продукт ИИ Открытый код модели опубликован на GitHub Пока поддерживается только английский и китайский языки
Microsoft научила ИИ читать подкасты до полутора часов Microsoft выкатили новый проект VibeVoice с открытым исходным кодом Это система синтеза речи которая превращает текст в полноценные подкасты длительностью до 90 минут Работает пока только на английском и китайском но уже доступна онлайн и для локальной установки Главная фишка до четырёх разных голосов в одном диалоге В отличие от старых TTS систем тут диалоги звучат естественнее а реплики не похожи на робота из 2000 х Есть две версии 1 5 млрд параметров 90 минут окно 64k токенов и 7 млрд 45 минут окно 32k Для локального запуска понадобится от 7 до 18 ГБ видеопамяти Облегчённая версия на 0 5 млрд параметров обещает работать в реальном времени Код и инструкции уже лежат на GitHub и Hugging Face godnoTECH Новости IT
godnoTECH - Новости IT
godnoTECH - Новости IT
Microsoft научила ИИ читать подкасты до полутора часов Microsoft выкатили новый проект VibeVoice с открытым исходным кодом Это система синтеза речи которая превращает текст в полноценные подкасты длительностью до 90 минут Работает пока только на английском и китайском но уже доступна онлайн и для локальной установки Главная фишка до четырёх разных голосов в одном диалоге В отличие от старых TTS систем тут диалоги звучат естественнее а реплики не похожи на робота из 2000 х Есть две версии 1 5 млрд параметров 90 минут окно 64k токенов и 7 млрд 45 минут окно 32k Для локального запуска понадобится от 7 до 18 ГБ видеопамяти Облегчённая версия на 0 5 млрд параметров обещает работать в реальном времени Код и инструкции уже лежат на GitHub и Hugging Face godnoTECH Новости IT
Video is not supported
Квест Теории Каст и Ролей
Квест Теории Каст и Ролей
Microsoft выпустила открытую TTS VibeVoice VibeVoice опенсорсная система синтеза речи на английском и китайском языках для создания выразительного аудиоконтента длиной до 90 минут с участием до 4 различных спикеров В системе используются непрерывные токенизаторы речи на сверхнизкой частоте 7 5 Гц и комбинация из LLM для понимания контекста и диффузионная модель для генерации высококачественного аудио Код для инференса уже доступен на GitHub а модель на 1 5 млрд параметров и токенизатор на Hugging Face Обещают более крупную 7B и компактную 0 5B версии модели microsoft github io NotebookLM научился создавать видеообзоры на 80 языках включая русский Теперь возможность превращать загруженные документы и заметки в короткие видеопрезентации доступна на 80 языках включая русский Ранее функция работала только на английском Одновременно компания улучшила и Audio Overviews позволив создавать более длинные и детализированные аудиосводки на разных языках Оба обновления уже начали развертываться и по заявлению Google станут доступны всем пользователям по всему миру в течение недели blog google Nvidia анонсировала Jetson AGX Thor Jetson AGX Thor наиболее производительный на сегодняшний день компьютер для периферийных ИИ вычислений и робототехники Платформа обещает производительность в 2070 терафлопс FP4 что примерно в 7 5 раз превосходит предыдущее поколение Jetson Orin В основе системы GPU на архитектуре Blackwell 14 ядерный процессор Arm и 128 ГБ памяти LPDDR5X Это позволяет запускать большие языковые и мультимодальные модели локально обрабатывая данные с нескольких сенсоров с минимальной задержкой Платформа совместима с программными стеками Nvidia Isaac Metropolis и Holoscan Набор для разработчиков уже доступен для заказа по цене 3499 а поставки начнутся в следующем месяце Серийные модули Jetson T5000 для готовых роботов появятся в конце 2025 года по цене 2999 за штуку при заказе от 1000 единиц cnbc com Илон Маск подал иск на 1 млрд против Apple и OpenAI xAI и X подали в федеральный суд США антимонопольный иск на сумму 1 млрд долларов против Apple и OpenAI В иске утверждается что компании вступили в незаконный сговор с целью захвата рынков смартфонов и генеративного ИИ нарушая антимонопольное законодательство США Согласно 61 страничному документу эксклюзивная интеграция ChatGPT в iOS и манипуляции с ранжированием в App Store целенаправленно занижают позиции конкурирующих чат ботов Это по мнению Маска делает невозможным для любой другой ИИ компании кроме OpenAI достичь первого места в магазине приложений В Apple отказались от комментариев В OpenAI назвали иск продолжением систематических нападок со стороны господина Маска wsj com Brave обнаружили уязвимость в Comet от Perplexity Проблема по словам Brave заключается в так называемых непрямых инъекциях промптов Злоумышленники могут встраивать вредоносные команды в веб страницы которые ИИ ассистент Comet при анализе контента воспринимает как инструкции от пользователя В ходе тестов Brave продемонстрировала как можно заставить Comet прочитать и отправить атакующим конфиденциальные данные email адреса и одноразовые пароли Perplexity выпустила обновления однако проблема все еще не решена полностью brave com ai machinelearning big data news ai ml
Loading indicator gif