26 августа, 15:05

Илон Маск подал антимонопольный иск против Apple и OpenAI на 1 миллиард долларов

Machinelearning
Machinelearning
Microsoft выпустила открытую TTS VibeVoice VibeVoice опенсорсная система синтеза речи на английском и китайском языках для создания выразительного аудиоконтента длиной до 90 минут с участием до 4 различных спикеров В системе используются непрерывные токенизаторы речи на сверхнизкой частоте 7 5 Гц и комбинация из LLM для понимания контекста и диффузионная модель для генерации высококачественного аудио Код для инференса уже доступен на GitHub а модель на 1 5 млрд параметров и токенизатор на Hugging Face Обещают более крупную 7B и компактную 0 5B версии модели microsoft github io NotebookLM научился создавать видеообзоры на 80 языках включая русский Теперь возможность превращать загруженные документы и заметки в короткие видеопрезентации доступна на 80 языках включая русский Ранее функция работала только на английском Одновременно компания улучшила и Audio Overviews позволив создавать более длинные и детализированные аудиосводки на разных языках Оба обновления уже начали развертываться и по заявлению Google станут доступны всем пользователям по всему миру в течение недели blog google Nvidia анонсировала Jetson AGX Thor Jetson AGX Thor наиболее производительный на сегодняшний день компьютер для периферийных ИИ вычислений и робототехники Платформа обещает производительность в 2070 терафлопс FP4 что примерно в 7 5 раз превосходит предыдущее поколение Jetson Orin В основе системы GPU на архитектуре Blackwell 14 ядерный процессор Arm и 128 ГБ памяти LPDDR5X Это позволяет запускать большие языковые и мультимодальные модели локально обрабатывая данные с нескольких сенсоров с минимальной задержкой Платформа совместима с программными стеками Nvidia Isaac Metropolis и Holoscan Набор для разработчиков уже доступен для заказа по цене 3499 а поставки начнутся в следующем месяце Серийные модули Jetson T5000 для готовых роботов появятся в конце 2025 года по цене 2999 за штуку при заказе от 1000 единиц cnbc com Илон Маск подал иск на 1 млрд против Apple и OpenAI xAI и X подали в федеральный суд США антимонопольный иск на сумму 1 млрд долларов против Apple и OpenAI В иске утверждается что компании вступили в незаконный сговор с целью захвата рынков смартфонов и генеративного ИИ нарушая антимонопольное законодательство США Согласно 61 страничному документу эксклюзивная интеграция ChatGPT в iOS и манипуляции с ранжированием в App Store целенаправленно занижают позиции конкурирующих чат ботов Это по мнению Маска делает невозможным для любой другой ИИ компании кроме OpenAI достичь первого места в магазине приложений В Apple отказались от комментариев В OpenAI назвали иск продолжением систематических нападок со стороны господина Маска wsj com Brave обнаружили уязвимость в Comet от Perplexity Проблема по словам Brave заключается в так называемых непрямых инъекциях промптов Злоумышленники могут встраивать вредоносные команды в веб страницы которые ИИ ассистент Comet при анализе контента воспринимает как инструкции от пользователя В ходе тестов Brave продемонстрировала как можно заставить Comet прочитать и отправить атакующим конфиденциальные данные email адреса и одноразовые пароли Perplexity выпустила обновления однако проблема все еще не решена полностью brave com ai machinelearning big data news ai ml
Machine learning Interview
Machine learning Interview
Microsoft выкатил VibeVoice новую SoTA модель Text to Speech TTS на 1 5B параметров под лицензией MIT Возможности Генерация до 90 минут аудио за раз Поддержка 4 голосов одновременно Режим стриминга готовится версия на 7B Кросс языковая генерация и даже синтез пения Управление эмоциями и экспрессивностью речи Это делает VibeVoice одним из самых мощных и доступных open source TTS решений прямо сейчас Огромный шаг от Microsoft в сторону открытых голосовых технологий huggingface co microsoft VibeVoice 1 5B machinelearning interview
Microsoft выпустила ИИ инструмент для вайб подкастинга Модель VibeVoice по текстовым запросам может генерировать разговорные аудио длиной до 90 минут максимум с четырьмя персонажами В демоверсии пока доступны английский и китайский языки vc ru ai 2180738
vc.ru
vc.ru
Microsoft выпустила ИИ инструмент для вайб подкастинга Модель VibeVoice по текстовым запросам может генерировать разговорные аудио длиной до 90 минут максимум с четырьмя персонажами В демоверсии пока доступны английский и китайский языки vc ru ai 2180738
Microsoft выпустила бесплатную нейросеть VibeVoice Она создает аудио длиной 90 минут с диалогами на 4 человек Модель имитирует естественный разговор но без перебиваний При этом нейросеть не умеет добавлять фоновые звуки музыку и звуковые эффекты VibeVoice 1 5B поддерживает только английский и китайский языки Модель выложена на GitHub Для её работы потребуется минимум 7 ГБ видеопамяти поэтому подойдёт любая видеокарта с 8 ГБ например RTX 3060 Также протестировать VibeVoice 1 5B можно бесплатно на отдельном сайте достаточно вставить текст сценария выбрать число спикеров и их голоса   www iphones ru iNotes microsoft vypustila besplatnuyu neyroset vibevoice ona sozdaet audio dlinoy 90 minut s dialogami na 4 chelovek новости iphonesru
iPhones.ru
iPhones.ru
Microsoft выпустила бесплатную нейросеть VibeVoice Она создает аудио длиной 90 минут с диалогами на 4 человек Модель имитирует естественный разговор но без перебиваний При этом нейросеть не умеет добавлять фоновые звуки музыку и звуковые эффекты VibeVoice 1 5B поддерживает только английский и китайский языки Модель выложена на GitHub Для её работы потребуется минимум 7 ГБ видеопамяти поэтому подойдёт любая видеокарта с 8 ГБ например RTX 3060 Также протестировать VibeVoice 1 5B можно бесплатно на отдельном сайте достаточно вставить текст сценария выбрать число спикеров и их голоса www iphones ru iNotes microsoft vypustila besplatnuyu neyroset vibevoice ona sozdaet audio dlinoy 90 minut s dialogami na 4 chelovek новости iphonesru