26 августа, 15:05

Илон Маск подал антимонопольный иск против Apple и OpenAI на 1 миллиард долларов

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

Video is not supported

Microsoft выпустила открытую TTS VibeVoice VibeVoice опенсорсная система синтеза речи на английском и китайском языках для создания выразительного аудиоконтента длиной до 90 минут с участием до 4 различных спикеров В системе используются непрерывные токенизаторы речи на сверхнизкой частоте 7 5 Гц и комбинация из LLM для понимания контекста и диффузионная модель для генерации высококачественного аудио Код для инференса уже доступен на GitHub а модель на 1 5 млрд параметров и токенизатор на Hugging Face Обещают более крупную 7B и компактную 0 5B версии модели microsoft github io NotebookLM научился создавать видеообзоры на 80 языках включая русский Теперь возможность превращать загруженные документы и заметки в короткие видеопрезентации доступна на 80 языках включая русский Ранее функция работала только на английском Одновременно компания улучшила и Audio Overviews позволив создавать более длинные и детализированные аудиосводки на разных языках Оба обновления уже начали развертываться и по заявлению Google станут доступны всем пользователям по всему миру в течение недели blog google Nvidia анонсировала Jetson AGX Thor Jetson AGX Thor наиболее производительный на сегодняшний день компьютер для периферийных ИИ вычислений и робототехники Платформа обещает производительность в 2070 терафлопс FP4 что примерно в 7 5 раз превосходит предыдущее поколение Jetson Orin В основе системы GPU на архитектуре Blackwell 14 ядерный процессор Arm и 128 ГБ памяти LPDDR5X Это позволяет запускать большие языковые и мультимодальные модели локально обрабатывая данные с нескольких сенсоров с минимальной задержкой Платформа совместима с программными стеками Nvidia Isaac Metropolis и Holoscan Набор для разработчиков уже доступен для заказа по цене 3499 а поставки начнутся в следующем месяце Серийные модули Jetson T5000 для готовых роботов появятся в конце 2025 года по цене 2999 за штуку при заказе от 1000 единиц cnbc com Илон Маск подал иск на 1 млрд против Apple и OpenAI xAI и X подали в федеральный суд США антимонопольный иск на сумму 1 млрд долларов против Apple и OpenAI В иске утверждается что компании вступили в незаконный сговор с целью захвата рынков смартфонов и генеративного ИИ нарушая антимонопольное законодательство США Согласно 61 страничному документу эксклюзивная интеграция ChatGPT в iOS и манипуляции с ранжированием в App Store целенаправленно занижают позиции конкурирующих чат ботов Это по мнению Маска делает невозможным для любой другой ИИ компании кроме OpenAI достичь первого места в магазине приложений В Apple отказались от комментариев В OpenAI назвали иск продолжением систематических нападок со стороны господина Маска wsj com Brave обнаружили уязвимость в Comet от Perplexity Проблема по словам Brave заключается в так называемых непрямых инъекциях промптов Злоумышленники могут встраивать вредоносные команды в веб страницы которые ИИ ассистент Comet при анализе контента воспринимает как инструкции от пользователя В ходе тестов Brave продемонстрировала как можно заставить Comet прочитать и отправить атакующим конфиденциальные данные email адреса и одноразовые пароли Perplexity выпустила обновления однако проблема все еще не решена полностью brave com ai machinelearning big data news ai ml

Технологии258 дней назад

godnoTECH - Новости IT

Microsoft научила ИИ читать подкасты до полутора часов Microsoft выкатили новый проект VibeVoice с открытым исходным кодом Это система синтеза речи которая превращает текст в полноценные подкасты длительностью до 90 минут Работает пока только на английском и китайском но уже доступна онлайн и для локальной установки Главная фишка до четырёх разных голосов в одном диалоге В отличие от старых TTS систем тут диалоги звучат естественнее а реплики не похожи на робота из 2000 х Есть две версии 1 5 млрд параметров 90 минут окно 64k токенов и 7 млрд 45 минут окно 32k Для локального запуска понадобится от 7 до 18 ГБ видеопамяти Облегчённая версия на 0 5 млрд параметров обещает работать в реальном времени Код и инструкции уже лежат на GitHub и Hugging Face godnoTECH Новости IT

Технологии254 дня назад

OMG GPT: Midjourney, DeepSeek, IT

Microsoft выпустила VibeVoice 1 5B бесплатную голосовую нейросеть Компания представила модель которая умеет превращать текст в 90 минутный диалог с четырьмя голосами Получается имитация живого разговора без перебиваний и постороннего шума словно дружеское радио шоу Поддержка двух языков английский и китайский Минимальные требования к железу достаточно RTX 3060 и 8 ГБ видеопамяти Исходный код доступен на GitHub так что можно запускать локально Для русскоязычных пользователей остаётся ждать расширения языковой поддержки но сама идея впечатляет диалоговая генерация теперь становится доступной буквально каждому

Технологии246 дней назад

Video is not supported

Machine learning Interview

Microsoft выкатил VibeVoice новую SoTA модель Text to Speech TTS на 1 5B параметров под лицензией MIT Возможности Генерация до 90 минут аудио за раз Поддержка 4 голосов одновременно Режим стриминга готовится версия на 7B Кросс языковая генерация и даже синтез пения Управление эмоциями и экспрессивностью речи Это делает VibeVoice одним из самых мощных и доступных open source TTS решений прямо сейчас Огромный шаг от Microsoft в сторону открытых голосовых технологий huggingface co microsoft VibeVoice 1 5B machinelearning interview

Технологии257 дней назад

vc.ru

Microsoft выпустила ИИ инструмент для вайб подкастинга Модель VibeVoice по текстовым запросам может генерировать разговорные аудио длиной до 90 минут максимум с четырьмя персонажами В демоверсии пока доступны английский и китайский языки vc ru ai 2180738

Технологии257 дней назад

iPhones.ru

Microsoft выпустила бесплатную нейросеть VibeVoice Она создает аудио длиной 90 минут с диалогами на 4 человек Модель имитирует естественный разговор но без перебиваний При этом нейросеть не умеет добавлять фоновые звуки музыку и звуковые эффекты VibeVoice 1 5B поддерживает только английский и китайский языки Модель выложена на GitHub Для её работы потребуется минимум 7 ГБ видеопамяти поэтому подойдёт любая видеокарта с 8 ГБ например RTX 3060 Также протестировать VibeVoice 1 5B можно бесплатно на отдельном сайте достаточно вставить текст сценария выбрать число спикеров и их голоса www iphones ru iNotes microsoft vypustila besplatnuyu neyroset vibevoice ona sozdaet audio dlinoy 90 minut s dialogami na 4 chelovek новости iphonesru

Технологии257 дней назад

Big Geek

Microsoft выпустила ИИ модель VibeVoice для создания подкастов по текстовым запросам Бесплатная демоверсия позволяет создать аудиозапись длиной до 90 минут по собственному текстовому запросу Модель имитирует естественный разговор с участием до четырёх собеседников что идеально подходит для создания нейросетевых подкастов Важно отметить что во время воспроизведения есть предупреждение о том что запись сгенерирована нейросетью В сам файл также встроен водяной знак сообщающий что это продукт ИИ Открытый код модели опубликован на GitHub Пока поддерживается только английский и китайский языки

Технологии257 дней назад

Программист * Все о компьютерах

Технологии254 дня назад

Video is not supported

Квест Теории Каст и Ролей

Технологии254 дня назад