
Чёрный Треугольник
Meta представила SAM Audio первую унифицированную ИИ модель для сегментации звука ИИ умеет изолировать любой звук из сложных аудиомиксов По сути это Segment Anything но для звука Модель поддерживает три типа промптов текстовые описываете нужный звук словами визуальные кликаете на объект в видео чтобы изолировать его звук и span prompting совершенно новый подход позволяющий отметить временной отрезок где впервые появляется целевой звук Все три метода можно комбинировать для максимально точного контроля Meta уже работает над практическими применениями и вероятно она будет внедрена во все AR и VR очки корпорации ИИ доступна в открытом доступе код выложен на GitHub а попробовать её можно прямо сейчас в Segment Anything Playground признана экстремистской и запрещена в России мMм Soft Gear Links

Not Boring Tech
Вышла SAM Audio первая универсальная нейросеть которая вырезает любые звуки из видео в реальном времени с помощью простых запросов Есть три вида изоляции звука Текст пишете целевой объект лай собаки и получаете аудио дорожку только этого звука Например так можно вырезать вокал барабаны гитару и любые инструменты с максимальной точностью Визуал просто кликаете на человека или объект в кадре и забираете его звук Супер фича для шпионов можно подслушать что говорят люди даже если в видео очень шумно Span выделяете временные отрезки где слышен нужный звук и модель находит его во всей записи Абсолютно новый подход поисковик звука который упрощает работу с аудио в разы Ваш личный звукорежиссёр тут а код в опенсорс тут notboring tech

Дневник Технаря
Вышла ИМБА для звукарей первая нейронка для правки звука в реальном времени Работает сразу тремя способами По текстовому промпту пишите какой звук нужен голос инструмент шум и нейронка выделяет только его По визуалу достаточно нажать на источник звука в кадре Нейросеть понимает что именно вы выбрали и изолирует этот аудиопоток По временным отрезкам выбираете фрагмент аудио или видео и указываете нужный участок а ИИ сама находит этот звук и выносит его на отдельную дорожку Забираем имбу здесь а опенсорс код тут dnevteh
Похожие новости



+1







+4







+2



+5

OpenAI представила новые голосовые модели для улучшения диалогов и перевода в реальном времени
Технологии
1 день назад


+1
В России разработана система ИИ для беспилотников и автоматизации авиации
Технологии
1 день назад



Российские продажи умных колонок достигли 1 млн единиц в I квартале 2026 года
Экономика
1 день назад


+4
Финансовые стратегии: от создания капитала до инвестиций в условиях неопределенности
Экономика
1 день назад



В Белом море и Европе запускаются проекты по борьбе с пластиковым мусором
Наука
1 день назад


+2
В Молдове принят законопроект о запрете выступлений депутатов на русском языке
Политика
1 день назад


+5