18 декабря, 09:46

Meta запускает SAM Audio: ИИ для изоляции звуков из видео

Чёрный Треугольник
Чёрный Треугольник
Meta представила SAM Audio первую унифицированную ИИ модель для сегментации звука ИИ умеет изолировать любой звук из сложных аудиомиксов По сути это Segment Anything но для звука Модель поддерживает три типа промптов текстовые описываете нужный звук словами визуальные кликаете на объект в видео чтобы изолировать его звук и span prompting совершенно новый подход позволяющий отметить временной отрезок где впервые появляется целевой звук Все три метода можно комбинировать для максимально точного контроля Meta уже работает над практическими применениями и вероятно она будет внедрена во все AR и VR очки корпорации ИИ доступна в открытом доступе код выложен на GitHub а попробовать её можно прямо сейчас в Segment Anything Playground признана экстремистской и запрещена в России мMм Soft Gear Links
Not Boring Tech
Not Boring Tech
Вышла SAM Audio первая универсальная нейросеть которая вырезает любые звуки из видео в реальном времени с помощью простых запросов Есть три вида изоляции звука Текст пишете целевой объект лай собаки и получаете аудио дорожку только этого звука Например так можно вырезать вокал барабаны гитару и любые инструменты с максимальной точностью Визуал просто кликаете на человека или объект в кадре и забираете его звук Супер фича для шпионов можно подслушать что говорят люди даже если в видео очень шумно Span выделяете временные отрезки где слышен нужный звук и модель находит его во всей записи Абсолютно новый подход поисковик звука который упрощает работу с аудио в разы Ваш личный звукорежиссёр тут а код в опенсорс тут notboring tech