9 февраля, 14:04
Российские ученые разработали новый алгоритм для распознавания эмоций в голосе
![Северный Телеграф](https://content.tek.fm/cb64c4f8-e6dc-46de-95ac-f117d9d0f108.jpg)
Северный Телеграф
Улучшено распознавание эмоций по голосу с помощью ИИ. Новый алгоритм, получивший название CA-SER, был разработан группой исследователей из лаборатории искусственного интеллекта Сбербанка, Института AIRI и МФТИ
Технологии3 дня назад
![Российские ученые разработали новую модель ИИ, способную распознавать эмоции в человеческой речи с высоким уровнем точности. Разработка исследователей значительным образом превзошла почти все существующие аналоги при работе с самыми сложными формами контента, сообщила пресс-служба Сбера. / Наука](https://content.tek.fm/e34c22ac-0e56-47bc-9f4b-4c33407750d8.jpg)
![ТАСС / Наука](https://content.tek.fm/f7a56c9b-82d0-4988-bf99-a5aeca13e21d.jpg)
ТАСС / Наука
Российские ученые разработали новую модель ИИ, способную распознавать эмоции в человеческой речи с высоким уровнем точности. Разработка исследователей значительным образом превзошла почти все существующие аналоги при работе с самыми сложными формами контента, сообщила пресс-служба Сбера. / Наука
Технологии3 дня назад
![Кролик с Неглинной](https://content.tek.fm/4b885da4-fbac-4bcc-a7fd-7c49a3875f61.jpg)
Кролик с Неглинной
Российские ученые разработали новую модель искусственного интеллекта, способную распознавать эмоции в человеческой речи с высоким уровнем точности. Новый алгоритм, получивший название CA-SER, был разработан группой исследователей из лаборатории искусственного интеллекта Сбербанка, Института AIRI и МФТИ.
Технологии3 дня назад
![Банковская Правда](https://content.tek.fm/ea95ecbb-8320-4dbc-8ace-a5f83ade9de6.jpg)
Банковская Правда
ИИ научился лучше распознавать эмоции по голосу • Российские ученые из лаборатории искусственного интеллекта Сбера, Института AIRI и МФТИ разработали новую модель искусственного интеллекта CA-SER, которая с высокой точностью определяет эмоции в человеческой речи. • Алгоритм, основанный на парадигме самообучения SSL, объединяет несколько подходов для анализа устной речи, учитывая как общие характеристики, так и детали, такие как громкость и тональность голоса. Модель уже протестирована на базе данных IEMOCAP, содержащей аудиозаписи, видеоклипы и тексты, связанные с различными эмоциями. Результаты показали, что CA-SER превзошел почти все существующие аналоги и оказался сопоставим с нейросетью HuBERT от Meta признана экстремистской в РФ . • Исходный код модели доступен для всех, что позволяет ученым улучшать ее универсальность и применять в голосовых помощниках, контакт-центрах и других системах, где важно точное распознавание эмоций, отмечают в Сбере.
Технологии2 дня назад
![Группа исследователей из лаборатории ИИ Сбербанка, Института AIRI и МФТИ разработали ИИ, способный распознавать эмоции в человеческой речи с высоким уровнем точности Новый алгоритм, получивший название CA-SER, построен на базе парадигмы самообучения SSL и объединяет в себе сразу несколько подходов, которые сегодня активно используются при анализе устной речи и для распознавания эмоций. Система сначала выделяет ключевые особенности речи, а затем дополняет их данными о громкости и тональности звуков, учитывая восприятие человеком разных частей аудиоспектра. Эти типы информации объединяются специальным механизмом, что улучшает точность определения эмоций. Исходный код модели доступен в открытом виде, поэтому другие ученые могут использовать инструмент в своих исследованиях, чтобы провести дополнительные эксперименты для проверки работы модели с другими языками и датасетами, повысить ее универсальность и применимость в реальных условиях. Так, модель можно обучать на русскоязычных эмоциональных корпусах и затем применять в голосовых помощниках и контакт-центрах — говорится в сообщении. Результаты показали, что российская разработка превосходит большинство аналогов и сравнима с трансформером HuBERT от Meta признана экстремистской и запрещена в РФ . Ученые рассчитывают, что это поможет улучшить работу голосовых помощников и других систем, распознающих эмоции. Тест Тьюринга. События в сфере ИИ. Подписаться #новостьдня](https://content.tek.fm/92c6b088-8b86-46fd-b36b-6867197b825a.jpg)
![Тест Тьюринга](https://content.tek.fm/58cad2a1-9617-47fe-bd0a-7bd50874caa4.jpg)
Тест Тьюринга
Группа исследователей из лаборатории ИИ Сбербанка, Института AIRI и МФТИ разработали ИИ, способный распознавать эмоции в человеческой речи с высоким уровнем точности Новый алгоритм, получивший название CA-SER, построен на базе парадигмы самообучения SSL и объединяет в себе сразу несколько подходов, которые сегодня активно используются при анализе устной речи и для распознавания эмоций. Система сначала выделяет ключевые особенности речи, а затем дополняет их данными о громкости и тональности звуков, учитывая восприятие человеком разных частей аудиоспектра. Эти типы информации объединяются специальным механизмом, что улучшает точность определения эмоций. Исходный код модели доступен в открытом виде, поэтому другие ученые могут использовать инструмент в своих исследованиях, чтобы провести дополнительные эксперименты для проверки работы модели с другими языками и датасетами, повысить ее универсальность и применимость в реальных условиях. Так, модель можно обучать на русскоязычных эмоциональных корпусах и затем применять в голосовых помощниках и контакт-центрах — говорится в сообщении. Результаты показали, что российская разработка превосходит большинство аналогов и сравнима с трансформером HuBERT от Meta признана экстремистской и запрещена в РФ . Ученые рассчитывают, что это поможет улучшить работу голосовых помощников и других систем, распознающих эмоции. Тест Тьюринга. События в сфере ИИ. Подписаться #новостьдня
Технологии1 день назад
![Исследователи из России улучшили распознавание эмоций по голосу с помощью ИИ Исследователи лаборатории искусственного интеллекта «Сбербанка», Института AIRI и МФТИ представили ИИ-модель Cross-Attention Feature Fusion for Speech Emotion Recognition CA-SER для распознавания эмоций человеческой речи. Модель при проверке при помощи образцов из базы данных IEMOCAP достигла высокой взвешенной точности 74,6%. CA-SER позволяет эффективно комбинировать высокоуровневые представления от SSL-моделей Self-Supervised Learning, самообучающихся с низкоуровневыми спектральными признаками. Сначала система детектирует важные характеристики речи, а затем добавляет к ним данные о звуках голоса например, их громкость и тональность . Эти два типа информации объединяются с помощью специального механизма, что помогает точнее определять эмоции говорящего. Исходный код модели есть в открытом доступе, что позволит другим ученым использовать инструмент в своих исследованиях, чтобы провести дополнительные эксперименты для проверки работы модели с другими языками и датасетами.](https://content.tek.fm/b4468787-ed4b-4402-875b-89d805ab4160.jpg)
![CDO2Day](https://content.tek.fm/2d2729bd-9478-44f3-9e58-8a0c2dc71907.jpg)
CDO2Day
Исследователи из России улучшили распознавание эмоций по голосу с помощью ИИ Исследователи лаборатории искусственного интеллекта «Сбербанка», Института AIRI и МФТИ представили ИИ-модель Cross-Attention Feature Fusion for Speech Emotion Recognition CA-SER для распознавания эмоций человеческой речи. Модель при проверке при помощи образцов из базы данных IEMOCAP достигла высокой взвешенной точности 74,6%. CA-SER позволяет эффективно комбинировать высокоуровневые представления от SSL-моделей Self-Supervised Learning, самообучающихся с низкоуровневыми спектральными признаками. Сначала система детектирует важные характеристики речи, а затем добавляет к ним данные о звуках голоса например, их громкость и тональность . Эти два типа информации объединяются с помощью специального механизма, что помогает точнее определять эмоции говорящего. Исходный код модели есть в открытом доступе, что позволит другим ученым использовать инструмент в своих исследованиях, чтобы провести дополнительные эксперименты для проверки работы модели с другими языками и датасетами.
Технологии9 часов назад
![Loading indicator gif](https://media.socium.fm/loading-animation-transparent.gif)
![Хватит искать: обнаружен лучший подарок 2025 года!](https://media.tek.fm/btc-banner-7.jpg)
![Российские учёные создали модель определения эмоций в речи В своей разработке CA-SER исследователи из AI-лаборатории Сбера, института AIRI и МФТИ объединили самообучение с использованием предобученной wav2vec 2.0 и акустических признаков MFCC через механизм перекрёстного внимания. К характеристикам речи добавляются данные о голосе, что и помогает выявлять эмоции Ещё подробности: ⏱ работает в режиме реального времени открыта для использования, можно адаптировать для голосовых ассистентов, call-центров, здравоохранения CA-SER показала точность 74,6% на сложном датасете IEMOCAP, опередив многие аналоги статью взяли в сборник крутой европейской конференции ECAI 2024 Изображение создано для канала Душа Питона с помощью Kandinsky 3.1](https://content.tek.fm/9a38ad20-036d-4958-be52-ea0b79f06553.jpg)
![Душа Питона](https://content.tek.fm/a1bca659-be33-4b6c-a672-768e8e02b229.jpg)
Душа Питона
Российские учёные создали модель определения эмоций в речи В своей разработке CA-SER исследователи из AI-лаборатории Сбера, института AIRI и МФТИ объединили самообучение с использованием предобученной wav2vec 2.0 и акустических признаков MFCC через механизм перекрёстного внимания. К характеристикам речи добавляются данные о голосе, что и помогает выявлять эмоции Ещё подробности: ⏱ работает в режиме реального времени открыта для использования, можно адаптировать для голосовых ассистентов, call-центров, здравоохранения CA-SER показала точность 74,6% на сложном датасете IEMOCAP, опередив многие аналоги статью взяли в сборник крутой европейской конференции ECAI 2024 Изображение создано для канала Душа Питона с помощью Kandinsky 3.1
Технологии3 дня назад
![В России совершен прорыв в развитии искусственного интеллекта Исследователи лаборатории искусственного интеллекта Сбербанка, Института AIRI и МФТИ представили AI-модель Cross-Attention Feature Fusion for Speech Emotion Recognition CA-SER для распознавания эмоций человеческой речи. Об этом сообщили в пресс-службе Сбера. ↗ Прислать новость Подписаться](https://content.tek.fm/3021a9c3-a175-4afe-aff4-a7d4ebde6f3f.jpg)
![Орловские новости](https://content.tek.fm/2c5f8277-2852-4d20-8d04-027755f9d562.jpg)
Орловские новости
В России совершен прорыв в развитии искусственного интеллекта Исследователи лаборатории искусственного интеллекта Сбербанка, Института AIRI и МФТИ представили AI-модель Cross-Attention Feature Fusion for Speech Emotion Recognition CA-SER для распознавания эмоций человеческой речи. Об этом сообщили в пресс-службе Сбера. ↗ Прислать новость Подписаться
Технологии1 день назад
![Цифровая экономика Telegram Группа исследователей из лаборатории искусственного интеллекта «Сбера», Института AIRI и МФТИ разработали «самообучающуюся» ИИ-модель CA-SER, способную распознавать эмоции в человеческой речи с высоким уровнем точности. Модель детектирует важные характеристики речи, после чего добавляет к ним данные о звуках голоса, в том числе их громкость и тональность, с учетом того, какую часть аудиоспектра лучше всего воспринимает человек. Модуль учитывает оба эти типа информации, что помогает точнее определять эмоции говорящего человека. В Института инновационного развития Самарского государственного медицинского университета СамГМУ разработали отечественные VR-симуляторы для подготовки будущих медработников. Тренажеры позволяют отрабатывать медицинские навыки, такие как, например,оведение исследования слуха и постановка диагноза, оказание экстренной помощии анафилактическом шоке, гипогликемии, судорожном синдроме, оказание неотложной помощиииступном... Перейти на оригинальный пост](https://content.tek.fm/c95b5739-801c-407c-b700-5f9288d77006.jpg)
![Сила Народа](https://content.tek.fm/5887efb3-7536-491e-b816-370c7dd39f71.jpg)
Сила Народа
Цифровая экономика Telegram Группа исследователей из лаборатории искусственного интеллекта «Сбера», Института AIRI и МФТИ разработали «самообучающуюся» ИИ-модель CA-SER, способную распознавать эмоции в человеческой речи с высоким уровнем точности. Модель детектирует важные характеристики речи, после чего добавляет к ним данные о звуках голоса, в том числе их громкость и тональность, с учетом того, какую часть аудиоспектра лучше всего воспринимает человек. Модуль учитывает оба эти типа информации, что помогает точнее определять эмоции говорящего человека. В Института инновационного развития Самарского государственного медицинского университета СамГМУ разработали отечественные VR-симуляторы для подготовки будущих медработников. Тренажеры позволяют отрабатывать медицинские навыки, такие как, например,оведение исследования слуха и постановка диагноза, оказание экстренной помощии анафилактическом шоке, гипогликемии, судорожном синдроме, оказание неотложной помощиииступном... Перейти на оригинальный пост
Технологии1 день назад
![Клиентский опыт и качество](https://content.tek.fm/99b30b16-e72e-4f1e-adce-751aa606932f.jpg)
Клиентский опыт и качество
Новость: Учёные улучшили распознавание эмоций по голосу с помощью ИИ Исследователи из лаборатории искусственного интеллекта Сбербанка, Института AIRI и МФТИ разработали AI-модель Cross-Attention Feature Fusion for Speech Emotion Recognition CA-SER для распознавания эмоций в речи. Она продемонстрировала высокую взвешенную точность 74,6% на одном из самых сложных датасетов для данной задачи - IEMOCAP Interactive Emotional Dyadic Motion Capture . По качеству работы модель превосходит большинство существующих методов. Сначала система выделяет ключевые характеристики речи, а затем дополняет их данными о голосовых особенностях громкость и тональность . Эти два типа информации объединяются с помощью специального механизма, который эффективно сочетает общие речевые признаки с детальными акустическими нюансами. Такой подход позволяет точнее распознавать эмоции говорящего. Этот инструмент решает проблему несоответствия между чистыми аудиоданными, на которых обучаются SSL-модели, и эмоциональными датасетами, содержащими разнообразные интонации и уровни интенсивности. Он находит применение в системах автоматического взаимодействия с человеком, таких как голосовые чат-боты, кол-центры, а также в цифровых сервисах мониторинга психологического состояния и других областях, где важно анализировать эмоции в режиме реального времени. Исходный код модели открыт, что позволяет исследователям и разработчикам проводить дополнительные эксперименты, тестировать её на разных языках и датасетах, а также повышать её универсальность. Модель можно обучать на русскоязычных эмоциональных корпусах и использовать в голосовых помощниках и контакт-центрах. Источник
Технологии12 часов назад
![Loading indicator gif](https://media.socium.fm/loading-animation-transparent.gif)
Похожие новости![Анализ внедрения ИИ в промышленность России: 35% предприятий имеют опыт](https://content.tek.fm/eda07d03-a879-4c17-9980-1c1c0065eb6b.jpg)
![Аватар Телеграм канала: МашТех](https://content.tek.fm/1cf54be1-a95b-410f-9010-819538534da0.jpg)
![Аватар Телеграм канала: Цифра63](https://content.tek.fm/9c969b22-028f-477b-861c-592de4ab204c.jpg)
![Аватар Телеграм канала: КОРУС Консалтинг | Кейсы, цифры и ИТ](https://content.tek.fm/c328a934-7365-41b2-bfb3-cf358725f83b.jpg)
+8![Anthropic представил исследование о влиянии ИИ на рынок труда и экономику](https://content.tek.fm/title/2025-02-11_17-11-07_823cbe8b-99dd-4610-b690-e94ac563f6ca.jpg)
![Аватар Телеграм канала: Все о блокчейн/мозге/space/WEB 3.0 в России и мире](https://content.tek.fm/904d98fe-98bf-489d-b83f-cf0ca3146b5c.jpg)
![Аватар Телеграм канала: AI Для Всех](https://content.tek.fm/5e4132cf-d2ad-489f-a762-ef885ada432b.jpg)
![Аватар Телеграм канала: ИИшная: поговорим о технологиях](https://content.tek.fm/45c09d51-7205-4182-8e0b-bde5e6871a17.jpg)
+4![Hailuo AI и Zonos представляют новые технологии для клонирования голоса](https://content.tek.fm/cbc3a0b9-0876-415c-b4a9-fe5014f1c64c.jpg)
![Аватар Телеграм канала: Digital Dealer](https://content.tek.fm/4972068f-1990-4c27-aa00-7ac4117c4aa2.jpg)
![Аватар Телеграм канала: Нейросети & Технологии | DeepTech](https://content.tek.fm/9b1436ca-e4ac-47bd-8fe1-a0b3d84eb302.jpg)
![Аватар Телеграм канала: vc.ru](https://content.tek.fm/6198a828-7460-4099-a2a4-20d64f12ef01.jpg)
+2![Тизер нового 'Лило и Стич' и реклама ChatGPT от OpenAI на Супербоуле](https://content.tek.fm/a3206bc9-fe01-4edc-a7e0-5b887cf12754.jpg)
![Аватар Телеграм канала: Маркетинг нефильтрованный](https://content.tek.fm/29039ef8-fc07-4758-9d88-4985201574c3.jpg)
![Аватар Телеграм канала: Breaking Trends](https://content.tek.fm/8b56e0ab-4bf1-44fe-8a27-6d788493c02f.jpg)
![Аватар Телеграм канала: Sostav](https://content.tek.fm/7e53f4bf-7974-429a-851d-658e6722f784.jpg)
+4![Искусственный интеллект генерирует фейковые научные статьи и вымышленных учёных](https://content.tek.fm/title/2025-02-11_17-24-23_9f673877-cab2-40be-b73a-c46b37b96fab.jpg)
![Аватар Телеграм канала: Банки, деньги, два офшора](https://content.tek.fm/dae1a9bb-6e5e-40a6-afba-76a17c2bf68d.jpg)
![Аватар Телеграм канала: Банкофф • Финансы](https://content.tek.fm/db19c574-12d3-497a-945a-4c70e58b4763.jpg)
![Аватар Телеграм канала: Банкос | Инвестиции и Финансы](https://content.tek.fm/82e88cc0-bdd9-45db-8398-c4a0b6069551.jpg)
+2![Сэм Альтман: Стоимость ИИ-сервисов продолжит снижаться](https://content.tek.fm/title/2025-02-10_11-41-44_61364c79-c941-4a00-b819-47ca0b31350b.jpg)
![Аватар Телеграм канала: ForkLog FEED](https://content.tek.fm/b21dbf11-dcdb-4879-9158-cc389e078453.jpg)
![Аватар Телеграм канала: Северный Телеграф](https://content.tek.fm/cb64c4f8-e6dc-46de-95ac-f117d9d0f108.jpg)
![Аватар Телеграм канала: DeCenter — блокчейн, биткоин, инвестиции](https://content.tek.fm/9e08837e-040c-4f81-a358-bf2aa30d4c21.jpg)
+1
![Анализ внедрения ИИ в промышленность России: 35% предприятий имеют опыт](https://content.tek.fm/eda07d03-a879-4c17-9980-1c1c0065eb6b.jpg)
Анализ внедрения ИИ в промышленность России: 35% предприятий имеют опыт
Технологии
22 часа назад![Аватар Телеграм канала: МашТех](https://content.tek.fm/1cf54be1-a95b-410f-9010-819538534da0.jpg)
![Аватар Телеграм канала: Цифра63](https://content.tek.fm/9c969b22-028f-477b-861c-592de4ab204c.jpg)
![Аватар Телеграм канала: КОРУС Консалтинг | Кейсы, цифры и ИТ](https://content.tek.fm/c328a934-7365-41b2-bfb3-cf358725f83b.jpg)
![Аватар Телеграм канала: CIO: канал IT руководителей](https://content.tek.fm/11e7e5f1-9c6b-4093-9fdc-b1f01b6da5c1.jpg)
![Anthropic представил исследование о влиянии ИИ на рынок труда и экономику](https://content.tek.fm/title/2025-02-11_17-11-07_823cbe8b-99dd-4610-b690-e94ac563f6ca.jpg)
Anthropic представил исследование о влиянии ИИ на рынок труда и экономику
Технологии
42 минуты назад![Аватар Телеграм канала: Все о блокчейн/мозге/space/WEB 3.0 в России и мире](https://content.tek.fm/904d98fe-98bf-489d-b83f-cf0ca3146b5c.jpg)
![Аватар Телеграм канала: AI Для Всех](https://content.tek.fm/5e4132cf-d2ad-489f-a762-ef885ada432b.jpg)
![Аватар Телеграм канала: ИИшная: поговорим о технологиях](https://content.tek.fm/45c09d51-7205-4182-8e0b-bde5e6871a17.jpg)
![Аватар Телеграм канала: Изобретая будущее](https://content.tek.fm/84d4d107-f662-45e4-8fd0-8bc822ec3b88.jpg)
![Hailuo AI и Zonos представляют новые технологии для клонирования голоса](https://content.tek.fm/cbc3a0b9-0876-415c-b4a9-fe5014f1c64c.jpg)
Hailuo AI и Zonos представляют новые технологии для клонирования голоса
Технологии
1 час назад![Аватар Телеграм канала: Digital Dealer](https://content.tek.fm/4972068f-1990-4c27-aa00-7ac4117c4aa2.jpg)
![Аватар Телеграм канала: Нейросети & Технологии | DeepTech](https://content.tek.fm/9b1436ca-e4ac-47bd-8fe1-a0b3d84eb302.jpg)
![Аватар Телеграм канала: vc.ru](https://content.tek.fm/6198a828-7460-4099-a2a4-20d64f12ef01.jpg)
![Аватар Телеграм канала: Чёрный Треугольник](https://content.tek.fm/66ab9841-273c-4d79-93ab-35b4c578d5b2.jpg)
![Тизер нового 'Лило и Стич' и реклама ChatGPT от OpenAI на Супербоуле](https://content.tek.fm/a3206bc9-fe01-4edc-a7e0-5b887cf12754.jpg)
Тизер нового 'Лило и Стич' и реклама ChatGPT от OpenAI на Супербоуле
Технологии
1 день назад![Аватар Телеграм канала: Маркетинг нефильтрованный](https://content.tek.fm/29039ef8-fc07-4758-9d88-4985201574c3.jpg)
![Аватар Телеграм канала: Breaking Trends](https://content.tek.fm/8b56e0ab-4bf1-44fe-8a27-6d788493c02f.jpg)
![Аватар Телеграм канала: Sostav](https://content.tek.fm/7e53f4bf-7974-429a-851d-658e6722f784.jpg)
![Аватар Телеграм канала: HATER.PRESS](https://content.tek.fm/70e576b0-8b7d-4b2b-a353-ee6b6486891b.jpg)
![Искусственный интеллект генерирует фейковые научные статьи и вымышленных учёных](https://content.tek.fm/title/2025-02-11_17-24-23_9f673877-cab2-40be-b73a-c46b37b96fab.jpg)
Искусственный интеллект генерирует фейковые научные статьи и вымышленных учёных
Технологии
29 минут назад![Аватар Телеграм канала: Банки, деньги, два офшора](https://content.tek.fm/dae1a9bb-6e5e-40a6-afba-76a17c2bf68d.jpg)
![Аватар Телеграм канала: Банкофф • Финансы](https://content.tek.fm/db19c574-12d3-497a-945a-4c70e58b4763.jpg)
![Аватар Телеграм канала: Банкос | Инвестиции и Финансы](https://content.tek.fm/82e88cc0-bdd9-45db-8398-c4a0b6069551.jpg)
![Аватар Телеграм канала: Кибер Дача 🕹️](https://content.tek.fm/ffe27a8c-6a8b-4767-831a-2cc4974482d2.jpg)
![Сэм Альтман: Стоимость ИИ-сервисов продолжит снижаться](https://content.tek.fm/title/2025-02-10_11-41-44_61364c79-c941-4a00-b819-47ca0b31350b.jpg)
Сэм Альтман: Стоимость ИИ-сервисов продолжит снижаться
Экономика
1 день назад![Аватар Телеграм канала: ForkLog FEED](https://content.tek.fm/b21dbf11-dcdb-4879-9158-cc389e078453.jpg)
![Аватар Телеграм канала: Северный Телеграф](https://content.tek.fm/cb64c4f8-e6dc-46de-95ac-f117d9d0f108.jpg)
![Аватар Телеграм канала: DeCenter — блокчейн, биткоин, инвестиции](https://content.tek.fm/9e08837e-040c-4f81-a358-bf2aa30d4c21.jpg)
![Аватар Телеграм канала: Хайтек+](https://content.tek.fm/d4e97681-377a-41a9-85bd-44e961fb4cdf.jpg)