22 июля, 16:00
«Т-Технологии» представили модель T-one для распознавания речи с открытым доступом


Forbes Russia
«Т-Технологии» опубликовали ИИ-модель, умеющую троллить мошенников ИИ-центр группы «Т-Технологии», владеющей 99,97% акций «Т-Банка», выложил в открытый доступ модель автоматического распознавания речи T-one. о данным «Т-Технологий», T-one состоит из 70 млн параметров, то есть сравнительно небольшого размера. Для сравнения: ASR-модель компании SberDevices GigaAM состоит из 240 млн параметров, в ASR-модели Whisper large-v3 от OpenAI — 1,55 млрд параметров. По оценке «Т-Технологий», Т-one обгоняет большие открытые ASR-модели, GigaAM v2 и Whisper Large-v3 по качеству распознавания на русском в телефонии. «Такие модели могут быть интересны и бизнесу, и научному сообществу: размер T-one позволяет запустить модель с ноутбука, и даже с учетом обслуживания, аренды или эксплуатации на своих серверах она обойдется в десятки раз дешевле готовых решений от облачных провайдеров. Например, это могут быть компании, разрабатывающие голосовых роботов и ассистентов, занимающиеся автоматизацией кол-центров. Они могут взять за основу эту модель и адаптировать ее под свои решения. Это позволит сократить ресурсы на разработку с нуля, — рассказал представитель «Т-Технологий». — Для нас это важно, потому что это дает возможность провалидировать наши подходы и улучшить работу модели». «Расходы на разработку модели составили не более 10 млн рублей», — сообщили в компании. Подробности на сайте Forbes : Фото Getty Images
Технологии1 день назад

42 секунды
Forbes: «Т-Технологии» опубликовали ИИ-модель, умеющую троллить мошенников – Компания опубликовала модель T-one на Hugging Face и GitHub – Новая модель T-one состоит всего лишь из 70 млн параметров – По распознаванию на русском T-one лучше ряда ASR-моделей – В частности, она обгоняет GigaAM v2, Whisper Large-v3 и др. – Размер T-one позволяет запускать модель даже на ноутбуке – Она обойдется в десятки раз дешевле многих готовых решений – Ее можно внедрять для голосовых роботов, ассистентов и др. – Модель можно взять и адаптировать под необходимые решения – Это позволит разработчикам сократить ресурсы на разработку – Расходы на разработку T-one составили не более 10 млн руб. – Аналогичную модель уже внедрили для продуктов Т-Банка – В т.ч. для службы поддержки, инструментов защиты и др.
Технологии1 день назад


Банкста
«Т-Технологии» выложили в открытый доступ модель потокового распознавания речи T-one. Она состоит из 70 млн параметров и обгоняет другие доступные открытые модели по качеству распознавания на русском в телефонии. Расходы на разработку продукта составили всего 10 млн рублей. Она уже внедрена в ряде внутренних продуктов Т-Банка, в том числе в службе поддержки, мобильном секретаре в «Т-Мобайле», в инструментах защиты от нежелательных звонков. Т-Банк развивает речевые технологии с 2016 года. Модель T-one доступна по открытой лицензии может быть интересна бизнесу и научному сообществу. Она запускается даже с ноутбука и стоит в десятки раз дешевле облачных решений. Компании, создающие голосовых ассистентов и занимающиеся автоматизацией кол-центров, могут использовать её как базу, адаптировать под себя и сэкономить на разработке.
Технологии1 день назад

Про tech и этих
«Т-Технологии» выложили в открытый доступ свою модель автоматического распознавания речи T-one — ту, которая позволяет распознавать речь в потоке и определять мошеннические звонки. Т-Банк развивает речевые технологии с 2016 г. И сегодня такая модель работает в службе поддержки самого банка и в мобильном секретаре в «Т-Мобайле». Но самое классное то, что размер T-one позволяет запустить модель на ноутбуке, и даже с учетом обслуживания, аренды или эксплуатации на своих серверах она обойдется в десятки раз дешевле готовых решений от облачных провайдеров. Например, это может быть эффективно для компаний, разрабатывающих голосовых роботов и ассистентов, занимающихся автоматизацией кол-центров. Они могут взять за основу эту модель и адаптировать ее под свои решения. Несмотря на то, что T-one насчитывает 70 млн параметров — в разы меньше, чем другие доступные для доработки модели, например, GigaAM от SberDevices 240 млн и Whisper large-v3 от OpenAI 1,55 млрд , модель показывает более высокую точность при распознавании русской речи и подходит для потоковой телефонии. Читайте Про tech и этих
Технологии23 часа назад


Нейродвиж
T-Технологии выкатили в опенсорс модель для потокового распознавания речи — T-one. Она мгновенно превращает разговор в текст — идеально для звонков и голосовых помощников. Модель лёгкая, быстрая и заточена под реальные условия: шумы, плохое качество связи и нестабильный интернет. Разрабы также дали подробные инструкции — модель можно легко дообучить под свои нужды или встроить в продукт.
Технологии22 часа назад


skidmarket.ru
Широкий выбор свежих продуктов и нужных товаров с гарантией минимальной цены.
Реклама21 час назад


Unlim AI
Российская группа компаний «Т-Технологии» представила ИИ-модель распознавания речи с открытым исходным кодом — T-one. Она обещает новый уровень качества распознавания, поддерживает реальное время и акцентирована на русском языке в телефонии. Модель имеет 70 млн параметров и позволяет бизнесу значительно сократить затраты на разработку. Подробности на Forbes T-one на GitHub T-one на Hugging Face Источник изображения: «Т-Технологии»
Технологии1 день назад

Телекоммуналка
«Т-Технологии» открыли голос. Тут коллеги из «Т-Технологий» выложили в открытый доступ модель автоматического потокового распознавания речи T-one. Об этом они заявили на конференции по машинному обучению Turbo ML Conf. Модель и веса к ней опубликованы на Hugging Face и GitHub, модель доступна по свободной лицензии Apache 2.0. T-one состоит из 70 млн параметров и обходит по качеству распознавания русского языка в телефонии – на шумных и сжатых записях из колл-центров – даже гораздо более крупные аналоги. «Т-Технологии» утверждают, что T-one может быть запущена даже с ноутбука, а её эксплуатация – будь то аренда серверов или использование собственных мощностей – обойдется в десятки раз дешевле, чем готовые решения от облачных провайдеров. Это особенно выгодно для компаний, создающих голосовых роботов, ассистентов или автоматизирующих колл-центры, поскольку они могут взять T-one за основу, значительно сократив ресурсы на разработку с нуля. Разработка модели обошлась менее чем в 10 млн руб. Аналогичная модель уже внедрена в ряде внутренних продуктов Т-Банка, включая службу поддержки, мобильного секретаря в «Т-Мобайле» и защиту от нежелательных звонков. Развитием же речевых технологий Т-Банк занимается с 2016 года. ™ Телекоммуналка
Технологии1 день назад

Нецифровая экономика
«Т-Технологии» Т-Банк и др. выложили в открытый доступ свою модель для распознавания речи в телефонии T-one. Модель обучена на русскоязычных звонках и показывает точность выше на шумных и сжатых записях из колл-центров, чем у открытых более крупных аналогов, включая Whisper от OpenAI. Размер T-one — 70 миллионов параметров. Этого достаточно для запуска на ноутбуке и дешёвого развертывания на сервере. В компании объяснили, что модель рассчитана на разработчиков голосовых ассистентов и автоматизированных колл-центров, которые могут использовать модель для дообучения под свои задачи, снижая расходы на инфраструктуру. Внутри «Т-Технологий» такую модель уже используют. Она встроена в голосовую поддержку, мобильного секретаря «Т-Мобайла» и систему защиты от нежелательных звонков. Секретарь принимает входящие, распознаёт речь, делает расшифровку, отсекает звонки и подбирает ответы по сценарию. Т-Банк развивает речевые технологии с 2016 года. Тогда началась внутренняя работа с голосовыми интерфейсами. В 2019 году был запущен ассистент «Олег» в банковском приложении. В 2021 году появился телефонный секретарь, впоследствии ставший одним из шести ИИ-ассистентов во Вселенной, которую развивает компания.
Технологии23 часа назад


GPT News | chatGPT | OpenAI
T-Технологии выложили в opensource модель для распознавания речи в звонках. T-one обучена на десятках тысяч часов русской речи. Она уже показала отличные результаты в службе поддержки, мобильном секретаре и антиспаме Т-Банка. Речевые технологии Т-Банка развиваются еще с 2016 года — и теперь главные наработки доступны всем в том числе для коммерческого использования. Теперь и шум в трубке стал понятен Подробности тут GPT News ChatGPT BOT
Технологии22 часа назад


TechnoHub Media
В ру-сегменте опенсорса появилась новая ASR-модель для телефонии Т-Технологии опубликовали свою акустическую модель для потокового распознавания речи, обученную на реальных телефонных звонках. Она уже используется в службе поддержки, мобильном секретаре Т-Мобайла и защите от спам-звонков. Банк развивает речевые технологии с 2016 года и теперь делится наработками с сообществом. Подробности — в статье на Хабре Техно
Технологии21 час назад

Похожие новости



+6



+2



+5



+10



+4



+5

Учёные предупреждают о рисках понимания ИИ: необходимость контроля
Технологии
1 день назад




Искусственный интеллект может стать продавцом в формате «магазина на диване», считает Сергей Анохин
Технологии
1 день назад




Автоматизация горнорудной отрасли Казахстана: внедрение ИИ и цифровых технологий
Общество
23 часа назад




Qwen3-235B-A22B: Новая модель опенсорс ИИ обходит конкурентов в бенчмарках
Технологии
1 день назад




ChatGPT достигает 2,5 миллиарда запросов в день, обгоняя соцсети
Технологии
23 часа назад




Проект Stargate: планы по созданию ИИ-инфраструктуры остаются на стадии обсуждения
Технологии
6 часов назад


