26 ноября, 15:11
Новая методика обучения нейросетей улучшает исправление ошибок в русском языке


Раньше всех
В РФ разработали методику обучения нейросетей сложным правилам русского языка

Код Дурова
Нейросети смогут грамотнее писать по русски Яндекс совместно с Институтом ИИ МГУ создал первый открытый датасет и метод обучения нейросетей сложным правилам русского языка сообщила компания на полях Конгресса молодых учёных Датасет охватывает 48 правил русского языка а всего в него вошла 1000 предложений каждое из которых связано с конкретной языковой нормой Подробности kod ru neiroseti stanut gramotnee


Naked Science
Исследователи из Института искусственного интеллекта Московского государственного университета и Яндекса создали LORuGEC первый открытый набор данных с примерами ошибок по сложным правилам русского языка Они также разработали метод помогающий обучить ИИ исправлять грамматические пунктуационные и орфографические ошибки при генерации текстов naked science ru article hi tech pervyj otkrytyj dataset


Rozetked
Исследователи МГУ и Яндекса нашли способ обучения нейросетей сложным правилам русского языка Для этого специалисты создали набор данных с примерами ошибок всего почти 1000 предложений Их помогали собирать студенты лингвисты На основе этих данных можно дополнительно натренировать модель и увеличить точность исправления сложных ошибок на 5 10 Так точность дообученной YandexGPT 5 Pro достигла 83 rozetked me news 42945

42 секунды
CNews Исследователи МГУ и Яндекса создали первый открытый датасет и метод обучения нейросетей сложным правилам русского языка Исследователи МГУ и Яндекса создали открытый датасет LORuGEC Это первый датасет с примерами ошибок по сложным правилам Исследователи также разработали новый метод обучения для ИИ Метод помогает исправлять разные ошибки при генерации текстов Это грамматические пунктуационные и орфографические ошибки Использовать датасет могут другие исследователи и разработчики Открытый датасет поможет создавать образовательные сервисы Датасет МГУ и Яндекса охватывает 48 правил русского языка Всего датасет включает 1 тыс предложений с разной нормой языка Исследователи предложили метод Retrieval Augmented Generation Яндекс протестировал метод на YandexGPT 5 Lite и YandexGPT 5 Pro Точность исправлений сложных ошибок выросла на 5 10 Это пример успешной коллаборации между наукой и IT компаниями ftsec
Похожие новости







+7









+3



+28

Кремниевая долина нанимает философов для обучения ИИ с зарплатой до 400 тыс. долларов
Общество
1 день назад



Обсуждение поддержки бизнеса и новые инициативы на ПМЭФ
Экономика
1 день назад


+7
Павел Дуров анонсировал успех TON в стейкинге среди криптовалют
Экономика
13 часов назад

В России разработана система ИИ для беспилотников и автоматизации авиации
Технологии
1 день назад



Рост числа молодых учителей в российских школах достигает 32,5%
Общество
1 день назад


+3
Нейросеть Claude ограничивает доступ для пользователей из России
Происшествия
1 день назад


+28