26 ноября, 15:11

Новая методика обучения нейросетей улучшает исправление ошибок в русском языке

Раньше всех
Раньше всех
В РФ разработали методику обучения нейросетей сложным правилам русского языка
Код Дурова
Код Дурова
Нейросети смогут грамотнее писать по русски Яндекс совместно с Институтом ИИ МГУ создал первый открытый датасет и метод обучения нейросетей сложным правилам русского языка сообщила компания на полях Конгресса молодых учёных Датасет охватывает 48 правил русского языка а всего в него вошла 1000 предложений каждое из которых связано с конкретной языковой нормой Подробности kod ru neiroseti stanut gramotnee
Исследователи из Института искусственного интеллекта Московского государственного университета и Яндекса создали LORuGEC первый открытый набор данных с примерами ошибок по сложным правилам русского языка Они также разработали метод помогающий обучить ИИ исправлять грамматические пунктуационные и орфографические ошибки при генерации текстов   naked science ru article hi tech pervyj otkrytyj dataset
Naked Science
Naked Science
Исследователи из Института искусственного интеллекта Московского государственного университета и Яндекса создали LORuGEC первый открытый набор данных с примерами ошибок по сложным правилам русского языка Они также разработали метод помогающий обучить ИИ исправлять грамматические пунктуационные и орфографические ошибки при генерации текстов naked science ru article hi tech pervyj otkrytyj dataset
Исследователи МГУ и Яндекса нашли способ обучения нейросетей сложным правилам русского языка Для этого специалисты создали набор данных с примерами ошибок всего почти 1000 предложений Их помогали собирать студенты лингвисты На основе этих данных можно дополнительно натренировать модель и увеличить точность исправления сложных ошибок на 5 10 Так точность дообученной YandexGPT 5 Pro достигла 83 rozetked me news 42945
Rozetked
Rozetked
Исследователи МГУ и Яндекса нашли способ обучения нейросетей сложным правилам русского языка Для этого специалисты создали набор данных с примерами ошибок всего почти 1000 предложений Их помогали собирать студенты лингвисты На основе этих данных можно дополнительно натренировать модель и увеличить точность исправления сложных ошибок на 5 10 Так точность дообученной YandexGPT 5 Pro достигла 83 rozetked me news 42945
42 секунды
42 секунды
CNews Исследователи МГУ и Яндекса создали первый открытый датасет и метод обучения нейросетей сложным правилам русского языка Исследователи МГУ и Яндекса создали открытый датасет LORuGEC Это первый датасет с примерами ошибок по сложным правилам Исследователи также разработали новый метод обучения для ИИ Метод помогает исправлять разные ошибки при генерации текстов Это грамматические пунктуационные и орфографические ошибки Использовать датасет могут другие исследователи и разработчики Открытый датасет поможет создавать образовательные сервисы Датасет МГУ и Яндекса охватывает 48 правил русского языка Всего датасет включает 1 тыс предложений с разной нормой языка Исследователи предложили метод Retrieval Augmented Generation Яндекс протестировал метод на YandexGPT 5 Lite и YandexGPT 5 Pro Точность исправлений сложных ошибок выросла на 5 10 Это пример успешной коллаборации между наукой и IT компаниями ftsec