15 марта, 14:50
MTS AI Chat и Sber GigaChat в топ-4 рейтинга языковых моделей по бенчмарку MERA

Милорд
MTS AI Chat вошел в топ-3 больших языковых моделей согласно бенчмарку MERA Multimodal Evaluation for Russian-language Architectures Альянса в сфере ИИ. У этой LLM третье место, а точнее второе, так как первое место принадлежит человеку. В рейтинге представлены 30 LLM. Они оценивались по 17 датасетам. Команда фундаментальных исследователей MTS AI создала большую языковую модель меньше чем за год, но она обошла других участников рейтинга по точности и скорости ответов. LLM предназначена для использования в бизнесе. На основе MTS AI Chat можно создать персонального помощника, чат-бот для ответов на вопросы, сервис генерации и редактирования текстов. Про MTS AI Chat можно узнать больше по ссылке. Бенчмарк MERA собрал всех игроков индустрии для независимой оценки русскоязычных моделей и исследования их фундаментальных способностей. Подробнее о рейтинге и методах оценки читайте здесь. Реклама. Информация о рекламодателе

Habr: ChatGPT, IT, Нейросети
Главное деловое издание Ближнего Востока Arabian Business публикует Топ-10 мировых Al-продуктов. По результатам исследования AI Benchmarking Guide 2024 российская GigaChat подтвердила свою лидерскую позицию по ответам на русском языке и заняла 4-ое место по ответам на английском языке. При этом мультимодальная нейросеть от Сбера обошла модели Gemini от Google и GPT-3.5 от OpenAI. Критерии оценки были адаптированы к заявленным возможностям каждой модели и включали такие показатели, как точность, согласованность, релевантность и способность обрабатывать нюансы запросов. Habr Articles #AI

В порядке бреда
Arabian Business опубликовали свой рейтинг ТОП-10 нейросетей в мире, где на 4м месте оказалась российская Al-модель GigaChat. Эксперты провели исследования под названием «AI Benchmarking Guide 2024» по методу side-by-side, в рамках которого проверялась производительность нейросетей на их «родном языке» на том языке, что разработчики обучали искусственный интеллект , также тестировались возможности перевода на другой язык, качество анализа данных, творческое написание текстов и генерация кода. Примечательно, что российская Al-модель обошла знаменитый ChatGPT 3,5 американской компании Open Al и уже наступает на пятки тройке призеров по производительности. А по показателям работы на русском языке GigaChat оказался лучшим в мире.

Блохи в свитере
Российская нейронка GigaChat оказалась на 4-м месте по результатам теста методом side-by-side. В рамках исследования эксперты изучали производительность модели на ее «родном» языке, а также проводили слепые тесты по переводу, творческому написанию текстов, генерации кода и анализа данных. По этим параметрам российская нейронка даже обошла в производительности знаменитый ChatGPT 3,5 от Open Al. Конкурентов в русскоязычном сегменте у GigaChat не оказалось.


Rozetked
Действительно GigaChat Большая языковая модель «Сбера» заняла четвёртое место в рейтинге AI Benchmarking Guide 2024. Авторы топа сравнили нейросети по методу side-by-side, с учётом оценки производительности на «родном» языке модели и на любом другом. Российская нейросеть оставила позади GPT-3.5 от OpenAI и Gemini от Google. rozetked.me/news/32656

в IT и выйти
GigaChat обскакал GPT-3.5 от OpenAI в рейтинге лучших мировых продуктов AI Benchmarking Guide 2024 Нейросетевая модель Сбера GigaChat заняла четвертое место среди самых крутых AI-инструментов. GigaChat в целом признан лучшим на русском языке и получил очень высокий балл за ответы на английском языке, оставив позади многих гигантов. Место в рейтинге посчитано с помощью метода side-by-side на основе двух экспертных оценок работы модели: на «родном» языке и любом другом. Серия слепых тестов позволила сравнить результаты по переводу, творческому написанию, генерации кода и анализу данных.

Техномотель
Крупнейший деловой журнал Ближнего Востока Arabian Business опубликовал рейтинг лучших мировых LLMs AI Benchmarking Guide 2024 Аналитики рассчитывали позиции нейросетевых моделей, используя метод side-by-side. Серия слепых тестов показала возможности AI-инструментов, таких как перевод, творческое написание текста, генерация кода и анализ данных. В топ попала и российская Нейросетевая модель Сбера GigaChat, которая заняла четвертое место и была признана лучшей на русском языке. Также GigaChat набрал очень высокий балл за ответы на английском языке, оставив позади GPT-3.5 от OpenAI.

Apple News
Еженедельный журнал Arabian Business опубликовал топ-10 всемирных Al-продуктов Исследование проводилось методом side-by-side — когда для сравнения прибегают к двум факторам: оцениванию модели на языке, на котором была обучена модель и наивысшей оценке реакции модели на другом поддерживаемом языке. В списке на четвертом месте оказалась отечественная нейросеть GigaChat, обогнав при этом известные GPT-3.5 и Gemini. Что примечательно, GigaChat сохраняет лидирующую позицию по обработке запросов на русском языке. Apple News

GPT | ChatGPT | Midjourney — GPTMain News
Отечественная GigaChat обошла GPT-3.5 от OpenAI по итогам рейтинга AI Benchmarking Guide 2024. Исследование проводилось методом side-by-side на основе комбинации двух факторов: Оценка производительности модели на ее «родном» языке, на котором была обучена модель; Наивысшая оценка реакции модели на любом другом языке. По результатам исследования GigaChat признана лучшей на русском языке и получила очень высокий балл за ответы на английском, оставив позади GPT-3.5, Клод 3 Сонет, Зефир, Claude 3, Mistral.

TrendWatching
Российский GigaChat оказался на четвертом месте в топ-10 лучших мировых продуктов рейтинга AI Benchmarking Guide 2024 Позиция в рейтинге была определена на основе двух комплексных экспертных оценок работы модели: на ее «родном» языке и наивысшей оценке реакции модели на любом другом языке. Аналитики использовали метод side-by-side и провели серию слепых тестов для всестороннего сравнения. Нейросетевая модель Сбера GigaChat заняла четвертое место. GigaChat в целом признан лучшим на русском языке и получил очень высокий балл за ответы на английском языке. AI-инструмент обогнал в рейтинге Gemini от Google, GPT-3.5 от OpenAI и ряд других нейросетевых моделей.

Похожие новости



+3



+3









+6



+3

Thinking Machines анонсирует новые модели взаимодействия с ИИ для живого общения
Технологии
1 день назад


+3
Сотрудники OpenAI реализовали акции на 6,6 миллиарда долларов
Экономика
1 день назад


+3
Threads запускает ИИ-бота Meta AI в пяти странах, пользователи выражают недовольство
Технологии
4 часа назад


Конференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку
Технологии
1 час назад


Google анонсирует обновление Gemini Intelligence и новые функции Android 17
Технологии
1 день назад


+6
Google предотвращает первую атаку с использованием ИИ на двухфакторную аутентификацию
Технологии
1 день назад


+3