26 декабря, 22:52

Alibaba представляет ИИ-модель QvQ-72B, превосходящую конкурентов в математике

Китайская Alibaba выпустила ИИ-модель QvQ-72B, которая может анализировать изображения и показывает цепочку рассуждений.  Разработчики утверждают, что она превосходит o1 от OpenAI в решении математических задач  vc.ru/ai/1728086
vc.ru
vc.ru
Китайская Alibaba выпустила ИИ-модель QvQ-72B, которая может анализировать изображения и показывает цепочку рассуждений. Разработчики утверждают, что она превосходит o1 от OpenAI в решении математических задач vc.ru/ai/1728086
БлоGнот
БлоGнот
Команда Qwen от Alibaba представила новую открытую модель QVQ-72B-Preview для анализа изображений. Она построена на основе Qwen2-VL-72B, но использует reasoning при решении задач. В тестах на понимание изображений, включая задачи университетского уровня и олимпиадные задачи по математике и физике, модель показала результаты на уровне закрытых систем вроде o1 и Claude 3.5 Sonnet. QVQ при этом является моделью с открытыми весами. Впрочем, у модели есть проблемы: она может неожиданно переключаться между языками, застревать в логических циклах или терять фокус при сложном визуальном анализе, что приводит к галлюцинациям. Команда признает необходимость улучшения защитных механизмов перед широким применением. Интересно, а Винни Пуха она распознает? Qwen называет QVQ своим "последним подарком" года и рассматривает её как шаг к созданию "всезнающей разумной модели" на пути к AGI. В будущем планируется создание единой "омни-модели" для решения более сложных научных задач.
Сфера Блогинга
Сфера Блогинга
Команда Qwen от Alibaba представила новую открытую модель QVQ-72B-Preview для анализа изображений. Она построена на основе Qwen2-VL-72B, но использует reasoning при решении задач. В тестах на понимание изображений, включая задачи университетского уровня и олимпиадные задачи по математике и физике, модель показала результаты на уровне закрытых систем вроде o1 и Claude 3.5 Sonnet. QVQ при этом является моделью с открытыми весами. Впрочем, у модели есть проблемы: она может неожиданно переключаться между языками, застревать в логических циклах или терять фокус при сложном визуальном анализе, что приводит к галлюцинациям. Команда признает необходимость улучшения защитных механизмов перед широким применением. Интересно, а Винни Пуха она распознает? Qwen называет QVQ своим "последним подарком" года и рассматривает её как шаг к созданию "всезнающей разумной модели" на пути к AGI. В будущем планируется создание единой "омни-модели" для решения более сложных научных задач.
Video is not supported
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
Alibaba выпустила ИИ-модель QVQ QvQ-72B-Preview — мультимодальная ИИ-модели с открытым исходным кодом, которая может анализировать графики и изображения, чтобы решать задачи. Демоверсия доступна на Hugging Face - Разработчики заявляют, что QvQ-72B лучше показывает себя в математике, по сравнению с o1 и GPT-4o от OpenAI и Claude 3.5 Sonnet. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ
В России запустили в продажу новогодний подарок, который опережает время
₿tc-card.com
₿tc-card.com
В России запустили в продажу новогодний подарок, который опережает время
Китайская Alibaba выпустила ИИ-модель QVQ — она может рассуждать и анализировать изображения  QvQ-72B-Preview — мультимодальная ИИ-модели с открытым исходным кодом, которая может анализировать графики и изображения, чтобы решать задачи.  Демоверсия доступна на Hugging Face, код есть на GitHub.  Разработчики заявляют, что QvQ-72B лучше показывает себя в математике, по сравнению с o1 и GPT-4o от OpenAI и Claude 3.5 Sonnet.   В примере на сайте компании нейросеть решает математическую задачу, используя данные из таблицы.  #технологии    Подпишись — Минская правда MLYN.by
Минская правда|MLYN.by
Минская правда|MLYN.by
Китайская Alibaba выпустила ИИ-модель QVQ — она может рассуждать и анализировать изображения QvQ-72B-Preview — мультимодальная ИИ-модели с открытым исходным кодом, которая может анализировать графики и изображения, чтобы решать задачи. Демоверсия доступна на Hugging Face, код есть на GitHub. Разработчики заявляют, что QvQ-72B лучше показывает себя в математике, по сравнению с o1 и GPT-4o от OpenAI и Claude 3.5 Sonnet. В примере на сайте компании нейросеть решает математическую задачу, используя данные из таблицы. #технологии Подпишись — Минская правда MLYN.by
Русскоязычное киберсообщество
Русскоязычное киберсообщество
Команда Qwen от Alibaba представила новую открытую модель QVQ-72B-Preview для анализа изображений. Она построена на основе Qwen2-VL-72B, но использует reasoning при решении задач. В тестах на понимание изображений, включая задачи университетского уровня и олимпиадные задачи по математике и физике, модель показала результаты на уровне закрытых систем вроде o1 и Claude 3.5 Sonnet. QVQ при этом является моделью с открытыми весами. Впрочем, у модели есть проблемы: она может неожиданно переключаться между языками, застревать в логических циклах или терять фокус при сложном визуальном анализе, что приводит к галлюцинациям. Команда признает необходимость улучшения защитных механизмов перед широким применением. Интересно, а Винни Пуха она распознает? Qwen называет QVQ своим "последним подарком" года и рассматривает её как шаг к созданию "всезнающей разумной модели" на пути к AGI. В будущем планируется создание единой "омни-модели" для решения более сложных научных задач.