9 сентября, 08:06
Искусственный интеллект уступает людям в чтении времени с циферблатов


Чёрный Треугольник
ИИ терпит поражение в бенчмарке по чтению времени Представлен бенчмарк в котором ИИ разгромно проигрывают человеку ClockBench где необходимо читать время с часов со стрелками Лучший результат среди ИИ показала модель Gemini 2 5 Pro справилась лишь с 13 3 вопросов в то время как люди демонстрировали результат 89 1 правильных ответов Исследование охватило 36 типов циферблатов и 5 различных положений стрелок что в итоге привело к 720 вопросам Основные задачи включали чтение времени оценку его корректности и выполнение операций с ним Сложности у ИИ возникли на нестандартных цифербатах таких как 24 часовые и с римскими цифрами Авторы исследования пришли к выводу что искусственный интеллект нуждается в новых подходах для решения этой задачи так как она требует развитых навыков визуального мышления News Soft Gear Links
Технологии1 день назад


XOR
Создан САМЫЙ сложный бенчмарк для ИИ и зумеров ClockBench Тест состоит из 720 вопросов и проверяет умеют ли модели читать аналоговые часы Люди на бенче выбивают в среднем 89 а вот среди моделей победил Gemini с результатом всего 13 Лучшая капча найдена xor journal
Технологии1 день назад


Neural Brain - Нейросети
ИИ не может сделать даже ЭТО Искусственный интеллект пока далек от человеческого интеллекта в одной неожиданной задаче чтении времени с циферблата стрелочных часов ClockBench показал только модель Gemini 2 5 Pro смогла правильно ответить на 13 3 вопросов тогда как люди справились на 89 1 Стоит отметить что в задачу входило не только определить реальное время но и ответить на вопросы о валидности показаний например соответствие часов и минут прибавить или вычесть время повернуть стрелки перевести время между часовыми поясами Авторы эксперимента уверены Для таких задач ИИ требуется именно визуальное рассуждение а не работа с текстом где современные алгоритмы пока оказались слабы Средняя ошибка ИИ составила час в то время как у людей всего 3 минуты Опа вот и ещё один минус нейросетей Но критично ли это
Технологии11 часов назад
Похожие новости



+10



+5



+11



+12






Apple представила новые Apple Watch Series 11 с улучшенным функционалом и датчиком артериального давления
Технологии
44 минуты назад




OpenAI исследует причины 'галлюцинаций' нейросетей и предлагает изменить систему оценок
Технологии
1 день назад




AlterEgo представляет носимый гаджет для телепатической связи и управления ИИ
Технологии
7 часов назад




Сбер и Т Технологий внедряют инновации для автоматизации процессов и тестирования ПО
Общество
1 день назад




Google уточняет лимиты использования Gemini для различных тарифов
Технологии
1 день назад



Ученые создали видимый кристалл времени с огромным потенциалом
Наука
19 часов назад

