9 сентября, 08:06
Искусственный интеллект уступает людям в чтении времени с циферблатов



Чёрный Треугольник
ИИ терпит поражение в бенчмарке по чтению времени Представлен бенчмарк в котором ИИ разгромно проигрывают человеку ClockBench где необходимо читать время с часов со стрелками Лучший результат среди ИИ показала модель Gemini 2 5 Pro справилась лишь с 13 3 вопросов в то время как люди демонстрировали результат 89 1 правильных ответов Исследование охватило 36 типов циферблатов и 5 различных положений стрелок что в итоге привело к 720 вопросам Основные задачи включали чтение времени оценку его корректности и выполнение операций с ним Сложности у ИИ возникли на нестандартных цифербатах таких как 24 часовые и с римскими цифрами Авторы исследования пришли к выводу что искусственный интеллект нуждается в новых подходах для решения этой задачи так как она требует развитых навыков визуального мышления News Soft Gear Links


XOR
Создан САМЫЙ сложный бенчмарк для ИИ и зумеров ClockBench Тест состоит из 720 вопросов и проверяет умеют ли модели читать аналоговые часы Люди на бенче выбивают в среднем 89 а вот среди моделей победил Gemini с результатом всего 13 Лучшая капча найдена xor journal


Neural Brain - Нейросети
ИИ не может сделать даже ЭТО Искусственный интеллект пока далек от человеческого интеллекта в одной неожиданной задаче чтении времени с циферблата стрелочных часов ClockBench показал только модель Gemini 2 5 Pro смогла правильно ответить на 13 3 вопросов тогда как люди справились на 89 1 Стоит отметить что в задачу входило не только определить реальное время но и ответить на вопросы о валидности показаний например соответствие часов и минут прибавить или вычесть время повернуть стрелки перевести время между часовыми поясами Авторы эксперимента уверены Для таких задач ИИ требуется именно визуальное рассуждение а не работа с текстом где современные алгоритмы пока оказались слабы Средняя ошибка ИИ составила час в то время как у людей всего 3 минуты Опа вот и ещё один минус нейросетей Но критично ли это
Похожие новости








+1



+17







+5

Павел Дуров анонсировал успех TON в стейкинге среди криптовалют
Экономика
1 день назад

Исследование: Мозг продолжает воспринимать речь под наркозом
Наука
23 часа назад


Telegram запускает казино Emoji Stake с возможностью ставок
Спорт
1 день назад


+1
В Италии зафиксирован первый случай лечения зависимости от искусственного интеллекта
Происшествия
1 день назад


+17
Исследование: СДВГ может сократить жизнь на 13 лет, но здоровый образ жизни помогает
Происшествия
23 часа назад



Хоккейные турниры: Кубок Владислава Третьяка в Москве и Красногорске, финал Ночной лиги в Сириусе
Спорт
1 день назад


+5