9 сентября, 08:06
Искусственный интеллект уступает людям в чтении времени с циферблатов
Чёрный Треугольник
ИИ терпит поражение в бенчмарке по чтению времени Представлен бенчмарк в котором ИИ разгромно проигрывают человеку ClockBench где необходимо читать время с часов со стрелками Лучший результат среди ИИ показала модель Gemini 2 5 Pro справилась лишь с 13 3 вопросов в то время как люди демонстрировали результат 89 1 правильных ответов Исследование охватило 36 типов циферблатов и 5 различных положений стрелок что в итоге привело к 720 вопросам Основные задачи включали чтение времени оценку его корректности и выполнение операций с ним Сложности у ИИ возникли на нестандартных цифербатах таких как 24 часовые и с римскими цифрами Авторы исследования пришли к выводу что искусственный интеллект нуждается в новых подходах для решения этой задачи так как она требует развитых навыков визуального мышления News Soft Gear Links
XOR
Создан САМЫЙ сложный бенчмарк для ИИ и зумеров ClockBench Тест состоит из 720 вопросов и проверяет умеют ли модели читать аналоговые часы Люди на бенче выбивают в среднем 89 а вот среди моделей победил Gemini с результатом всего 13 Лучшая капча найдена xor journal
Neural Brain - Нейросети
ИИ не может сделать даже ЭТО Искусственный интеллект пока далек от человеческого интеллекта в одной неожиданной задаче чтении времени с циферблата стрелочных часов ClockBench показал только модель Gemini 2 5 Pro смогла правильно ответить на 13 3 вопросов тогда как люди справились на 89 1 Стоит отметить что в задачу входило не только определить реальное время но и ответить на вопросы о валидности показаний например соответствие часов и минут прибавить или вычесть время повернуть стрелки перевести время между часовыми поясами Авторы эксперимента уверены Для таких задач ИИ требуется именно визуальное рассуждение а не работа с текстом где современные алгоритмы пока оказались слабы Средняя ошибка ИИ составила час в то время как у людей всего 3 минуты Опа вот и ещё один минус нейросетей Но критично ли это
Похожие новости +5 +2 +2 +2 +15
Мощная солнечная вспышка ожидает геомагнитные бури на Земле
Общество
1 день назадApple отказывается от Touch ID в новых Apple Watch Series 12 ради увеличения батареи
Технологии
16 часов назад13-летний подросток обнаружил уязвимость в блокчейне TON с помощью ИИ и получил 4000 долларов
Происшествия
2 часа назадМошенники используют поддельные CAPTCHA для кражи данных пользователей
Происшествия
19 часов назадUnitree представила пилотируемого меха-робота для гражданского использования
Технологии
2 часа назадОпрос Gartner: Внедрение ИИ не привело к росту рентабельности у 80 компаний
Экономика
16 часов назад