Искусственный интеллект уступает людям в чтении времени с циферблатов

ИИ терпит поражение в бенчмарке по чтению времени Представлен бенчмарк в котором ИИ разгромно проигрывают человеку ClockBench где необходимо читать время с часов со стрелками Лучший результат среди ИИ показала модель Gemini 2 5 Pro справилась лишь с 13 3 вопросов в то время как люди демонстрировали результат 89 1 правильных ответов Исследование охватило 36 типов циферблатов и 5 различных положений стрелок что в итоге привело к 720 вопросам Основные задачи включали чтение времени оценку его корректности и выполнение операций с ним Сложности у ИИ возникли на нестандартных цифербатах таких как 24 часовые и с римскими цифрами Авторы исследования пришли к выводу что искусственный интеллект нуждается в новых подходах для решения этой задачи так как она требует развитых навыков визуального мышления News Soft Gear Links

Технологии244 дня назад

Создан САМЫЙ сложный бенчмарк для ИИ и зумеров ClockBench Тест состоит из 720 вопросов и проверяет умеют ли модели читать аналоговые часы Люди на бенче выбивают в среднем 89 а вот среди моделей победил Gemini с результатом всего 13 Лучшая капча найдена xor journal

XOR

Создан САМЫЙ сложный бенчмарк для ИИ и зумеров ClockBench Тест состоит из 720 вопросов и проверяет умеют ли модели читать аналоговые часы Люди на бенче выбивают в среднем 89 а вот среди моделей победил Gemini с результатом всего 13 Лучшая капча найдена xor journal

Технологии244 дня назад

ИИ не может сделать даже ЭТО Искусственный интеллект пока далек от человеческого интеллекта в одной неожиданной задаче чтении времени с циферблата стрелочных часов ClockBench показал только модель Gemini 2 5 Pro смогла правильно ответить на 13 3 вопросов тогда как люди справились на 89 1 Стоит отметить что в задачу входило не только определить реальное время но и ответить на вопросы о валидности показаний например соответствие часов и минут прибавить или вычесть время повернуть стрелки перевести время между часовыми поясами Авторы эксперимента уверены Для таких задач ИИ требуется именно визуальное рассуждение а не работа с текстом где современные алгоритмы пока оказались слабы Средняя ошибка ИИ составила час в то время как у людей всего 3 минуты Опа вот и ещё один минус нейросетей Но критично ли это

Neural Brain - Нейросети

ИИ не может сделать даже ЭТО Искусственный интеллект пока далек от человеческого интеллекта в одной неожиданной задаче чтении времени с циферблата стрелочных часов ClockBench показал только модель Gemini 2 5 Pro смогла правильно ответить на 13 3 вопросов тогда как люди справились на 89 1 Стоит отметить что в задачу входило не только определить реальное время но и ответить на вопросы о валидности показаний например соответствие часов и минут прибавить или вычесть время повернуть стрелки перевести время между часовыми поясами Авторы эксперимента уверены Для таких задач ИИ требуется именно визуальное рассуждение а не работа с текстом где современные алгоритмы пока оказались слабы Средняя ошибка ИИ составила час в то время как у людей всего 3 минуты Опа вот и ещё один минус нейросетей Но критично ли это

Технологии243 дня назад

Искусственный интеллект уступает людям в чтении времени с циферблатов

Источники

Павел Дуров анонсировал успех TON в стейкинге среди криптовалют

Исследование: Мозг продолжает воспринимать речь под наркозом

Telegram запускает казино Emoji Stake с возможностью ставок

В Италии зафиксирован первый случай лечения зависимости от искусственного интеллекта

Исследование: СДВГ может сократить жизнь на 13 лет, но здоровый образ жизни помогает

Хоккейные турниры: Кубок Владислава Третьяка в Москве и Красногорске, финал Ночной лиги в Сириусе