9 сентября, 08:06

Искусственный интеллект уступает людям в чтении времени с циферблатов

ИИ терпит поражение в бенчмарке по чтению времени Представлен бенчмарк в котором ИИ разгромно проигрывают человеку ClockBench где необходимо читать время с часов со стрелками   Лучший результат среди ИИ показала модель Gemini 2 5 Pro справилась лишь с 13 3 вопросов в то время как люди демонстрировали результат 89 1 правильных ответов Исследование охватило 36 типов циферблатов и 5 различных положений стрелок что в итоге привело к 720 вопросам Основные задачи включали чтение времени оценку его корректности и выполнение операций с ним Сложности у ИИ возникли на нестандартных цифербатах таких как 24 часовые и с римскими цифрами Авторы исследования пришли к выводу что искусственный интеллект нуждается в новых подходах для решения этой задачи так как она требует развитых навыков визуального мышления News Soft Gear Links
Чёрный Треугольник
Чёрный Треугольник
ИИ терпит поражение в бенчмарке по чтению времени Представлен бенчмарк в котором ИИ разгромно проигрывают человеку ClockBench где необходимо читать время с часов со стрелками Лучший результат среди ИИ показала модель Gemini 2 5 Pro справилась лишь с 13 3 вопросов в то время как люди демонстрировали результат 89 1 правильных ответов Исследование охватило 36 типов циферблатов и 5 различных положений стрелок что в итоге привело к 720 вопросам Основные задачи включали чтение времени оценку его корректности и выполнение операций с ним Сложности у ИИ возникли на нестандартных цифербатах таких как 24 часовые и с римскими цифрами Авторы исследования пришли к выводу что искусственный интеллект нуждается в новых подходах для решения этой задачи так как она требует развитых навыков визуального мышления News Soft Gear Links
Создан САМЫЙ сложный бенчмарк для ИИ и зумеров ClockBench Тест состоит из 720 вопросов и проверяет умеют ли модели читать аналоговые часы Люди на бенче выбивают в среднем 89 а вот среди моделей победил Gemini с результатом всего 13 Лучшая капча найдена xor journal
XOR
XOR
Создан САМЫЙ сложный бенчмарк для ИИ и зумеров ClockBench Тест состоит из 720 вопросов и проверяет умеют ли модели читать аналоговые часы Люди на бенче выбивают в среднем 89 а вот среди моделей победил Gemini с результатом всего 13 Лучшая капча найдена xor journal
ИИ не может сделать даже ЭТО Искусственный интеллект пока далек от человеческого интеллекта в одной неожиданной задаче чтении времени с циферблата стрелочных часов ClockBench показал только модель Gemini 2 5 Pro смогла правильно ответить на 13 3 вопросов тогда как люди справились на 89 1 Стоит отметить что в задачу входило не только определить реальное время но и ответить на вопросы о валидности показаний например соответствие часов и минут прибавить или вычесть время повернуть стрелки перевести время между часовыми поясами Авторы эксперимента уверены Для таких задач ИИ требуется именно визуальное рассуждение а не работа с текстом где современные алгоритмы пока оказались слабы Средняя ошибка ИИ составила час в то время как у людей всего 3 минуты Опа вот и ещё один минус нейросетей Но критично ли это
Neural Brain - Нейросети
Neural Brain - Нейросети
ИИ не может сделать даже ЭТО Искусственный интеллект пока далек от человеческого интеллекта в одной неожиданной задаче чтении времени с циферблата стрелочных часов ClockBench показал только модель Gemini 2 5 Pro смогла правильно ответить на 13 3 вопросов тогда как люди справились на 89 1 Стоит отметить что в задачу входило не только определить реальное время но и ответить на вопросы о валидности показаний например соответствие часов и минут прибавить или вычесть время повернуть стрелки перевести время между часовыми поясами Авторы эксперимента уверены Для таких задач ИИ требуется именно визуальное рассуждение а не работа с текстом где современные алгоритмы пока оказались слабы Средняя ошибка ИИ составила час в то время как у людей всего 3 минуты Опа вот и ещё один минус нейросетей Но критично ли это