10 июня, 08:11

Apple исследует ограничения нейросетей: модели не способны к настоящему рассуждению

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

Исследователи Apple выяснили, что «думающие» нейросети на самом деле не думают В статье под названием «Иллюзия мышления», исследуются особенности «рассуждающих» моделей, таких как OpenAI o1/o3, DeepSeek-R1, Claude 3.7 Sonnet Thinking и Gemini Thinking. Основной вывод работы — эти модели не думают, а лишь используют паттерны из обучающих данных. Несмотря на наличие механизмов саморефлексии, нейросети не способны развивать обобщенные способности к рассуждению за пределами заранее заданных сложностей. Шум, в основном, вокруг того, что Apple тут никому глаза не открыла. Но есть и имиджевая сторона: выход такой работы воспринимается как попытка принизить ценность LLM от лидеров индустрии, в то время как у самой Apple дела с этим направлением очень плохи. Вывод из работы: если запрос к нейросети простой, лучше не включать режим «мышления», чтобы получить ответ быстрее и точнее. Библиотека программиста #свежак

Библиотека программиста | программирование, кодинг, разработка

Исследователи Apple выяснили, что «думающие» нейросети на самом деле не думают В статье под названием «Иллюзия мышления», исследуются особенности «рассуждающих» моделей, таких как OpenAI o1/o3, DeepSeek-R1, Claude 3.7 Sonnet Thinking и Gemini Thinking. Основной вывод работы — эти модели не думают, а лишь используют паттерны из обучающих данных. Несмотря на наличие механизмов саморефлексии, нейросети не способны развивать обобщенные способности к рассуждению за пределами заранее заданных сложностей. Шум, в основном, вокруг того, что Apple тут никому глаза не открыла. Но есть и имиджевая сторона: выход такой работы воспринимается как попытка принизить ценность LLM от лидеров индустрии, в то время как у самой Apple дела с этим направлением очень плохи. Вывод из работы: если запрос к нейросети простой, лучше не включать режим «мышления», чтобы получить ответ быстрее и точнее. Библиотека программиста #свежак

Технологии333 дня назад

GPT/ChatGPT/AI Central Александра Горного

Apple откроет разработчикам доступ к AI-модели на своих устройствах Разработчики приложений скоро смогут пользоваться большой языковой моделью, лежащей в основе Apple Intelligence на устройствах Apple. В компании говорят, что это «зажжет совершенно новую волну интеллектуальных возможностей» в приложениях, которые часто используют пользователи и сократит расходы на облачные API из-за доступа на устройстве».

Технологии333 дня назад

Кролик с Неглинной

Компания Apple откроет для сторонних разработчиков доступ к базовой модели искусственного интеллекта Apple Intelligence, которую она использует для некоторых своих функций. Также Apple планирует полностью изменить дизайн всех своих операционных систем.

Технологии333 дня назад

Digital Review

Что интересного представила Apple на WWDC с точки зрения AI? Практически ничего. Ну, честно: Apple Intelligence научился отвечать на вопросы по содержимому экрана в режиме скриншота фича из 2015? , в Apple Watch добавят Workout Buddy пример кейса, где крутое, но привычное для рынка решение помечают «ИИ», чтобы маркетинг был громче . Цепляет синхронный перевод — хотя он есть у Google, массово-бесплатно его на таком уровне еще никогда не предоставляли. И единственный потенциальный гейм-ченджер: доступ к локальным моделям. Эта штука выглядит сильно перспективнее представленного ранее «умения Siri отвечать по контенту всех ваших приложений» кстати, видели хотя бы один живой пример таких ответов? — она сильно демократизирует доступ разработчиков до моделей по утверждениям экспертов, пока слабым у Apple, но главное начать . Ждем крутых ИИ-фичей осенью — уже нет от Apple, а на ее технологиях — это хотя бы сильно более реалистично. P.S. Прозрачная тема, серьезно...

Технологии332 дня назад

Иллюзия мышления: эксперты Apple разгромили саму идею ИИ Яблочные эксперты во главе с Сэми Бенджио, директором по исследованию ИИ в компании, выпустили прямо-таки разгромную статью в адрес всех без исключения ИИ-компаний, включая Open AI. Если верить статье, ИИ-нейросети обладают только «иллюзией мышления», что приводит к критическим ошибкам, едва задача становится сложнее. Разговоры, будто машины мыслят – маркетинговый ход, и вообще, 90% усилий компании тратят на то, чтобы создать флер ИИ, а сами нейросети как были плохими, так и остаются. Насчет иллюзии мышления – верно сказано, и вообще мысль свежая тем более, что авторы ее развивают . Но не забудем, что Apple критически отстает именно в сфере ИИ от конкурентов. Виноград зелен и локоть, который не укусишь? Ну, не без того. - серьёзно, просто и иногда весело!

КП Наука

Иллюзия мышления: эксперты Apple разгромили саму идею ИИ Яблочные эксперты во главе с Сэми Бенджио, директором по исследованию ИИ в компании, выпустили прямо-таки разгромную статью в адрес всех без исключения ИИ-компаний, включая Open AI. Если верить статье, ИИ-нейросети обладают только «иллюзией мышления», что приводит к критическим ошибкам, едва задача становится сложнее. Разговоры, будто машины мыслят – маркетинговый ход, и вообще, 90% усилий компании тратят на то, чтобы создать флер ИИ, а сами нейросети как были плохими, так и остаются. Насчет иллюзии мышления – верно сказано, и вообще мысль свежая тем более, что авторы ее развивают . Но не забудем, что Apple критически отстает именно в сфере ИИ от конкурентов. Виноград зелен и локоть, который не укусишь? Ну, не без того. - серьёзно, просто и иногда весело!

Технологии332 дня назад

Цифровой трансформатор

На днях Apple на WWDC 2025 Apple открыла бесплатный доступ к on-device AI‑моделям для разработчиков. Ложкой дегтя стала задержка запуска AI‑обновления Siri до 2026 года. В результате рыночная капитализация компании снизилась на $75 млрд—инвесторы обеспокоены тем, что Apple отстаёт в AI‑гонке. Но вернемся к моделям. Apple объявила о запуске Foundation Models API — SDK, который позволяет разработчикам интегрировать легковесные локальные модели Apple Intelligence прямо в свои приложения. Главное: Первый этап — доступ к «маленьким» локальным моделям: генерация текста написание, исправление , визуальные функции Genmoji, Image Playground , перевод в реальном времени и умная фильтрация сообщений. Эти модели работают на устройстве, сохраняя приватность и исключая необходимость обращения к облаку. Apple разрешает использовать эти инструменты без платы за API — разработчики сразу получают доступ к тем же моделям, что встроены в систему. Почему это важно: Это стратегический шаг: экосистема Apple становится гибридной платформой, на которой сторонние разработчики начнут строить AI‑функции, единые с Core ML и iOS SDK. Google Gemini Nano API и Microsoft уже предоставляли доступ к своим AI‑моделям — Apple теперь тоже в строю. Возможность внедрения бесплатного AI‑функционала локально стимулирует появление новых категорий приложений в App Store. Контекст и вызовы: Apple ранее отложила перезапуск Siri до 2026, заявляя о том, что «качественный on-device AI требует времени». Многие разработчики громко критиковали Apple Intelligence как «недостаточно инновационную» — это попытка вернуть их лояльность. Вывод: Такой функционал однозначно востребован для работы многих приложений. И это часть конкуренции iPhone на рынке мобильных устройств. Apple делает ставку на интегрированный и приватный AI, отправляя вызов OpenAI и Google в экосистемной борьбе. Сделать Siri действительно умным и впечатляющим — следующий шаг. Век локального AI — уже с нами.

Технологии330 дней назад

Apple опубликовала исследование о «рассуждающих» ИИ-моделях. Компания утверждает, что они создают только «иллюзию размышлений», повторяя логические цепочки, которые усвоили во время обучения. Некоторые разработчики раскритиковали работу, напомнив, что Apple так и не выпустила «умную» Siri, анонсированную в 2024 году vc.ru/ai/2034109

vc.ru

Apple опубликовала исследование о «рассуждающих» ИИ-моделях. Компания утверждает, что они создают только «иллюзию размышлений», повторяя логические цепочки, которые усвоили во время обучения. Некоторые разработчики раскритиковали работу, напомнив, что Apple так и не выпустила «умную» Siri, анонсированную в 2024 году vc.ru/ai/2034109

Технологии333 дня назад

Apple выкатила исследование, что Claude, DeepSeek-R1 и o3-mini, на самом деле... вообще не рассуждают. Они просто очень хорошо запоминают шаблоны. Вместо того, чтобы использовать старые математические тесты, Apple протестировали эти модели на задачах, с которыми они никогда раньше не сталкивались – головоломки. Результат: все модели «рассуждений» упираются в стену сложности, где полностью разрушаются до точности 0% В Apple обнаружили, что эти модели вообще не рассуждают, а вместо этого выполняют сложное сопоставление шаблонов, которое отлично работает, пока сами шаблоны не становятся слишком сложными. По мере того, как они становились сложнее, эти «мыслящие» модели начинали думать меньше, использовать меньше токенов и быстрее сдаваться в ответе, несмотря на неограниченный бюджет и вычислительные мощности. The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity

Product Management & AI

Apple выкатила исследование, что Claude, DeepSeek-R1 и o3-mini, на самом деле... вообще не рассуждают. Они просто очень хорошо запоминают шаблоны. Вместо того, чтобы использовать старые математические тесты, Apple протестировали эти модели на задачах, с которыми они никогда раньше не сталкивались – головоломки. Результат: все модели «рассуждений» упираются в стену сложности, где полностью разрушаются до точности 0% В Apple обнаружили, что эти модели вообще не рассуждают, а вместо этого выполняют сложное сопоставление шаблонов, которое отлично работает, пока сами шаблоны не становятся слишком сложными. По мере того, как они становились сложнее, эти «мыслящие» модели начинали думать меньше, использовать меньше токенов и быстрее сдаваться в ответе, несмотря на неограниченный бюджет и вычислительные мощности. The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity

Технологии333 дня назад

vc.ru

Apple открыла доступ к ИИ-моделям семейства Apple Intelligence для разработчиков. Их можно будет запускать на устройствах и подключать к приложениям «без затрат на API». Пока фреймворк работает в тестовом режиме vc.ru/apple/2036306

Технологии332 дня назад

Droider

Apple разоблачает иллюзию мышления у нейросетей Инженеры из Apple провели масштабное исследование, которое ставит под сомнение способности современных "думающих" ИИ-моделей. Выводы компании – модели, которые якобы умеют рассуждать, на деле демонстрируют лишь иллюзию мышления. В эксперименте участвовали топовые модели с функцией размышления: OpenAI o1/o3, DeepSeek-R1 и Claude 3.7 Sonnet Thinking. Исследователи предложили им решать контролируемые головоломки: Ханойская башня перенос дисков между стержнями , прыжки шашек перестановка цветных фишек , переправа через реку перевозка людей с ограничениями и мир блоков перестановка блоков в нужном порядке . Почему головоломки? Они позволяют точно контролировать сложность и проверять каждый шаг решения. Выяснилось, что поведение моделей меняется в зависимости от сложности задачи. При простых головоломках обычные модели без функции "мышления" работают даже лучше — они быстрее и эффективнее. На средней сложности "думающие" модели берут верх, демонстрируя преимущество длинных цепочек рассуждений. Но самое интересное происходит дальше. После определенного порога сложности все модели терпят полный крах. Точность падает до нуля, причем происходит это резко, как обрыв. Более того, приближаясь к этой критической точке, модели начинают... меньше думать! Вместо того чтобы увеличить усилия перед сложной задачей, они парадоксально сокращают объем размышлений. Ещё один результат: даже когда моделям давали готовый алгоритм решения, они все равно не могли его правильно выполнить. Это говорит о фундаментальных ограничениях в их способности к логическому мышлению и последовательному выполнению инструкций. Apple делает вывод: современные "рассуждающие" модели не развили настоящие способности к решению задач. Их мышление — это скорее изощренное сопоставление паттернов, которое ломается при столкновении с действительно сложными проблемами.

Технологии331 день назад