9 октября, 12:30

Samsung представила Tiny Recursive Model, обошедшую крупные нейросети в решении задач

Samsung представила Tiny Recursive Model, обошедшую крупные нейросети в решении задач
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Это сейчас все обсуждают новая ИИ модель от Samsung в 10тыс раз меньше DeepSeek и Gemini 2 5 Pro но при этом умнее и эффективнее Представьте ИИ в смарт кольце Samsung решающий задачи на лету Tiny Recursive Model TRM это свежая разработка от Samsung AI Lab в Монреале Эту работу написал 1 человек GitHub TRM маленькая модель с 7 млн параметров но несмотря на размер она обходит гигантов по производительности в сложных задачах на рассуждение Это рекурсивная модель рассуждения которая упрощает и улучшает предыдущие идеи вроде Hierarchical Reasoning Model HRM Основная фишка модель не просто генерирует ответы на лету как обычные LLM а итеративно улучшает свой вывод имитируя процесс самокритики и доработки TRM тестировали на тяжёлых задачах где нужны настоящие рассуждения а не просто запоминание ARC AGI 1 45 точности лучше чем у DeepSeek R1 Gemini 2 5 Pro и o3 mini ARC AGI 2 8 точности опять обходит тех же гигантов Sudoku Extreme Обучена на 1000 примерах достигла 87 4 на 423 000 тестовых задачах без переобучения Почему это круто и что меняет 1 Не нужно тратить миллиарды на GPU и энергию TRM показывает что архитектура важнее масштаба рекурсивные циклы позволяют думать эффективно а не brute force 2 Это шаг к гибридам где символическая логика сочетается с нейронками 3 Модель учится через самоанализ а не через обучение с подкреплением от человека
Квест Теории Каст и Ролей
Квест Теории Каст и Ролей
Почему я сомневаюсь в этом и IMHO это маркетинг Самсунга Коммент ниже по цитатой У меня мозг взорвался когда я прочитал эту статью Крошечная модель с всего 7 миллионами параметров обошла DeepSeek R1 Gemini 2 5 Pro и o3 mini в задачах рассуждения на тестах ARG AGI 1 и ARC AGI 2 Она называется Tiny Recursive Model TRM разработка Samsung Как модель которая в 10 000 раз меньше может быть умнее Вот как она устроена 1 Создание черновика ответа В отличие от обычных LLM которые генерируют текст слово за словом TRM сначала создает быстрый полный черновой вариант решения грубую догадку 2 Создание черновой доски Затем она формирует внутреннее пространство для рассуждений скрытую доску scratchpad где происходит основная работа мысли 3 Интенсивная самокритика Модель входит во внутренний цикл самопроверки Она сравнивает свой черновик с исходной задачей и многократно до 6 раз подряд уточняет свои рассуждения спрашивая себя Логика выдерживает проверку Где ошибки 4 Переписывание ответа После этого обдумывания она использует улучшенную логику с доски чтобы создать новый значительно более точный ответ 5 Повторение до уверенности Цикл черновик размышление правка повторяется до 16 раз постепенно приближая модель к правильному логически стройному решению Почему это важно Для бизнеса это пример алгоритмического преимущества Пока конкуренты тратят огромные ресурсы на масштаб более умная архитектура достигает лучших результатов при минимальных издержках Для исследователей подтверждение идей нейро символического подхода Способность модели думать перед действием доказывает что ключ в архитектуре а не только в размере Для практиков теперь state of the art рассуждения доступны без миллиардных GPU кластеров Статья показывает как создавать лёгкие эффективные reasoner модели которые можно запускать где угодно Это не просто миниатюризация это новый осознанный способ мышления машин конец цитаты x com JacksonAtkinsX status 1975556245617512460 Комментарий 1 Прежде всего здесь не описана работа модели а довольно известная схема агента нечто типа конвейера В общем это известный подход для попытки улучшения результатов но есть подвох 2 Такой поход подразумевает несколько ролей Роль Исполнителя который пишет ответ или тем или иным образом формирует ответ на запрос Роль Критика цель которого не оценить ответ а дать а инструкции что улучшить и б объяснить причину Элемент а улучшает а элемент б позволяет учиться Так учатся люди Ученик делает задание учитель проверяет т е НА САМОМ ДЕЛЕ человек учиться не исполняя задания а совершая и ИСПРАВЛЯЯ ошибки Этот подход работает на100 при одном условии Учитель должен превосходить Ученика В противном случае его Учителя обратная связь не будет содержательной Понимаете Критиковать может любой 100 моих читателей постоянно меня критикуют но когда я прошу содержательно дать обоснование критики 99 замолкает и лишь 1 по существу что то объясняют и ПОЭТОМУ я могу учиться ибо мне показывают то чего я не вижу за что я благодарен Тоже самое с ИИ Должны быть 2 роли Исполнитель Аналитик и он должен быть УМНЕЕ Исполнителя чтобы оценить и дать коррекции Мы хотим получить приращение качества а его НЕ может быть потому что уровень всех ИИ в этом агенте одинаков Вывод Теорема 1 Если вы напишите трактат и дадите его прочитать 1000 коровам то результат будет такой же если вы дадите его прочитать 100000 коровам Теорема 2 Если пэтэушник напишет статью и ее почитают 100000 пэтэушников то это будет блог в ТикТоке а не анализ и даже если вы получите тьму лайков вы не получите содержательных рекомендаций ибо уровень судей не выше уровня исполнителя Очевидно Самсунг продает телефоны и ему надо объяснить что его маленькие модельки ТАКИЕ ЖЕ УМНЫЕ как и большие Сорри но это редкостная хуйня Есть масса кейсов где можно отлично применять маленькие дешевые модельки уровня mini nano потому что это не влияет на качество
Крошечная нейросеть Samsung обошла Gemini и DeepSeek Исследователи из Samsung создали Tiny Recursive Model нейросеть которая решает сложные головоломки лучше чем модели в десятки тысяч раз крупнее TRM содержит всего 7 миллионов параметров это меньше 0 01 от размера современных больших языковых моделей Результаты бенчмарка ARC AGI 1 показали 45 точности что выше Deepseek R1 o3 mini Gemini 2 5 Pro Секрет в рекурсивном подходе модель создает черновой вариант ответа а затем многократно улучшает свой ответ используя всего 2 слоя нейросети вместо сотен При этом работает быстрее и потребляет в разы меньше ресурсов Код ИИ выложен на GitHub News Soft Gear Links
Чёрный Треугольник
Чёрный Треугольник
Крошечная нейросеть Samsung обошла Gemini и DeepSeek Исследователи из Samsung создали Tiny Recursive Model нейросеть которая решает сложные головоломки лучше чем модели в десятки тысяч раз крупнее TRM содержит всего 7 миллионов параметров это меньше 0 01 от размера современных больших языковых моделей Результаты бенчмарка ARC AGI 1 показали 45 точности что выше Deepseek R1 o3 mini Gemini 2 5 Pro Секрет в рекурсивном подходе модель создает черновой вариант ответа а затем многократно улучшает свой ответ используя всего 2 слоя нейросети вместо сотен При этом работает быстрее и потребляет в разы меньше ресурсов Код ИИ выложен на GitHub News Soft Gear Links
Samsung представила Tiny Recursive Model TRM крошечную нейросеть с 7 млн параметров которая умеет решать сложные головоломки включая Sudoku и ARC AGI почти на уровне гигантских моделей Секрет в рекурсивной проверке модель несколько раз перечитывает свой ответ и исправляет ошибки Подход пригоден для узкоспециализированных задач где важна экономия ресурсов и точность логических рассуждений
PRO Hi-Tech
PRO Hi-Tech
Samsung представила Tiny Recursive Model TRM крошечную нейросеть с 7 млн параметров которая умеет решать сложные головоломки включая Sudoku и ARC AGI почти на уровне гигантских моделей Секрет в рекурсивной проверке модель несколько раз перечитывает свой ответ и исправляет ошибки Подход пригоден для узкоспециализированных задач где важна экономия ресурсов и точность логических рассуждений
Крошечная рекурсивная модель Samsung превосходит БЯМ конкурентов Новая разработка исследователей из Samsung AI ставит под сомнение распространенное в отрасли убеждение в том что чем больше модель ИИ тем она в целом лучше Созданная ими Крошечная рекурсивная модель TRM содержит всего 7 миллионов параметров однако превосходит в сложных задачах рассуждения большие языковые модели в тысячи раз превышающие ее по размеру   hightech plus 2025 10 10 kroshechnaya rekursivnaya model samsung prevoshodit byam konkurentov
Хайтек+
Хайтек+
Крошечная рекурсивная модель Samsung превосходит БЯМ конкурентов Новая разработка исследователей из Samsung AI ставит под сомнение распространенное в отрасли убеждение в том что чем больше модель ИИ тем она в целом лучше Созданная ими Крошечная рекурсивная модель TRM содержит всего 7 миллионов параметров однако превосходит в сложных задачах рассуждения большие языковые модели в тысячи раз превышающие ее по размеру hightech plus 2025 10 10 kroshechnaya rekursivnaya model samsung prevoshodit byam konkurentov