7 марта, 13:56
Эндрю Барто и Ричард Саттон удостоены Премии Тьюринга за вклад в обучение с подкреплением

Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Премию Тьюринга дали за разработку метода обучения с подкреплением RL Эндрю Барто и Ричарду Саттону Премия Тьюринга часто называется "Нобелевской премией в области компьютерных наук". Эндрю Барто, профессор MIT, Ричард Саттон профессор Университета Альберты и ex- научный сотрудник DeepMind. Они разработали метод RL в 1980-х годах, вдохновившись психологией и тем, как учатся люди. Эта техника легла в основу успеха ведущих ИИ-компаний, включая OpenAI и Google. Оба ученых обеспокоены тем, что ИИ-компании спешат выпускать продукты без тщательного тестирования. Они критикуют современный ИИ-сектор за мотивацию бизнес-стимулами, а не продвижением исследований в области ИИ. Барто не поддерживает идею создания огромных дата-центров и взимания платы за использование ПО. Саттон называет разговоры компаний об AGI хайпом. По его мнению, системы, которые умнее людей, в конечном итоге появятся благодаря лучшему пониманию человеческого разума.
Общество165 дней назад


Хайтек+
Пионеры обучения с подкреплением получили премию Тьюринга Эндрю Дж. Барто и Ричард С. Саттон получили премию Тьюринга 2024 года за развитие обучения с подкреплением. Это метод, при котором искусственный интеллект обучается с помощью вознаграждений и наказаний. ПО постепенно учится находить лучшие решения, совершая ошибки и получая обратную связь от окружающей среды. Учёные начали исследования в этой сфере ещё в 1980-е годы и разработали ключевые алгоритмы, которые до сих пор применяются в индустрии ИИ.
Общество164 дня назад


Сириус.Курсы
Создателям обучения с подкреплением присудили премию Алана Тьюринга! Награда названа в честь знаменитого британского математика и информатика XX века. Она ежегодно вручается международной Ассоциацией вычислительной техники за самые выдающиеся научно-технические достижения. В 2025 году премии удостоились Эндрю Барто и Ричард Саттон. Учёные создали алгоритмы искусственного интеллекта, способные обучаться на основе обратной связи от окружающей среды. Они же в 1998 году опубликовали учебник «Обучение с подкреплением: введение», заложив тем самым основу для дальнейшего развития этого направления ИИ. Если вам интересно узнать больше о создании алгоритмов для решения самых разных задач методами искусственного интеллекта, присоединяйтесь к набору «Введения в машинное обучение», и мы понятно объясним, как работают многие современные технологии. А в середине апреля приходите на курс «Обучение с подкреплением», расскажем самое интересное об этом разделе ИИ. Оставить свою почту для предзаписи можно уже сейчас.
Общество163 дня назад


Наука
Премия Тьюринга — Нобелевка по информатике — в этом году вручена за обучение ИИ. Ассоциация вычислительной техники наградила Эндрю Г. Барто и Ричарда С. Саттона за фундаментальные разработки в области обучения с подкреплением. Их исследования заложили основу одного из ключевых направлений искусственного интеллекта. Этот метод позволяет интеллектуальным системам обучаться на основе вознаграждений, подобно дрессировке животных. Барто и Саттон первыми сформулировали его как математическую модель, основанную на процессах принятия решений Маркова, где агент учится в неопределенной среде, пытаясь получить максимальное долгосрочное вознаграждение. Ученые разработали алгоритм временных различий, методы градиента политики и нейросетевые подходы для улучшения прогнозов. Исследования Барто и Саттона оказали влияние не только на ИИ, но и на когнитивную науку и нейробиологию, внеся вклад в понимание принципов работы дофаминовой системы мозга.
Общество163 дня назад


Хлебни ИИ - про искусственный интеллект
Ученые, получившие премию за создание фундаментальных технологий, лежащих в основе современного ИИ, выразили возражения относительно текущего направления развития ИИ Ричард Саттон и Эндрю Барто, новаторы в области обучения с подкреплением и лауреаты премии Тьюринга, выразили обеспокоенность тем, как их исследования используются в коммерческих целях компаниями, занимающимися ИИ. Саттон, профессор Университета Альберты, и Барто, заслуженный профессор Массачусетского университета, критикуют OpenAI, Google и другие организации за выпуск потенциально опасных программ, таких как ChatGPT, считая их инструментами для извлечения прибыли, а не для создания полноценного ИИОН. Обучение с подкреплением, разработанное ими в 1980-х, лежит в основе многих современных ИИ-платформ. Барто подчеркивает, что, в соответствии с инженерными принципами, разработчики должны минимизировать негативные последствия технологий, чего, по его мнению, не происходит. Он отмечает, что современные модели склонны к ошибкам и "галлюцинациям", но компании продолжают привлекать миллиардные инвестиции. Саттон выразил опасение, что стремление к монетизации технологий искусственного интеллекта становится доминирующим мотивом, с которым он не согласен.
Общество160 дней назад


GPT/ChatGPT/AI Central Александра Горного
Премия Тьюринга досталась AI-первопроходцам Ученые Эндрю Барто и Ричард Саттон получили премию Тьюринга 2024 за разработку алгоритмов и концептуальных оснований для обучения с подкреплением. Их научные работы выходили в 80-х годах прошлого века. Благодаря этому методу, машины обучаются при помощи проб и ошибок, адаптируясь к ограниченным или динамическим средам. Сегодня обучение с подкреплением используется при создании моделей искусственного интеллекта. Премия Тьюринга — самая престижная премия по информатике. Ее вручает Ассоциация вычислительной техники за выдающийся вклад в развитие этой области.
Общество165 дней назад


DevHub Community
Алгоритмы 1980-х годов, лежащие в основе современного ИИ, получили премию А. М. Тьюринга Эндрю Барто и Ричард Саттон получили премию имени А. М. Тьюринга за создание фундаментальных технологий, которые лежат в основе современного ИИ. В том числе, они были отмечены за недавние достижения в области создания больших моделей логического мышления. 1 DevHub
Общество164 дня назад


эйай ньюз
Создатели Reinforcement Learning получили премию Тьюринга! Эндрю Барто и Ричард Саттон разработали кучу основополагающих алгоритмов в RL. Они же потом и написали лучшую и самую влиятельную книгу по RL рекомендую! , которую процитировали 75к+ раз. RL в последнее время на большом хайпе, и используется как в тренировке LLM так и в диффузии и робототехнике. Премия Тьюринга — самая влиятельная премия в мире информатики, с которой идёт денежное вознаграждение в миллион долларов. Её в 2018 ещё получили Ян Лекун, Джеффри Хинтон и Йошуа Бенжио за deep learning. Кстати, сейчас Саттон работает вместе с Джоном Кармаком над его стартапом Keen Technologies. Для тех кто не знает, Кармак — главный программист Doom, Quake, Wolfenstein 3D и бывший CTO Oculus, в 2022 году он ушёл из Meta чтобы самостоятельно работать над AGI.
Общество164 дня назад


Точка сингулярности💥
А тем временем Эндрю Барто и Ричард Саттон получили премию Тьюринга — «Нобелевку» в мире компьютерных наук, за которую дают миллион долларов. Ученые еще в 80-х годах разработали основы обучения с подкреплением, что привело затем к появлению прорывных моделей, таких как AlphaGo от Google и ChatGPT. Однако и Барто, и Саттон опасаются современных темпов развития ИИ, когда компании соревнуются за выпуск более мощных, но склонных к ошибкам моделей, и советуют использовать ИИ с осторожностью. #AINews
Общество163 дня назад


Люди и Код
Создатели алгоритмов 1980-х годов получили премию Тьюринга Эндрю Барто и Ричард Саттон стали лауреатами премии за вклад в развитие методов обучения с подкреплением. Их исследования легли в основу рассуждающих ИИ-моделей и современных методов машинного обучения.
Общество163 дня назад

Похожие новости



+2



+7



+3



+2



+14



+9

Сэм Альтман о пузыре искусственного интеллекта: сравнение с доткомами
Технологии
47 минут назад




Главный разработчик ChatGPT Ник Терли подчеркивает важность реального общения
Технологии
17 часов назад




Claude Code представил новые режимы обучения программированию
Общество
19 часов назад




Ученые разработали ИИ-приложение для диагностики опухолей мозга по МРТ
Наука
1 час назад




Нейроимплант с ИИ помогает парализованной женщине заговорить после 18 лет молчания
Наука
1 день назад




OpenAI рассматривает внедрение рекламы в ChatGPT для повышения доходов
Технологии
11 часов назад


