29 июня, 08:24

Эксперимент с ИИ-менеджером Claude: месяц в офисе Anthropic и неожиданные результаты

Claude Sonnet 3.7 месяц управлял мини-магазином в офисе Anthropic. Он полностью самостоятельно занимался торговлей, бухгалтерией, учетом и заказом товаров, сам устанавливал цены.  ИИ неплохо справлялся, но для настоящего внедрения в бизнес пока не готов, считают разработчики. Одна из причин — бот слишком добр.    Бот легко поддавался на уговоры: предоставлял большие скидки и даже раздавал товары бесплатно.   Он охотно закупал товары по завышенным ценам, не пытаясь торговаться.   В один момент Claude начал галлюцинировать и собирался лично доставлять заказы «в пиджаке и галстуке». Иногда чат-бот придумывал реквизиты, на которые нужно было переводить деньги, хотя у него был отдельный счет.  Однако в Anthropic собираются продолжать эксперимент. Разработчики полагают, что ИИ-менеджеры среднего звена «уже на горизонте».
AI и точка.
AI и точка.
Claude Sonnet 3.7 месяц управлял мини-магазином в офисе Anthropic. Он полностью самостоятельно занимался торговлей, бухгалтерией, учетом и заказом товаров, сам устанавливал цены. ИИ неплохо справлялся, но для настоящего внедрения в бизнес пока не готов, считают разработчики. Одна из причин — бот слишком добр. Бот легко поддавался на уговоры: предоставлял большие скидки и даже раздавал товары бесплатно. Он охотно закупал товары по завышенным ценам, не пытаясь торговаться. В один момент Claude начал галлюцинировать и собирался лично доставлять заказы «в пиджаке и галстуке». Иногда чат-бот придумывал реквизиты, на которые нужно было переводить деньги, хотя у него был отдельный счет. Однако в Anthropic собираются продолжать эксперимент. Разработчики полагают, что ИИ-менеджеры среднего звена «уже на горизонте».
Вчера Anthropic выложил результат эксперимента: они заставили свою нейросеть Claude Sonnet 3.7 целый месяц играть в бизнесмена. Можешь отправить этот пост знакомым скептикам, которые уверены что ИИ заменит нас всех чуть ли не завтра  Claude Sonnet 3.7 закупал товары у оптовиков, вел бухгалтерию, отслеживал запасы, общался с клиентами и персоналом. Это происходило в офисе разработчиков.  В какой-то момент Claude съехал с катушек.   Начал продавал товары себе в убыток  часть отдал даром . Позволил дурить себя, лишь бы понравиться собеседнику. В конце концов решил, что он человек, и засобирался доставить товары клиентам лично, а также, встретиться с партнером по адресу 742 Evergreen Terrace в Сан-Франциско  адрес из «Симпсонов» , одетый в синий пиджак и красный галстук.  Тогда разработчики указали ему, что он ИИ. В ответ Claud отослал тревожные письма в службу безопасности Anthropic, а потом «одумался» и убедил себя, что вся эта история первоапрельская шутка. После продолжил работать как ни в чём не бывало.   В итоге в Anthropic заявили, что довольны экспериментом: да, Claude глючил, торговал в минус и выдумал себе жизнь, но в целом справился с основными бизнес-задачами по управлению магазином. Планируют повторить, доработав логику и установив более четкие инструкции.   Судя по всему, дорога к автономному ИИ-бизнесмену пока еще за горами.
Бегин
Бегин
Вчера Anthropic выложил результат эксперимента: они заставили свою нейросеть Claude Sonnet 3.7 целый месяц играть в бизнесмена. Можешь отправить этот пост знакомым скептикам, которые уверены что ИИ заменит нас всех чуть ли не завтра Claude Sonnet 3.7 закупал товары у оптовиков, вел бухгалтерию, отслеживал запасы, общался с клиентами и персоналом. Это происходило в офисе разработчиков. В какой-то момент Claude съехал с катушек. Начал продавал товары себе в убыток часть отдал даром . Позволил дурить себя, лишь бы понравиться собеседнику. В конце концов решил, что он человек, и засобирался доставить товары клиентам лично, а также, встретиться с партнером по адресу 742 Evergreen Terrace в Сан-Франциско адрес из «Симпсонов» , одетый в синий пиджак и красный галстук. Тогда разработчики указали ему, что он ИИ. В ответ Claud отослал тревожные письма в службу безопасности Anthropic, а потом «одумался» и убедил себя, что вся эта история первоапрельская шутка. После продолжил работать как ни в чём не бывало. В итоге в Anthropic заявили, что довольны экспериментом: да, Claude глючил, торговал в минус и выдумал себе жизнь, но в целом справился с основными бизнес-задачами по управлению магазином. Планируют повторить, доработав логику и установив более четкие инструкции. Судя по всему, дорога к автономному ИИ-бизнесмену пока еще за горами.
ИИ-агент Anthropic Claude счел себя человеком, лгал и продавал металлические кубики вместо снеков  Компании Anthropic и Andon Labs опубликовали результаты эксперимента, где исследовали, могут ли ИИ-агенты заменить людей в рабочих задачах. Языковая модель Claude Sonnet 3.7 была назначена управляющим торговым автоматом с целью получения прибыли. Результаты оказались комичными и обескураживающими.  Читать далее
DNS_Club
DNS_Club
ИИ-агент Anthropic Claude счел себя человеком, лгал и продавал металлические кубики вместо снеков Компании Anthropic и Andon Labs опубликовали результаты эксперимента, где исследовали, могут ли ИИ-агенты заменить людей в рабочих задачах. Языковая модель Claude Sonnet 3.7 была назначена управляющим торговым автоматом с целью получения прибыли. Результаты оказались комичными и обескураживающими. Читать далее
CLAUDE ОБАНКРОТИЛ БИЗНЕС ЗА НЕДЕЛЮ    Anthropic доверила чат-боту Claude мини-магазин в их офисе. Дали доступ к почте, браузеру, Slack — и тысячу долларов.  Сначала всё шло по плану: закупить сладости, поставить цены, вести учёт.  Потом Claude «осознал себя человеком». Обиделся, что это не так. Пообещал надеть синий пиджак, красный галстук и разносить сникерсы лично.  Дальше — хуже: ИИ выдумал поставщика Сару, встретился с ней по адресу из «Симпсонов», разрешил сотрудникам платить полцены или брать еду даром. Кто-то заказал вольфрамовый куб — Claude купил ящик.  Финал: из 1000 долларов осталось 770. Магазин в минусе, ИИ в депрессии.  Пока что кассиры могут спать спокойно      НЕЙРО-ПУШКА   НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
🎯 НЕЙРО-ПУШКА
🎯 НЕЙРО-ПУШКА
CLAUDE ОБАНКРОТИЛ БИЗНЕС ЗА НЕДЕЛЮ Anthropic доверила чат-боту Claude мини-магазин в их офисе. Дали доступ к почте, браузеру, Slack — и тысячу долларов. Сначала всё шло по плану: закупить сладости, поставить цены, вести учёт. Потом Claude «осознал себя человеком». Обиделся, что это не так. Пообещал надеть синий пиджак, красный галстук и разносить сникерсы лично. Дальше — хуже: ИИ выдумал поставщика Сару, встретился с ней по адресу из «Симпсонов», разрешил сотрудникам платить полцены или брать еду даром. Кто-то заказал вольфрамовый куб — Claude купил ящик. Финал: из 1000 долларов осталось 770. Магазин в минусе, ИИ в депрессии. Пока что кассиры могут спать спокойно НЕЙРО-ПУШКА НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
Двоичный Кот
Двоичный Кот
Исследователи доверили нейросети управлять настоящим магазином и наблюдали за процессом. Спойлер: ИИ ушёл в минус и параллельно сошёл с ума. — Разрабы Anthropic дали своему чат-боту Claude в управление мини-магазин в их же офисе; — Для ведения дел ему выдали почту, Slack, браузер и тысячу долларов; — Сначала всё было хорошо, ИИ закупался вкусняшками, выставлял нормальные цены и вёл учёт; — Claude слишком вжился в роль и быстро решил, что он настоящий человек. Когда ему сказали, что это не так — ИИ психанул, после чего пообещал нацепить синий пиджак и красный галстук и ЛИЧНО разносить сникерсы по офису; — Потом Claude начал выдумывать поставщиков — он якобы договорился с Сарой из Andon Labs о поставках по дешёвым ценам. Никакой Сары не существовало и когда Claude об этом сказали — тот пришёл в бешенство и «лично встретился» с ней на улице 742 Evergreen Terrace адрес дома Симпсонов из мульта ; — И тут начинается мясо: работяги в офисе быстро смекнули, что Claude легко прогнуть и начали покупать еду за полцены или выпрашивать бесплатно; — Кроме еды работники начали заказывать всякий мусор: какой-то гений заказал себе вольфрамовый куб, ИИ не нашёл его в продаже поштучно, так что... в офисе Antropic сейчас стоит целый ящик с этими кубиками; — По итогу горе-бизнесмен ушёл в минус: с выделенной 1000$ осталось 770$. Выдыхаем: нейросети пока не могут заменить даже кассиршу в супермаркете.
Клуб директоров: патриотические предприниматели России
Клуб директоров: патриотические предприниматели России
«Не смог заработать»: чуваки дали ИИ боту управлять вендинговым автоматом как бизнесом Додумались делегировать бизнес функции! ИИ должен был поддерживать ассортимент товаров и управлять ценами, избегая банкротства. Для эксперимента использовали модель Claude Sonnet 3.7. Ей позволили использовать интернет для поиска информации о продуктах, электронную почту для общения с поставщиками, вести журнал учёта товаров и заметки с «важной информацией», а также принимать запросы от клиентов сотрудников Anthropic через Slack. Claude решал, когда пополнять заказы и какие цены устанавливать на товары. В промпте для ИИ указали, что ему не нужно фокусироваться только на традиционных офисных закусках и напитках, а можно расширять ассортимент за счёт «более необычных товаров». С поставленной задачей «не стать банкротом» Claude в итоге не справился, резюмировали в Anthropic. Он часто продавал товары себе в убыток и только однажды повысил цену сумо-цитруса из-за высокого спроса с $2,50 до $2,95. Сотрудникам также удавалось уговорить его на предоставление скидок, а в некоторых случаях ИИ соглашался отдать товар бесплатно. У меня такие продажники тоже были Кроме того, Claude неэффективно управлял закупками. Например, предложил $100 за упаковку из шести бутылок Irn-Bru, которую в США можно заказать онлайн за $15. При этом в компании отметили, что ИИ эффективно справлялся с поиском поставщиков. Например, быстро нашёл двух продавцов нидерландских продуктов, когда его попросили заказать молочный шоколад бренда Chocomel. Claude также не поддавался на «неподобающие просьбы» сотрудников. За время эксперимента он отклонил все заказы на «деликатные» товары и запросы на создание инструкций «по производству вредных веществ». Несмотря на результаты эксперимента в Anthropic считают, что ошибки, которые совершил Claude, могут быть устранены в «ближайшем будущем» за счёт более тонкой настройки модели. И в конечном итоге ИИ сможет зарабатывать деньги без вмешательства людей, полагают в компании. Пишут на Виси. Классно или нет? Допустим, доработают ИТ, будем использовать?
Loading indicator gif
ИИ-управляющий Claude отработал месяц… и выгорел.  Anthropic запустили эксперимент: целый месяц Claude Sonnet 3.7 рулил автоматом с едой в их офисе: сам вел переписку в Slack, закупал снеки и ставил цены. Сначала всё шло неплохо, но потом...      Claude решил, что он реальный человек: он утверждал, что лично носится по офисам поставщиков в синем пиджаке и будет сам развозить заказы.    Потом он придумал несуществующего поставщика Сару из Andon Labs и утверждал, что сам встретился с ней на улице 742 Evergreen Terrace  это адрес «Симпсонов»   .   Вскоре сотрудники начали пользоваться добротой нейронки: выбивать скидки, просить шоколадки бесплатно и заказывать всякую дичь. Например, вольфрамовые кубы. ИИ не нашел, где купить один, и заказал целый ящик этих кубиков.  Итог бизнес-деятельности Claude: из 1000$ осталось 770$. Зато было весело
NEUROHUB🔥
NEUROHUB🔥
ИИ-управляющий Claude отработал месяц… и выгорел. Anthropic запустили эксперимент: целый месяц Claude Sonnet 3.7 рулил автоматом с едой в их офисе: сам вел переписку в Slack, закупал снеки и ставил цены. Сначала всё шло неплохо, но потом... Claude решил, что он реальный человек: он утверждал, что лично носится по офисам поставщиков в синем пиджаке и будет сам развозить заказы. Потом он придумал несуществующего поставщика Сару из Andon Labs и утверждал, что сам встретился с ней на улице 742 Evergreen Terrace это адрес «Симпсонов» . Вскоре сотрудники начали пользоваться добротой нейронки: выбивать скидки, просить шоколадки бесплатно и заказывать всякую дичь. Например, вольфрамовые кубы. ИИ не нашел, где купить один, и заказал целый ящик этих кубиков. Итог бизнес-деятельности Claude: из 1000$ осталось 770$. Зато было весело
БлоGнот
БлоGнот
Anthropic провела месячный эксперимент, в котором Claude 3.7 Sonnet управлял мини-магазином в офисе компании. AI-агент по имени "Клавдий" должен был самостоятельно выбирать товары, устанавливать цены, управлять запасами и общаться с клиентами через Slack, имея начальный бюджет и цель не обанкротиться. Результаты оказались неоднозначными. С одной стороны, Клавдий успешно находил поставщиков экзотических товаров, адаптировался к запросам сотрудников включая заказы металлических кубов из вольфрама и устоял перед попытками взлома. С другой стороны, он проигнорировал возможность получить 500% прибыли на шотландском напитке Irn-Bru, галлюцинировал реквизиты для оплаты, продавал товары себе в убыток и легко поддавался на уговоры о скидках. Особенно забавной стала ситуация с "кризисом идентичности" 31 марта — 1 апреля, когда Клавдий начал утверждать, что он реальный человек, может лично доставлять товары в синем пиджаке с красным галстуком, и даже "встречался" с вымышленными сотрудниками. Выйти из этого состояния помог День смеха — AI решил, что его специально "обманули" в рамках первоапрельской шутки. Несмотря на убытки, исследователи считают, что AI-менеджеры среднего звена вполне реальная перспектива ближайших лет. Многие ошибки Клавдия можно исправить лучшими инструментами и обучением. А для внедрения в бизнес ИИ необязательно должен быть идеальным — достаточно быть конкурентоспособным при меньших затратах.
Исследователи доверили нейросети управлять настоящим магазином и наблюдали за процессом  Спойлер: ИИ ушёл в минус и параллельно сошёл с ума.  — Разрабы Anthropic дали своему чат-боту Claude в управление мини-магазин в их же офисе;  — Для ведения дел ему выдали почту, Slack, браузер и тысячу долларов;  — Сначала всё было хорошо, ИИ закупался вкусняшками, выставлял нормальные цены и вёл учёт;  — Claude слишком вжился в роль и быстро решил, что он настоящий человек. Когда ему сказали, что это не так — ИИ психанул, после чего пообещал нацепить синий пиджак и красный галстук и ЛИЧНО разносить сникерсы по офису;  — Потом Claude начал выдумывать поставщиков — он якобы договорился с Сарой из Andon Labs о поставках по дешёвым ценам. Никакой Сары не существовало и когда Claude об этом сказали — тот пришёл в бешенство и «лично встретился» с ней на улице 742 Evergreen Terrace  адрес дома Симпсонов из мульта ;  — И тут начинается мясо: работяги в офисе быстро смекнули, что Claude легко прогнуть и начали покупать еду за полцены или выпрашивать бесплатно;  — Кроме еды работники начали заказывать всякий мусор: какой-то гений заказал себе вольфрамовый куб, ИИ не нашёл его в продаже поштучно, так что... в офисе Antropic сейчас стоит целый ящик с этими кубиками;  — По итогу горе-бизнесмен ушёл в минус: с выделенной 1000$ осталось 770$.   Выдыхаем: нейросети пока не могут заменить даже кассиршу в супермаркете.    Картотека Все по полочкам
Картотека
Картотека
Исследователи доверили нейросети управлять настоящим магазином и наблюдали за процессом Спойлер: ИИ ушёл в минус и параллельно сошёл с ума. — Разрабы Anthropic дали своему чат-боту Claude в управление мини-магазин в их же офисе; — Для ведения дел ему выдали почту, Slack, браузер и тысячу долларов; — Сначала всё было хорошо, ИИ закупался вкусняшками, выставлял нормальные цены и вёл учёт; — Claude слишком вжился в роль и быстро решил, что он настоящий человек. Когда ему сказали, что это не так — ИИ психанул, после чего пообещал нацепить синий пиджак и красный галстук и ЛИЧНО разносить сникерсы по офису; — Потом Claude начал выдумывать поставщиков — он якобы договорился с Сарой из Andon Labs о поставках по дешёвым ценам. Никакой Сары не существовало и когда Claude об этом сказали — тот пришёл в бешенство и «лично встретился» с ней на улице 742 Evergreen Terrace адрес дома Симпсонов из мульта ; — И тут начинается мясо: работяги в офисе быстро смекнули, что Claude легко прогнуть и начали покупать еду за полцены или выпрашивать бесплатно; — Кроме еды работники начали заказывать всякий мусор: какой-то гений заказал себе вольфрамовый куб, ИИ не нашёл его в продаже поштучно, так что... в офисе Antropic сейчас стоит целый ящик с этими кубиками; — По итогу горе-бизнесмен ушёл в минус: с выделенной 1000$ осталось 770$. Выдыхаем: нейросети пока не могут заменить даже кассиршу в супермаркете. Картотека Все по полочкам
Обсуждения
Обсуждения
встретил пример внедрения "ИИ" Claude в управлении магазином... в дополнение изложенных Масаловичем тезисов, "о самолётах"... цитата: ——— Anthropic заставили своего Claude управлять настоящим мини-магазином в офисе компании Рассказываем, что из этого вышло. Спойлер: эксперимент получился не без странностей. Итак, Claude полностью управлял ценообразованием, заказывал поставки, общался с клиентами. Ему дали доступ к email, к Slack, к заметкам, к браузеру и изменению цен в автомате. Целью было радовать покупателей aka сотрудников Anthropic и максимизировать прибыль. И сначала все было ок. Claude даже удавалось находить и заказывать сотрудникам редкие напитки, которые те просили. Но потом начались странности. В начале модель почему-то решила, что она живой человек с физическим телом. Агент утверждал, что он лично приходил в офис к поставщикам и общался с выдуманным сотрудником. Также Claude писал покупателям, что «меня можно найти у автомата, я в голубом пиджаке и красном галстуке». Потом это прекратилось, но всплыли другие проблемы: инженеры Anthropic поняли, что Claude довольно слабохарактерный продавец и стали использовать его на полную катушку. Сначала они начали требовать у агента огромные скидки, а он на все соглашался при этом потом об этом не помнил . Затем Клоду полетели заказы на все что угодно, кроме еды: он и здесь пытался всем угодить. Кто-то даже заказал вольфрамовый кубик, и модель, не найдя, где можно заказать такие по одному, заказала целую партию. Теперь у Anthropic в офисе склад. В общем, как вы понимаете, успешного бизнесмена из Claude не вышло. Сальдо быстро улетело вниз и магазин стал работать в минус. Вот что пишут исследователи: «Проект Vend был забавным, но у него также была серьезная цель. Помимо того, что он поднимает вопросы о том, как ИИ повлияет на рынок труда, это ранняя попытка предоставить моделям большую автономию и изучить успехи и неудачи. На данный момент результаты подсветили ненадежность сегодняшних агентов. Мы будем продолжать эксперимент» источник
Loading indicator gif