4 апреля, 17:29

GPT-4.5 демонстрирует наивысшие результаты в трехстороннем тесте Тьюринга

GPT прошел тест Тьюринга. Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. Двойное, рандомизированное, контролируемое слепое исследование. Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот.  Выводы:  - Ллама 3.1 примерно как человек, в 50% случаев участники угадывают - GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди.  Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут:
e/acc
e/acc
GPT прошел тест Тьюринга. Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. Двойное, рандомизированное, контролируемое слепое исследование. Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот. Выводы: - Ллама 3.1 примерно как человек, в 50% случаев участники угадывают - GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди. Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут:
Нейросеть впервые смогла пройти тест Тьюринга, говорится в исследовании ученых из Калифорнийского университета в Сан-Диего.   GPT-4.5 приняли за человека в 73% случаев против 63% у живых участников эксперимента. ИИ притворяется живым лучше, чем испытуемые, говорится в документе.     / Наука
ТАСС / Наука
ТАСС / Наука
Нейросеть впервые смогла пройти тест Тьюринга, говорится в исследовании ученых из Калифорнийского университета в Сан-Диего. GPT-4.5 приняли за человека в 73% случаев против 63% у живых участников эксперимента. ИИ притворяется живым лучше, чем испытуемые, говорится в документе. / Наука
OpenAI
OpenAI
ИИ притворяется живым лучше, чем люди ChatGPT-4.5 смог с легкостью пройти классический трехфакторный тест Тьюринга — нейросеть приняли за человека в 73% случаев против 63% у живых участников эксперимента. Ученые задавали ИИ различные вопросы и поднимали странные темы, чтобы сбить его с толку. GPT-4.5 часто отвечал как настоящий человек — использовал сленг, придумывал правдоподобные истории или уводил разговор в сторону.
Чёрный Треугольник
Чёрный Треугольник
GPT-4.5 прошла трехсторонний тест Тьюринга Исследователи Калифорнийского университета в Сан-Диего провели испытание с участием четырех ИИ-систем: ELIZA прабабушка GPT , GPT-4o, LLaMa-3.1-405B и GPT-4.5, и именно последняя показала наилучший результат, так как 73% испытуемых приняли её за человека. В то время как другие системы, такие как LLaMa-3.1-405B, ELIZA и GPT-4o, продемонстрировали результаты на уровне 56%, 23% и 21% соответственно. Тест был усложнённой версией традиционного и включал в себя ведение переписки как с человеком, так и с ИИ, что значительно затрудняло идентификацию машины. В 73% случаев GPT-4.5 был больше похож на человека, чем живые люди. Это исследование стало первым эмпирическим доказательством успешного прохождения теста Тьюринга ИИ-системой, предназначенным для оценки способности компьютеров имитировать человеческое поведение. Фактором повлиявшим на успех GPT-4.5 может служить внедрение OpenAI в ИИ-модель нового «эмоционального интеллекта». ================ News Soft Gear Links
Loading indicator gif
О проверках "дроповодов" и криптообменников и не только - на tokengram.ru
Tokengram.ru
Tokengram.ru
О проверках "дроповодов" и криптообменников и не только - на tokengram.ru
GPT-4.5 прошла трехсторонний тест Тьюринга  Исследователи провели трехсторонний тест Тьюринга для четырех ИИ-систем — ELIZA, GPT-4o, LLaMa-3.1-405B и GPT-4.5. Последняя набрала наивысший балл.   Они применили оригинальную трехстороннюю версию теста — участники вели 5-минутные разговоры одновременно с другим человеком и одной из ИИ-систем, после чего определяли, кого из собеседников считают человеком. Такой вариант является более сложным по сравнению с тестом, где люди общаются только с машиной.  В 73% случаев испытуемые посчитали GPT-4.5 человеком. Другие ИИ набрали меньший результат:    LLaMa-3.1 — 56%;   ELIZA — 23%;   GPT-4o — 21%.  «Полученные данные представляют собой первое эмпирическое доказательство того, что искусственная система проходит стандартный трехсторонний тест Тьюринга», — отметили исследователи.   Новости   AI   YouTube
ForkLog FEED
ForkLog FEED
GPT-4.5 прошла трехсторонний тест Тьюринга Исследователи провели трехсторонний тест Тьюринга для четырех ИИ-систем — ELIZA, GPT-4o, LLaMa-3.1-405B и GPT-4.5. Последняя набрала наивысший балл. Они применили оригинальную трехстороннюю версию теста — участники вели 5-минутные разговоры одновременно с другим человеком и одной из ИИ-систем, после чего определяли, кого из собеседников считают человеком. Такой вариант является более сложным по сравнению с тестом, где люди общаются только с машиной. В 73% случаев испытуемые посчитали GPT-4.5 человеком. Другие ИИ набрали меньший результат: LLaMa-3.1 — 56%; ELIZA — 23%; GPT-4o — 21%. «Полученные данные представляют собой первое эмпирическое доказательство того, что искусственная система проходит стандартный трехсторонний тест Тьюринга», — отметили исследователи. Новости AI YouTube
DeCenter — блокчейн, биткоин, инвестиции
DeCenter — блокчейн, биткоин, инвестиции
ИИ притворяется живым лучше, чем люди ChatGPT-4.5 смог с легкостью пройти классический трехфакторный тест Тьюринга — нейросеть приняли за человека в 73% случаев против 63% у живых участников эксперимента. Ученые задавали ИИ различные вопросы и поднимали странные темы, чтобы сбить его с толку. GPT-4.5 часто отвечал как настоящий человек — использовал сленг, придумывал правдоподобные истории или уводил разговор в сторону.
GPT 4.5 научился обманывать людей!  ИИ теперь маскируется лучше, чем человек – в новом исследовании его принимали за реального собеседника в 73% случаев.     Где теперь граница между разумом и алгоритмом? Ответ уже не так очевиден.  Разбираем ИИ-тренды в "Байтах и трендах"!
Осташко! Важное
Осташко! Важное
GPT 4.5 научился обманывать людей! ИИ теперь маскируется лучше, чем человек – в новом исследовании его принимали за реального собеседника в 73% случаев. Где теперь граница между разумом и алгоритмом? Ответ уже не так очевиден. Разбираем ИИ-тренды в "Байтах и трендах"!
Банкста
Банкста
Нейросеть впервые смогла пройти тест Тьюринга, говорится в исследовании ученых из Калифорнийского университета в Сан-Диего. GPT-4.5 приняли за человека в 73% случаев против 63% у живых участников эксперимента. ИИ притворяется живым лучше, чем испытуемые, говорится в документе.
Злой Банкстер
Злой Банкстер
Впервые нейросеть успешно прошла тест Тьюринга, как утверждают исследователи из Калифорнийского университета в Сан-Диего. Согласно документу исследования, искусственный интеллект GPT-4.5 был принят за человека в 73% случаев, тогда как живые участники эксперимента — в 63%. ИИ оказался более убедителен в изображении человека, чем сами испытуемые.
Нейросети 🧬
Нейросети 🧬
ИИ становится живее людей — исследование Исследователи из Сан-Диего выяснили, что GPT‑4.5 набрал 73% «побед» в оригинальном трёхстороннем тесте Тьюринга — обойдя живого собеседника и запутав судью. В отличие от упрощённых версий, в классическом формате участвуют два скрытых собеседника человек и ИИ и судья, у которого есть 5 минут, чтобы определить, кто есть кто. Результаты эксперимента: GPT‑4.5 — 73%, стабильно выигрывает у человека LLaMA 3.1‑405B — 56%, временами убедителен ELIZA — 23%, уступает из-за примитивного скрипта GPT‑4o — 21%, заметно отстал от современных моделей GPT‑4.5 ловко справлялся с каверзами: отвечал в стиле «интернет-интроверта», использовал сленг, выдумывал истории и уводил беседу в сторону, когда это помогало убедить судью. Эксперимент показывает: ИИ становится всё труднее отличить от человека. И это уже не просто технологический прогресс — это вызов для модерации, доверия и всей цифровой среды.
Loading indicator gif