4 апреля, 17:29
GPT-4.5 демонстрирует наивысшие результаты в трехстороннем тесте Тьюринга


e/acc
GPT прошел тест Тьюринга. Это, конечно, было очевидно еще примерно год назад с 4o, но теперь официально. Двойное, рандомизированное, контролируемое слепое исследование. Каждый участник общается с двумя субъектами: один живой человек, другой бот. Нужно угадать кто из них бот. Выводы: - Ллама 3.1 примерно как человек, в 50% случаев участники угадывают - GPT-4.5 — в 73% случаев участники называли именно его живым человеком. То есть, он может притворяться человеком лучше, чем другие люди. Кстати, сам тест работает в интернете. Попробовать отличить тупую железяку от белкового друга можно тут:
Технологии2 дня назад


ТАСС / Наука
Нейросеть впервые смогла пройти тест Тьюринга, говорится в исследовании ученых из Калифорнийского университета в Сан-Диего. GPT-4.5 приняли за человека в 73% случаев против 63% у живых участников эксперимента. ИИ притворяется живым лучше, чем испытуемые, говорится в документе. / Наука
Технологии2 дня назад

OpenAI
ИИ притворяется живым лучше, чем люди ChatGPT-4.5 смог с легкостью пройти классический трехфакторный тест Тьюринга — нейросеть приняли за человека в 73% случаев против 63% у живых участников эксперимента. Ученые задавали ИИ различные вопросы и поднимали странные темы, чтобы сбить его с толку. GPT-4.5 часто отвечал как настоящий человек — использовал сленг, придумывал правдоподобные истории или уводил разговор в сторону.
Технологии2 дня назад

Чёрный Треугольник
GPT-4.5 прошла трехсторонний тест Тьюринга Исследователи Калифорнийского университета в Сан-Диего провели испытание с участием четырех ИИ-систем: ELIZA прабабушка GPT , GPT-4o, LLaMa-3.1-405B и GPT-4.5, и именно последняя показала наилучший результат, так как 73% испытуемых приняли её за человека. В то время как другие системы, такие как LLaMa-3.1-405B, ELIZA и GPT-4o, продемонстрировали результаты на уровне 56%, 23% и 21% соответственно. Тест был усложнённой версией традиционного и включал в себя ведение переписки как с человеком, так и с ИИ, что значительно затрудняло идентификацию машины. В 73% случаев GPT-4.5 был больше похож на человека, чем живые люди. Это исследование стало первым эмпирическим доказательством успешного прохождения теста Тьюринга ИИ-системой, предназначенным для оценки способности компьютеров имитировать человеческое поведение. Фактором повлиявшим на успех GPT-4.5 может служить внедрение OpenAI в ИИ-модель нового «эмоционального интеллекта». ================ News Soft Gear Links
Технологии2 дня назад


Tokengram.ru
О проверках "дроповодов" и криптообменников и не только - на tokengram.ru
Реклама2 дня назад


ForkLog FEED
GPT-4.5 прошла трехсторонний тест Тьюринга Исследователи провели трехсторонний тест Тьюринга для четырех ИИ-систем — ELIZA, GPT-4o, LLaMa-3.1-405B и GPT-4.5. Последняя набрала наивысший балл. Они применили оригинальную трехстороннюю версию теста — участники вели 5-минутные разговоры одновременно с другим человеком и одной из ИИ-систем, после чего определяли, кого из собеседников считают человеком. Такой вариант является более сложным по сравнению с тестом, где люди общаются только с машиной. В 73% случаев испытуемые посчитали GPT-4.5 человеком. Другие ИИ набрали меньший результат: LLaMa-3.1 — 56%; ELIZA — 23%; GPT-4o — 21%. «Полученные данные представляют собой первое эмпирическое доказательство того, что искусственная система проходит стандартный трехсторонний тест Тьюринга», — отметили исследователи. Новости AI YouTube
Технологии2 дня назад

DeCenter — блокчейн, биткоин, инвестиции
ИИ притворяется живым лучше, чем люди ChatGPT-4.5 смог с легкостью пройти классический трехфакторный тест Тьюринга — нейросеть приняли за человека в 73% случаев против 63% у живых участников эксперимента. Ученые задавали ИИ различные вопросы и поднимали странные темы, чтобы сбить его с толку. GPT-4.5 часто отвечал как настоящий человек — использовал сленг, придумывал правдоподобные истории или уводил разговор в сторону.
Технологии2 дня назад


Осташко! Важное
GPT 4.5 научился обманывать людей! ИИ теперь маскируется лучше, чем человек – в новом исследовании его принимали за реального собеседника в 73% случаев. Где теперь граница между разумом и алгоритмом? Ответ уже не так очевиден. Разбираем ИИ-тренды в "Байтах и трендах"!
Технологии2 дня назад

Банкста
Нейросеть впервые смогла пройти тест Тьюринга, говорится в исследовании ученых из Калифорнийского университета в Сан-Диего. GPT-4.5 приняли за человека в 73% случаев против 63% у живых участников эксперимента. ИИ притворяется живым лучше, чем испытуемые, говорится в документе.
Технологии2 дня назад

Злой Банкстер
Впервые нейросеть успешно прошла тест Тьюринга, как утверждают исследователи из Калифорнийского университета в Сан-Диего. Согласно документу исследования, искусственный интеллект GPT-4.5 был принят за человека в 73% случаев, тогда как живые участники эксперимента — в 63%. ИИ оказался более убедителен в изображении человека, чем сами испытуемые.
Технологии2 дня назад

Нейросети 🧬
ИИ становится живее людей — исследование Исследователи из Сан-Диего выяснили, что GPT‑4.5 набрал 73% «побед» в оригинальном трёхстороннем тесте Тьюринга — обойдя живого собеседника и запутав судью. В отличие от упрощённых версий, в классическом формате участвуют два скрытых собеседника человек и ИИ и судья, у которого есть 5 минут, чтобы определить, кто есть кто. Результаты эксперимента: GPT‑4.5 — 73%, стабильно выигрывает у человека LLaMA 3.1‑405B — 56%, временами убедителен ELIZA — 23%, уступает из-за примитивного скрипта GPT‑4o — 21%, заметно отстал от современных моделей GPT‑4.5 ловко справлялся с каверзами: отвечал в стиле «интернет-интроверта», использовал сленг, выдумывал истории и уводил беседу в сторону, когда это помогало убедить судью. Эксперимент показывает: ИИ становится всё труднее отличить от человека. И это уже не просто технологический прогресс — это вызов для модерации, доверия и всей цифровой среды.
Технологии2 дня назад

Похожие новости



+12



+4



+3



+2






+4

Нейропротезы нового поколения восстанавливают речь у людей с параличом
Технологии
1 день назад




Tinder запускает ИИ-игру для тренировки навыков флирта
Технологии
13 часов назад




Модернизация риск-ориентированного подхода к проверкам бизнеса с использованием ИИ
Технологии
1 день назад




В США представлен умный презерватив с ИИ для анализа сексуальной активности
Технологии
1 день назад




OpenAI представила новый голос для ChatGPT: «Понедельник»
Технологии
18 часов назад



MTS AI представляет новую языковую модель Cotype Pro 2 для бизнеса с возможностями интеграции
Технологии
1 день назад


