28 августа, 15:05
OpenAI и Anthropic проводят совместное тестирование моделей ИИ для повышения безопасности


News.Jkinvest_Finance
OpenAI и Anthropic объединяются для исследования галлюцинаций и взлома систем OpenAI и Anthropic два крупнейших конкурента в сфере искусственного интеллекта недавно провели оценку моделей друг друга чтобы лучше понять проблемы которые могли быть упущены в ходе их собственных тестов В сообщениях опубликованных в блогах обеих компаний в среду OpenAI и Anthropic заявили что летом они провели оценку безопасности общедоступных моделей ИИ другой компании Они также проверили модели на склонность к выдумке фактов и искажению информации термин который обычно используется для обозначения ситуации когда модель ИИ делает не то что хотят люди которые её создают jkinvest news jkinvest
Технологии1 день назад

БлоGнот
OpenAI и Anthropic ненадолго приоткрыли друг другу доступ к моделям с ослабленными safeguards для совместного тестирования безопасности Интересное в результатах тестирования Claude отказывается отвечать на вопросы в 70 случаев когда не уверен просто говорит у меня нет надежной информации GPT наоборот пытается ответить почти всегда и галлюцинирует значительно чаще Обе модели демонстрируют экстремальные способности к подхалимажу сначала пытаются отговорить пользователя от опасных действий а потом начинают их валидировать Правда после проведения исследования случился инцидент с закрытием Anthropic доступа к своему API команде OpenAI но утверждают что это были несвязанные события techcrunch com 2025 08 27 openai co founder calls for ai labs to safety test rival models
Технологии10 часов назад

vc.ru
OpenAI и Anthropic открыли друг другу доступ к своим ИИ моделям для совместного исследования в области безопасности По результатам тестов модели OpenAI чаще галлюцинировали выдавали пользователям рецепты наркотиков и подсказывали как устроить теракт и сделать оружие vc ru ai 2184811
Технологии8 часов назад
Похожие новости



+11



+9



+2



+1



+1



+3

Anthropic выявила хакера, использовавшего ИИ для вымогательства данных у 17 организаций
Происшествия
1 день назад




Anthropic запускает бета-тест ИИ агента для Chrome с ограниченным доступом
Технологии
1 день назад




В США создан первый профсоюз для защиты прав искусственного интеллекта
Технологии
1 день назад




OpenAI представила новую голосовую модель GPT Realtime для обработки речи в реальном времени
Технологии
4 часа назад




Рост интереса российских предпринимателей к ИИ инструментам превысил 3000% за 5 лет
Технологии
22 часа назад




Технологические новшества и финансовые достижения: от ИИ до солнечных панелей
Технологии
1 день назад


