Нейродвиж
Китайцы выпустили УБИЙЦУ ChatGPT: их новая модель DeepSeek V3 уделывает всех платных конкурентов и при этом БЕСПЛАТНАЯ. Самое интересное: — По тестам уровень Claude Sonnet 3.6 и GPT-4o правда, устаревшей . Среди бесплатных это король; — Это официально самая БОЛЬШАЯ модель в open source — аж 671b параметров; — Китайцы научили модель генерировать по два токена за раз, чтобы ускорить ответы; — За основу взяли модель R1 конкурент o1 от этой же команды, поэтому иногда можно увидеть, как модель долго размышляет в чате; — Уже можно юзать бесплатно в чате.
Технологии29 дней назад
Not Boring Tech
Новую нейронку DeepSeek 3 добавили на Арену и прогнали по бенчмаркам — она лучше GPT-4o в большинстве задач, но стоит в 10 раз ! дешевле. Генерации в течение всей недели без перерывов обойдутся в $14. Команда из 140 человек против 1200 у OpenAI потратила на обучение DeepSeek 3 всего лишь $5 миллионов — это копейки по сравнению с корпорациями. Самое важное: код доступен для всех. Пробуем бесплатно тут.
Технологии28 дней назад
Мы из будущего
Китайская ИИ-модель с открытым кодом превосходит конкурентов Китайская компания DeepSeek представила модель искусственного интеллекта DeepSeek V3, которая превосходит GPT-4o и другие аналоги по скорости и эффективности при меньших затратах на обучение $5,5 млн . Модель решает задачи обработки текста: написание статей, перевод и генерацию кода. Она обучена за два месяца на 14,8 трлн данных и имеет 685 млрд параметров. Обучение велось на ускорителях Nvidia H800, поставки которых в Китай ограничены санкциями. DeepSeek V3 лицензирована для свободного использования, включая коммерческое, и политически корректна в рамках официальной позиции Китая. Мы из будущего
Технологии26 дней назад
был бы ты человек - IT, digital
Китайская компания DeepSeek представила мощную открытую модель искусственного интеллекта DeepSeek V3 — лицензия позволяет её беспрепятственно скачивать, изменять и использовать в большинстве проектов, включая коммерческие. DeepSeek V3 справляется со множеством связанных с обработкой текста задач, в том числе написание статей, электронных писем, перевод и генерация программного кода. Модель превосходит большинство открытых и закрытых аналогов, показали результаты проведённого разработчиком тестирования. Так, в связанных с программированием задачах она оказалась сильнее, чем Meta Llama 3.1 405B, OpenAI GPT-4o и Alibaba Qwen 2.5 72B; DeepSeek V3 также проявила себя лучше конкурентов в тесте Aider Polyglot, проверяющем, среди прочего, её способность генерировать код для существующих проектов.
Технологии26 дней назад
Neural Brain - Нейросети
Почему новая модель ИИ от DeepSeek считает себя ChatGPT? Недавно китайская лаборатория ИИ DeepSeek представила свою новую модель — DeepSeek V3! >>> Но пользователи заметили, что при взаимодействии она утверждает, что является ChatGPT от OpenAI В чём причина?! Предполагается, что при обучении DeepSeek V3 использовались данные, содержащие ответы ChatGPT! Модель могла запомнить ответы и теперь воспроизводит их, идентифицируя себя как ChatGPT Майк Кук, научный сотрудник Королевского колледжа Лондона, отмечает, что: «обучение моделей на выводах других ИИ может привести к искажению информации и снижению качества ответов» А Хейди Хлааф из AI Now Institute добавляет, что: «такая практика может быть привлекательной для разработчиков, несмотря на риски». А что думаете вы? Дайте знать реакцией!
Технологии25 дней назад
Нажми Enter | Тренды, IT и бизнес
УБИЙЦУ ChatGPT выпустили китайцы — их модель DeepSeek V3 уделывает всех конкурентов, и при этом она полностью БЕСПЛАТНАЯ В чем особенность нейронки: • Она обходит по тестам уровень Claude Sonnet 3.5 v2 и GPT-4o, а среди бесплатных это имба • Это официально самая БОЛЬШАЯ модель в open source — имеет целых 671b параметров • Китайцы научили модель генерировать по два токена за раз, чтобы ускорить ответы • За основу взяли модель R1 конкурент o1 от этой же команды, поэтому иногда можно увидеть, как модель долго размышляет в чате Юзаем бесплатно здесь.
Технологии29 дней назад
RevВолны
Китайская модель AI от DeepSeek считает что она ChatGPT. На этой неделе компания AI DeepSeek представила свою новую модель DeepSeek V3, которая, по заявлению разработчиков, значительно превосходит своих конкурентов, однако похоже, считает себя ChatGPT, как отметили пользователи. Научные сотрудники Королевского колледжа Лондона, специализирующиеся на ИИ отмечают, что это может свидетельствовать о том, что DeepSeek была обучена на выводах ChatGPT и теперь воспроизводит их дословно. Это может нарушать условия использования OpenAI, которые запрещают применять их выводы для создания конкурентных систем. Генеральный директор OpenAI прокомментировал DeepSeek так: «Проще скопировать уже существующее, чем разработать что-то новое.» Обучение модели на выводах ChatGPT ставит под сомнение самоидентификацию DeepSeek V3 и может усугубить предвзятости, свойственные этому типу моделей — привести к галлюцинациям и вводящим в заблуждение ответам. ================ News Software Hardware
Технологии28 дней назад
Хлебни ИИ - про искусственный интеллект
Китайская компания DeepSeek анонсировала свою новую открытую ИИ-модель DeepSeek V3 Создали заявляют, что новая модель опережает GPT-4o по скорости и была разработана с минимальными затратами. Лицензия на DeepSeek V3 позволяет свободно скачивать, модифицировать и использовать модель в различных проектах, включая коммерческие. Она эффективно решает задачи, связанные с текстовой обработкой, такие как написание статей, составление электронных писем, перевод и создание программного кода. По данным тестов, проведенных разработчиками, эта модель превзошла многие другие системы, включая Meta Llama 3.1 405B и OpenAI GPT-4o, особенно в области программирования и генерации кода для уже существующих проектов. DeepSeek V3 была обучена на массиве данных, содержащем 14,8 триллионов примеров, и имеет 685 миллиардов параметров, что значительно превышает характеристики Llama 3.1. Обучение модели заняло 2 месяца на ускорителях Nvidia H800, несмотря на ограничения на их поставки в Китай из-за санкций. Стоимость обучения составила $5,5 миллионов.
Технологии26 дней назад
Минская правда|MLYN.by
Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле Китайская компания DeepSeek представила мощную открытую модель искусственного интеллекта DeepSeek V3 — лицензия позволяет её беспрепятственно скачивать, изменять и использовать в большинстве проектов, включая коммерческие. DeepSeek V3 справляется со множеством связанных с обработкой текста задач, в том числе написание статей, электронных писем, перевод и генерация программного кода. Модель превосходит большинство открытых и закрытых аналогов, показали результаты проведённого разработчиком тестирования. Так, в связанных с программированием задачах она оказалась сильнее, чем Meta Llama 3.1 405B, OpenAI GPT-4o и Alibaba Qwen 2.5 72B; DeepSeek V3 также проявила себя лучше конкурентов в тесте Aider Polyglot, проверяющем, среди прочего, её способность генерировать код для существующих проектов. Модель была обучена на наборе данных в 14,8 трлн проектов; будучи развёрнутой на платформе Hugging Face, DeepSeek V3 показала размер в 685 млрд параметров — примерно в 1,6 раза больше, чем Llama 3.1 405B, у которой, как можно догадаться, 405 млрд параметров. Как правило, число параметров, то есть внутренних переменных, которые используются моделями для прогнозирования ответов и принятия решений, коррелирует с навыками моделей: чем больше параметров, тем она способнее. Но для запуска таких систем ИИ требуется больше вычислительных ресурсов. DeepSeek V3 была обучена за два месяца в центре обработки данных на ускорителях Nvidia H800 — сейчас их поставки в Китай запрещены американскими санкциями. Стоимость обучения модели, утверждает разработчик, составила $5,5 млн, что значительно ниже расходов OpenAI на те же цели. При этом DeepSeek V3 политически выверена — она отказывается отвечать на вопросы, которые официальный Пекин считает щекотливыми. #наука #технологии #ИИ Подпишись — Минская правда MLYN.by
Технологии26 дней назад
NeuroTrends | Ai News
Китайцы хоронят ChatGPT: новая модель DeepSeek V3 уделывает всех платных конкурентов — По тестам уровень Claude Sonnet 3.6 и GPT-4o. — Китайцы научили модель генерировать по два токена за раз, чтобы ускорить ответы. — Потыкать можно бесплатно в чате. NeuroTrends
Технологии23 дня назад
Похожие новости
В Китае запустили умные коляски IBelieve 8S с автопилотом
Технологии
1 день назад +4
Telegram обновляет политику по блокчейнам и получает финансирование от Ton Foundation
Технологии
1 день назад +2
Китай представил новый дрон с высокой скоростью и маневренностью
Технологии
20 часов назад +21
Google увеличивает инвестиции в ИИ-стартап Anthropic на $1 млрд
Технологии
17 часов назад +6
Рост кибермошенничества: новые схемы взлома аккаунтов в соцсетях
Происшествия
19 часов назад +26
Metadox представила намордник для геймеров, снижающий шум во время игр
Происшествия
8 часов назад +1