29 апреля, 16:33
DeepSeek анонсирует модель R2 с революционными характеристиками


Остренько
Новый DeepSeek R2 возможно готовится к реализу На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. Что говорит: Будет новая архитектура Hybrid MoE 3.0. Всего в модели 1,2 триллиона параметров, но фактически единовременно активироваться будут около 78 миллиардов. По тестам Alibaba Cloud, стоимость обработки одного токена на длинных контекстах будет на 97,3% ниже по сравнению с GPT-4 Turbo. Обучают на Huawei Ascend 910B и Nvidia H800. Фактическая производительность на FP16 составила 512 PetaFLOPS. Это примерно 91% эффективности аналогичных кластеров на чипах Nvidia A100, то есть довольно амбициозно. Релиз – в мае.
Технологии60 дней назад


VA-PC Code
В китайские соцсети якобы утекла информация о предстоящем релизе DeepSeek R2 На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. - Вот эта нейронка нас точно заменит Следи за новостями - VA-PC CODE Наш основной канал
Технологии60 дней назад



DNS_Club
DeepSeek R2 окажется на 97 % дешевле в сравнении с GPT-4 от OpenAI — Wccftech Сообщается, что новая модель была полностью обручена на ускорителях искусственного интеллекта HUAWEI Ascend. По информации источника, релиз улучшенной ИИ-модели DeepSeek R2 уже не за горами. В ней будет применена модифицированная гибридная архитектура Mixture of Experts. Читать далее
Технологии60 дней назад


Rozetked
Появились первые подробности о DeepSeek R2 Сообщается, что новая модель будет использовать гибридную архитектуру MoE Mixture of Experts и вдвое больше параметров, чем DeepSeek R1. Кроме того, R2 должна обходиться на 97,3% дешевле в использовании, чем GPT 4o, а обучали модель на китайских ускорителях Huawei Ascend 910B. Когда DeepSeek R2 будет представлена, неизвестно. Rozetked Подписаться
Технологии60 дней назад


Железный Человек
Кто теперь круче? Все сейчас активно обсуждают готовящийся релиз R2 от DeepSeek. По последним данным, R2 рассматривается как один из самый амбициозных проектов на рынке базовых моделей 2025 года. Ожидается, что она будет находиться в одной лиге с GPT-4 Turbo и Claude 3 Opus в задачах кодирования и комплексной работы с документами. Что обещают: 1,2 триллиона параметров, контекстное окно 128 тыс.+; Гибридная архитектура MoE для оптимизированных рабочих нагрузок ИИ; Обучена на графических процессорах Huawei Ascend 910B; Более низкая стоимость инференса на токен. На 97% дешевле в обучении, чем GPT-4. По оценкам исследовательской группы Zeta Alpha, если заявленные характеристики R2 подтвердятся, DeepSeek сможет занять место в топ-3 разработчиков больших моделей наряду с OpenAI и Anthropic, опередив многих американских и европейских конкурентов. Есть слухи, что компания уже сейчас получает предложения от крупных игроков для интеграции R2 в корпоративные решения в финансах, телекоммуникациях и госсекторе. При этом эксперты предупреждают о потенциальных сложностях. DeepSeek предстоит доказать стабильность R2 на международных рынках, где требования к этичности, безопасности и качеству данных выше, чем в Китае. Тем не менее, в текущих прогнозах DeepSeek оценивается как один из самых быстрорастущих и потенциально доминирующих игроков в следующей волне развития ИИ. Сможет ли R2 доказать свое превосходство? #СверхРазум
Технологии58 дней назад
Похожие новости



+11



+6



+1



+10



+2



+12

Влияние ИИ на рынок труда: эйчары сталкиваются с новыми вызовами
Технологии
18 часов назад




Генеративный ИИ становится ключевым инструментом для бизнеса на GigaConf 2025
Технологии
10 часов назад




Новые иранские БПЛА Shahed-136 «MS» поступили на вооружение ВС РФ
Технологии
1 день назад




Google представила автономную ИИ-модель Gemini Robotics On-Device для роботов
Технологии
1 день назад




Цукерберг переманил троих исследователей из OpenAI за $100 млн
Спорт
2 часа назад




Сбер анонсировал GigaCode 2.0 и GigaStudio на конференции GigaConf 2025
Технологии
1 день назад


