DeepSeek анонсирует модель R2 с революционными характеристиками

Новый DeepSeek R2 возможно готовится к реализу На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. Что говорит: Будет новая архитектура Hybrid MoE 3.0. Всего в модели 1,2 триллиона параметров, но фактически единовременно активироваться будут около 78 миллиардов. По тестам Alibaba Cloud, стоимость обработки одного токена на длинных контекстах будет на 97,3% ниже по сравнению с GPT-4 Turbo. Обучают на Huawei Ascend 910B и Nvidia H800. Фактическая производительность на FP16 составила 512 PetaFLOPS. Это примерно 91% эффективности аналогичных кластеров на чипах Nvidia A100, то есть довольно амбициозно. Релиз – в мае.

Технологии376 дней назад

Кто теперь круче? Все сейчас активно обсуждают готовящийся релиз R2 от DeepSeek. По последним данным, R2 рассматривается как один из самый амбициозных проектов на рынке базовых моделей 2025 года. Ожидается, что она будет находиться в одной лиге с GPT-4 Turbo и Claude 3 Opus в задачах кодирования и комплексной работы с документами. Что обещают: 1,2 триллиона параметров, контекстное окно 128 тыс.+; Гибридная архитектура MoE для оптимизированных рабочих нагрузок ИИ; Обучена на графических процессорах Huawei Ascend 910B; Более низкая стоимость инференса на токен. На 97% дешевле в обучении, чем GPT-4. По оценкам исследовательской группы Zeta Alpha, если заявленные характеристики R2 подтвердятся, DeepSeek сможет занять место в топ-3 разработчиков больших моделей наряду с OpenAI и Anthropic, опередив многих американских и европейских конкурентов. Есть слухи, что компания уже сейчас получает предложения от крупных игроков для интеграции R2 в корпоративные решения в финансах, телекоммуникациях и госсекторе. При этом эксперты предупреждают о потенциальных сложностях. DeepSeek предстоит доказать стабильность R2 на международных рынках, где требования к этичности, безопасности и качеству данных выше, чем в Китае. Тем не менее, в текущих прогнозах DeepSeek оценивается как один из самых быстрорастущих и потенциально доминирующих игроков в следующей волне развития ИИ. Сможет ли R2 доказать свое превосходство? #СверхРазум

Железный Человек

Кто теперь круче? Все сейчас активно обсуждают готовящийся релиз R2 от DeepSeek. По последним данным, R2 рассматривается как один из самый амбициозных проектов на рынке базовых моделей 2025 года. Ожидается, что она будет находиться в одной лиге с GPT-4 Turbo и Claude 3 Opus в задачах кодирования и комплексной работы с документами. Что обещают: 1,2 триллиона параметров, контекстное окно 128 тыс.+; Гибридная архитектура MoE для оптимизированных рабочих нагрузок ИИ; Обучена на графических процессорах Huawei Ascend 910B; Более низкая стоимость инференса на токен. На 97% дешевле в обучении, чем GPT-4. По оценкам исследовательской группы Zeta Alpha, если заявленные характеристики R2 подтвердятся, DeepSeek сможет занять место в топ-3 разработчиков больших моделей наряду с OpenAI и Anthropic, опередив многих американских и европейских конкурентов. Есть слухи, что компания уже сейчас получает предложения от крупных игроков для интеграции R2 в корпоративные решения в финансах, телекоммуникациях и госсекторе. При этом эксперты предупреждают о потенциальных сложностях. DeepSeek предстоит доказать стабильность R2 на международных рынках, где требования к этичности, безопасности и качеству данных выше, чем в Китае. Тем не менее, в текущих прогнозах DeepSeek оценивается как один из самых быстрорастущих и потенциально доминирующих игроков в следующей волне развития ИИ. Сможет ли R2 доказать свое превосходство? #СверхРазум

Технологии374 дня назад

DeepSeek R2 окажется на 97 % дешевле в сравнении с GPT-4 от OpenAI — Wccftech Сообщается, что новая модель была полностью обручена на ускорителях искусственного интеллекта HUAWEI Ascend. По информации источника, релиз улучшенной ИИ-модели DeepSeek R2 уже не за горами. В ней будет применена модифицированная гибридная архитектура Mixture of Experts. Читать далее

DNS_Club

DeepSeek R2 окажется на 97 % дешевле в сравнении с GPT-4 от OpenAI — Wccftech Сообщается, что новая модель была полностью обручена на ускорителях искусственного интеллекта HUAWEI Ascend. По информации источника, релиз улучшенной ИИ-модели DeepSeek R2 уже не за горами. В ней будет применена модифицированная гибридная архитектура Mixture of Experts. Читать далее

Технологии376 дней назад

Появились первые подробности о DeepSeek R2 Сообщается, что новая модель будет использовать гибридную архитектуру MoE Mixture of Experts и вдвое больше параметров, чем DeepSeek R1. Кроме того, R2 должна обходиться на 97,3% дешевле в использовании, чем GPT 4o, а обучали модель на китайских ускорителях Huawei Ascend 910B. Когда DeepSeek R2 будет представлена, неизвестно. Rozetked Подписаться

Rozetked

Появились первые подробности о DeepSeek R2 Сообщается, что новая модель будет использовать гибридную архитектуру MoE Mixture of Experts и вдвое больше параметров, чем DeepSeek R1. Кроме того, R2 должна обходиться на 97,3% дешевле в использовании, чем GPT 4o, а обучали модель на китайских ускорителях Huawei Ascend 910B. Когда DeepSeek R2 будет представлена, неизвестно. Rozetked Подписаться

Технологии376 дней назад

В китайские соцсети якобы утекла информация о предстоящем релизе DeepSeek R2 На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. - Вот эта нейронка нас точно заменит Следи за новостями - VA-PC CODE Наш основной канал

VA-PC Code

В китайские соцсети якобы утекла информация о предстоящем релизе DeepSeek R2 На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. - Вот эта нейронка нас точно заменит Следи за новостями - VA-PC CODE Наш основной канал

Технологии375 дней назад

DeepSeek анонсирует модель R2 с революционными характеристиками

Источники

OpenAI представила новые голосовые модели для улучшения диалогов и перевода в реальном времени

Путин и Чемезов обсудили достижения Ростеха и новые разработки

Обсуждение поддержки бизнеса и новые инициативы на ПМЭФ

Российские продажи умных колонок достигли 1 млн единиц в I квартале 2026 года

В России разработана система ИИ для беспилотников и автоматизации авиации

Ростех планирует увеличить производство самолетов к 2030 году