29 апреля, 16:33
DeepSeek анонсирует модель R2 с революционными характеристиками


Остренько
Новый DeepSeek R2 возможно готовится к реализу На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. Что говорит: Будет новая архитектура Hybrid MoE 3.0. Всего в модели 1,2 триллиона параметров, но фактически единовременно активироваться будут около 78 миллиардов. По тестам Alibaba Cloud, стоимость обработки одного токена на длинных контекстах будет на 97,3% ниже по сравнению с GPT-4 Turbo. Обучают на Huawei Ascend 910B и Nvidia H800. Фактическая производительность на FP16 составила 512 PetaFLOPS. Это примерно 91% эффективности аналогичных кластеров на чипах Nvidia A100, то есть довольно амбициозно. Релиз – в мае.
Технологии2 дня назад


VA-PC Code
В китайские соцсети якобы утекла информация о предстоящем релизе DeepSeek R2 На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. - Вот эта нейронка нас точно заменит Следи за новостями - VA-PC CODE Наш основной канал
Технологии2 дня назад



DNS_Club
DeepSeek R2 окажется на 97 % дешевле в сравнении с GPT-4 от OpenAI — Wccftech Сообщается, что новая модель была полностью обручена на ускорителях искусственного интеллекта HUAWEI Ascend. По информации источника, релиз улучшенной ИИ-модели DeepSeek R2 уже не за горами. В ней будет применена модифицированная гибридная архитектура Mixture of Experts. Читать далее
Технологии2 дня назад


Rozetked
Появились первые подробности о DeepSeek R2 Сообщается, что новая модель будет использовать гибридную архитектуру MoE Mixture of Experts и вдвое больше параметров, чем DeepSeek R1. Кроме того, R2 должна обходиться на 97,3% дешевле в использовании, чем GPT 4o, а обучали модель на китайских ускорителях Huawei Ascend 910B. Когда DeepSeek R2 будет представлена, неизвестно. Rozetked Подписаться
Технологии2 дня назад


Железный Человек
Кто теперь круче? Все сейчас активно обсуждают готовящийся релиз R2 от DeepSeek. По последним данным, R2 рассматривается как один из самый амбициозных проектов на рынке базовых моделей 2025 года. Ожидается, что она будет находиться в одной лиге с GPT-4 Turbo и Claude 3 Opus в задачах кодирования и комплексной работы с документами. Что обещают: 1,2 триллиона параметров, контекстное окно 128 тыс.+; Гибридная архитектура MoE для оптимизированных рабочих нагрузок ИИ; Обучена на графических процессорах Huawei Ascend 910B; Более низкая стоимость инференса на токен. На 97% дешевле в обучении, чем GPT-4. По оценкам исследовательской группы Zeta Alpha, если заявленные характеристики R2 подтвердятся, DeepSeek сможет занять место в топ-3 разработчиков больших моделей наряду с OpenAI и Anthropic, опередив многих американских и европейских конкурентов. Есть слухи, что компания уже сейчас получает предложения от крупных игроков для интеграции R2 в корпоративные решения в финансах, телекоммуникациях и госсекторе. При этом эксперты предупреждают о потенциальных сложностях. DeepSeek предстоит доказать стабильность R2 на международных рынках, где требования к этичности, безопасности и качеству данных выше, чем в Китае. Тем не менее, в текущих прогнозах DeepSeek оценивается как один из самых быстрорастущих и потенциально доминирующих игроков в следующей волне развития ИИ. Сможет ли R2 доказать свое превосходство? #СверхРазум
Технологии7 часов назад
Похожие новости



+14



+9



+5



+2



+7



+7

Alibaba запускает новые языковые модели Qwen3 с открытым исходным кодом
Технологии
14 часов назад




Alibaba представила Qwen 3 — новые модели ИИ с поддержкой 119 языков
Технологии
15 часов назад




YouTube тестирует новую функцию ИИ для оптимизации поиска видео
Технологии
1 день назад




Илон Маск представил Grok 3.5 - ИИ для решения сложных задач
Технологии
2 часа назад




Huawei запускает тестирование нового ИИ-чипа Ascend 910D для конкуренции с Nvidia
Технологии
1 день назад




Круглый стол в Мособлизбиркоме: Искусственный интеллект как инструмент для выборов
Общество
8 часов назад


