29 апреля, 16:33

DeepSeek анонсирует модель R2 с революционными характеристиками

Новый DeepSeek R2  возможно  готовится к реализу  На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. Что говорит:    Будет новая архитектура Hybrid MoE 3.0. Всего в модели 1,2 триллиона параметров, но фактически единовременно активироваться будут около 78 миллиардов. По тестам Alibaba Cloud, стоимость обработки одного токена на длинных контекстах будет на 97,3% ниже по сравнению с GPT-4 Turbo.    Обучают на Huawei Ascend 910B и Nvidia H800. Фактическая производительность на FP16 составила 512 PetaFLOPS. Это примерно 91% эффективности аналогичных кластеров на чипах Nvidia A100, то есть довольно амбициозно.    Релиз – в мае.
Остренько
Остренько
Новый DeepSeek R2 возможно готовится к реализу На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. Что говорит: Будет новая архитектура Hybrid MoE 3.0. Всего в модели 1,2 триллиона параметров, но фактически единовременно активироваться будут около 78 миллиардов. По тестам Alibaba Cloud, стоимость обработки одного токена на длинных контекстах будет на 97,3% ниже по сравнению с GPT-4 Turbo. Обучают на Huawei Ascend 910B и Nvidia H800. Фактическая производительность на FP16 составила 512 PetaFLOPS. Это примерно 91% эффективности аналогичных кластеров на чипах Nvidia A100, то есть довольно амбициозно. Релиз – в мае.
В китайские соцсети якобы утекла информация о предстоящем релизе DeepSeek R2    На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2.     - Вот эта нейронка нас точно заменит    Следи за новостями - VA-PC CODE   Наш основной канал
VA-PC Code
VA-PC Code
В китайские соцсети якобы утекла информация о предстоящем релизе DeepSeek R2 На платформе Jiuyan Gongshe, которая предназначена для обсуждения фондовых рынков и шеринга аналитических материалов, некий пользователь опубликовал статью с инсайдами про R2. - Вот эта нейронка нас точно заменит Следи за новостями - VA-PC CODE Наш основной канал
Чат, который думает за тебя
1chatgpt.ru
1chatgpt.ru
Чат, который думает за тебя
DeepSeek R2 окажется на 97 % дешевле в сравнении с GPT-4 от OpenAI — Wccftech  Сообщается, что новая модель была полностью обручена на ускорителях искусственного интеллекта HUAWEI Ascend. По информации источника, релиз улучшенной ИИ-модели DeepSeek R2 уже не за горами. В ней будет применена модифицированная гибридная архитектура Mixture of Experts.  Читать далее
DNS_Club
DNS_Club
DeepSeek R2 окажется на 97 % дешевле в сравнении с GPT-4 от OpenAI — Wccftech Сообщается, что новая модель была полностью обручена на ускорителях искусственного интеллекта HUAWEI Ascend. По информации источника, релиз улучшенной ИИ-модели DeepSeek R2 уже не за горами. В ней будет применена модифицированная гибридная архитектура Mixture of Experts. Читать далее
Появились первые подробности о DeepSeek R2  Сообщается, что новая модель будет использовать гибридную архитектуру MoE  Mixture of Experts  и вдвое больше параметров, чем DeepSeek R1.  Кроме того, R2 должна обходиться на 97,3% дешевле в использовании, чем GPT 4o, а обучали модель на китайских ускорителях Huawei Ascend 910B.  Когда DeepSeek R2 будет представлена, неизвестно.    Rozetked   Подписаться
Rozetked
Rozetked
Появились первые подробности о DeepSeek R2 Сообщается, что новая модель будет использовать гибридную архитектуру MoE Mixture of Experts и вдвое больше параметров, чем DeepSeek R1. Кроме того, R2 должна обходиться на 97,3% дешевле в использовании, чем GPT 4o, а обучали модель на китайских ускорителях Huawei Ascend 910B. Когда DeepSeek R2 будет представлена, неизвестно. Rozetked Подписаться
Кто теперь круче?  Все сейчас активно обсуждают готовящийся релиз R2 от DeepSeek. По последним данным, R2 рассматривается как один из самый амбициозных проектов на рынке базовых моделей 2025 года. Ожидается, что она будет находиться в одной лиге с GPT-4 Turbo и Claude 3 Opus в задачах кодирования и комплексной работы с документами.  Что обещают:    1,2 триллиона параметров, контекстное окно 128 тыс.+;    Гибридная архитектура MoE для оптимизированных рабочих нагрузок ИИ;   Обучена на графических процессорах Huawei Ascend 910B;   Более низкая стоимость инференса на токен.   На 97% дешевле в обучении, чем GPT-4.    По оценкам исследовательской группы Zeta Alpha, если заявленные характеристики R2 подтвердятся, DeepSeek сможет занять место в топ-3 разработчиков больших моделей наряду с OpenAI и Anthropic, опередив многих американских и европейских конкурентов. Есть слухи, что компания уже сейчас получает предложения от крупных игроков для интеграции R2 в корпоративные решения в финансах, телекоммуникациях и госсекторе.  При этом эксперты предупреждают о потенциальных сложностях. DeepSeek предстоит доказать стабильность R2 на международных рынках, где требования к этичности, безопасности и качеству данных выше, чем в Китае.    Тем не менее, в текущих прогнозах DeepSeek оценивается как один из самых быстрорастущих и потенциально доминирующих игроков в следующей волне развития ИИ. Сможет ли R2 доказать свое превосходство?  #СверхРазум
Железный Человек
Железный Человек
Кто теперь круче? Все сейчас активно обсуждают готовящийся релиз R2 от DeepSeek. По последним данным, R2 рассматривается как один из самый амбициозных проектов на рынке базовых моделей 2025 года. Ожидается, что она будет находиться в одной лиге с GPT-4 Turbo и Claude 3 Opus в задачах кодирования и комплексной работы с документами. Что обещают: 1,2 триллиона параметров, контекстное окно 128 тыс.+; Гибридная архитектура MoE для оптимизированных рабочих нагрузок ИИ; Обучена на графических процессорах Huawei Ascend 910B; Более низкая стоимость инференса на токен. На 97% дешевле в обучении, чем GPT-4. По оценкам исследовательской группы Zeta Alpha, если заявленные характеристики R2 подтвердятся, DeepSeek сможет занять место в топ-3 разработчиков больших моделей наряду с OpenAI и Anthropic, опередив многих американских и европейских конкурентов. Есть слухи, что компания уже сейчас получает предложения от крупных игроков для интеграции R2 в корпоративные решения в финансах, телекоммуникациях и госсекторе. При этом эксперты предупреждают о потенциальных сложностях. DeepSeek предстоит доказать стабильность R2 на международных рынках, где требования к этичности, безопасности и качеству данных выше, чем в Китае. Тем не менее, в текущих прогнозах DeepSeek оценивается как один из самых быстрорастущих и потенциально доминирующих игроков в следующей волне развития ИИ. Сможет ли R2 доказать свое превосходство? #СверхРазум