27 февраля, 00:20

DeepSeek ускоряет запуск модели ИИ R2 на фоне конкуренции и эмбарго

Reuters: DeepSeek спешит запустить новую модель ИИ – R2  Конкуренты все еще переваривают последствия появления R1, который был создан на базе менее мощных чипов Nvidia, но при этом конкурентоспособен по сравнению с теми, на разработку которых американские технологические гиганты потратили сотни миллиардов долларов.  Компания заявляет, что надеется, что новая модель будет производить лучшее кодирование и сможет рассуждать на языках помимо английского. R2, вероятно, обеспокоит правительство США, которое определило лидерство в области ИИ как национальный приоритет. Его выпуск может еще больше активизировать китайские власти и компании, десятки из которых заявляют, что начали интегрировать модели DeepSeek в свои продукты.
Нетленка
Нетленка
Reuters: DeepSeek спешит запустить новую модель ИИ – R2 Конкуренты все еще переваривают последствия появления R1, который был создан на базе менее мощных чипов Nvidia, но при этом конкурентоспособен по сравнению с теми, на разработку которых американские технологические гиганты потратили сотни миллиардов долларов. Компания заявляет, что надеется, что новая модель будет производить лучшее кодирование и сможет рассуждать на языках помимо английского. R2, вероятно, обеспокоит правительство США, которое определило лидерство в области ИИ как национальный приоритет. Его выпуск может еще больше активизировать китайские власти и компании, десятки из которых заявляют, что начали интегрировать модели DeepSeek в свои продукты.
DeepSeek планирует запустить новую модель ИИ до мая  Новая модель R2 будет производить лучшее кодирование и сможет рассуждать не только на английском языке.  По мнению экспертов, запуск R2 может еще больше ослабить позиции доминирующих игроков в сфере ИИ-разработок.
Office Life Бизнес-новости
Office Life Бизнес-новости
DeepSeek планирует запустить новую модель ИИ до мая Новая модель R2 будет производить лучшее кодирование и сможет рассуждать не только на английском языке. По мнению экспертов, запуск R2 может еще больше ослабить позиции доминирующих игроков в сфере ИИ-разработок.
42 секунды
42 секунды
Reuters: DeepSeek спешит запустить новую версию модели ИИ – DeepSeek хочет закрепить свое преимущество на рынке – Китайский стартап ускоряет выпуск новой ИИ-модели R2 – Ранее выход новой R2 планировался на начало мая 2025 – Теперь DeepSeek хочет выпустить R2 как можно раньше – Новая модель DeepSeek будет лучше работать с кодом – Также R2 должна лучше работать с различными языками – Запуск модели R2 будет поворотным моментом для рынка – Новая R2 может создать беспокойство для властей США
DeepSeek представит свою рассуждающую модель ИИ до выхода GPT-5  Китайский стартап DeepSeek, который в начале года обвалил мировой рынок ИИ на $1 триллион, не планирует давать западным конкурентам передышку. Разработчики трудятся над новой рассуждающей ИИ-моделью R2, которую хотят представить до выхода GPT-5, который запланирован на конец мая. В этом случае у китайцев получится переманить часть клиентов и инвесторов Альтмана.
Хайтек+
Хайтек+
DeepSeek представит свою рассуждающую модель ИИ до выхода GPT-5 Китайский стартап DeepSeek, который в начале года обвалил мировой рынок ИИ на $1 триллион, не планирует давать западным конкурентам передышку. Разработчики трудятся над новой рассуждающей ИИ-моделью R2, которую хотят представить до выхода GPT-5, который запланирован на конец мая. В этом случае у китайцев получится переманить часть клиентов и инвесторов Альтмана.
Зачем носки, если можно подарить будущее? Удиви криптоподарком!
₿tc-card.com
₿tc-card.com
Зачем носки, если можно подарить будущее? Удиви криптоподарком!
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
DeepSeek готовится к выходу новой модели R2 и открывает код новых технологий #DeepSeek не отстает от гонки за выпуск новых лучших моделей, после выходов Anthropic, OpenAI и Google компания собирается выпустить свою новую модель R2 раньше изначально запланированного срока в мае. Параллельно с этим компания делает стратегический ход, открывая доступ к двум критически важным технологиям: DeepEP и FlashMLA. DeepEP — первая библиотека с открытым исходным кодом для эффективной коммуникации в моделях на архитектуре Mixture-of-Experts MoE . Именно эта технология позволила DeepSeek создать свою модель R1, которая превзошла западных конкурентов при значительно меньших затратах на обучение около $6 млн . В дополнение к DeepEP, компания представила FlashMLA — высокоэффективный декодирующий модуль для GPU архитектуры Hopper. Этот компонент достигает впечатляющих показателей: 3000 ГБ/с при операциях с памятью и 580 TFLOPS при вычислительных операциях на GPU H800, что критически важно для быстрой работы крупных моделей. Интересно, как в этот раз стратегия DeepSeek по открытию своих технологий повлияет на западных конкурентов? Что они сделают? Наблюдаем.
БлоGнот
БлоGнот
А вот и новости про DeepSeek — ребята активно включаются в гонку. По информации источников Reuters, компания из Ханчжоу планировала выпустить модель R2 в начале мая, но теперь хочет сделать это "как можно раньше". Ожидается, что новая модель будет лучше справляться с кодингом и сможет рассуждать не только на английском языке. Сообщается, что хедж-фонд, которому принадлежит компания — High-Flyer. — инвестировал 1.2 млрд юаней в два суперкомпьютерных AI-кластера в 2020-2021 годах, еще до запрета на экспорт чипов Nvidia A100 в Китай. Второй кластер, Fire-Flyer II, включал около 10,000 этих чипов. Кроме того, до полного запрета в октябре 2023 года High-Flyer приобрел до 50 тысяч чипов H800 — урезанная версия H100 для китайского рынка, где была уменьшена скорость обмена данными. Правда, говорят, что за счет низкоуровневых оптимизаций частично эти ограничения удалось обойти. Сам Лян признает, что главной проблемой остается эмбарго на высокопроизводительные чипы: "Наша проблема никогда не была в финансировании. Это эмбарго на высокопроизводительные чипы."