27 февраля, 00:20

DeepSeek ускоряет запуск модели ИИ R2 на фоне конкуренции и эмбарго

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

#Ханчжоу #High-Flyer #Лян #Сша #Китай #DeepSeek

Reuters: DeepSeek спешит запустить новую модель ИИ – R2 Конкуренты все еще переваривают последствия появления R1, который был создан на базе менее мощных чипов Nvidia, но при этом конкурентоспособен по сравнению с теми, на разработку которых американские технологические гиганты потратили сотни миллиардов долларов. Компания заявляет, что надеется, что новая модель будет производить лучшее кодирование и сможет рассуждать на языках помимо английского. R2, вероятно, обеспокоит правительство США, которое определило лидерство в области ИИ как национальный приоритет. Его выпуск может еще больше активизировать китайские власти и компании, десятки из которых заявляют, что начали интегрировать модели DeepSeek в свои продукты.

Технологии437 дней назад

БлоGнот

А вот и новости про DeepSeek — ребята активно включаются в гонку. По информации источников Reuters, компания из Ханчжоу планировала выпустить модель R2 в начале мая, но теперь хочет сделать это "как можно раньше". Ожидается, что новая модель будет лучше справляться с кодингом и сможет рассуждать не только на английском языке. Сообщается, что хедж-фонд, которому принадлежит компания — High-Flyer. — инвестировал 1.2 млрд юаней в два суперкомпьютерных AI-кластера в 2020-2021 годах, еще до запрета на экспорт чипов Nvidia A100 в Китай. Второй кластер, Fire-Flyer II, включал около 10,000 этих чипов. Кроме того, до полного запрета в октябре 2023 года High-Flyer приобрел до 50 тысяч чипов H800 — урезанная версия H100 для китайского рынка, где была уменьшена скорость обмена данными. Правда, говорят, что за счет низкоуровневых оптимизаций частично эти ограничения удалось обойти. Сам Лян признает, что главной проблемой остается эмбарго на высокопроизводительные чипы: "Наша проблема никогда не была в финансировании. Это эмбарго на высокопроизводительные чипы."

Технологии436 дней назад

DeepSeek представит свою рассуждающую модель ИИ до выхода GPT-5 Китайский стартап DeepSeek, который в начале года обвалил мировой рынок ИИ на $1 триллион, не планирует давать западным конкурентам передышку. Разработчики трудятся над новой рассуждающей ИИ-моделью R2, которую хотят представить до выхода GPT-5, который запланирован на конец мая. В этом случае у китайцев получится переманить часть клиентов и инвесторов Альтмана.

Хайтек+

DeepSeek представит свою рассуждающую модель ИИ до выхода GPT-5 Китайский стартап DeepSeek, который в начале года обвалил мировой рынок ИИ на $1 триллион, не планирует давать западным конкурентам передышку. Разработчики трудятся над новой рассуждающей ИИ-моделью R2, которую хотят представить до выхода GPT-5, который запланирован на конец мая. В этом случае у китайцев получится переманить часть клиентов и инвесторов Альтмана.

Технологии436 дней назад

НОВОСТИ МАРКЕТИНГА

DeepSeek спешит запустить новую модель искусственного интеллекта, так как Китай идет напролом В прошлом месяце этот китайский стартап спровоцировал обвал акций техногигантов на мировых фондовых рынках на сумму более 1 триллиона долларов, представив недорогую модель искусственного интеллекта, которая превзошла многих западных конкурентов. Теперь компания из Ханчжоу ускоряет запуск преемника своей январской модели R1. Deepseek планировала выпустить R2 в начале мая, но теперь хочет представить ее как можно раньше, говорят источники. По словам компании, она надеется, что новая модель будет производить более качественную кодировку и сможет рассуждать не только на английском языке. Подробности об ускоренных сроках выхода R2 ранее не сообщались. Конкуренты все еще переваривают последствия R1, которая была построена на менее мощных чипах Nvidia, но успешно соперничает с теми, что были разработаны американскими технологическими гигантами за сотни миллиардов долларов. R2, вероятно, обеспокоит правительство США, которое определило лидерство в области ИИ в качестве национального приоритета. О компании DeepSeek, основатель которой Лян Вэньфэн стал миллиардером благодаря своему хедж-фонду High-Flyer, известно немного. Лян, которого один из бывших работодателей назвал "сдержанным и интровертным", не общался со СМИ с июля 2024 года.

Технологии430 дней назад

Все о блокчейн/мозге/space/WEB 3.0 в России и мире

DeepSeek готовится к выходу новой модели R2 и открывает код новых технологий #DeepSeek не отстает от гонки за выпуск новых лучших моделей, после выходов Anthropic, OpenAI и Google компания собирается выпустить свою новую модель R2 раньше изначально запланированного срока в мае. Параллельно с этим компания делает стратегический ход, открывая доступ к двум критически важным технологиям: DeepEP и FlashMLA. DeepEP — первая библиотека с открытым исходным кодом для эффективной коммуникации в моделях на архитектуре Mixture-of-Experts MoE . Именно эта технология позволила DeepSeek создать свою модель R1, которая превзошла западных конкурентов при значительно меньших затратах на обучение около $6 млн . В дополнение к DeepEP, компания представила FlashMLA — высокоэффективный декодирующий модуль для GPU архитектуры Hopper. Этот компонент достигает впечатляющих показателей: 3000 ГБ/с при операциях с памятью и 580 TFLOPS при вычислительных операциях на GPU H800, что критически важно для быстрой работы крупных моделей. Интересно, как в этот раз стратегия DeepSeek по открытию своих технологий повлияет на западных конкурентов? Что они сделают? Наблюдаем.

Технологии437 дней назад

DeepSeek планирует запустить новую модель ИИ до мая Новая модель R2 будет производить лучшее кодирование и сможет рассуждать не только на английском языке. По мнению экспертов, запуск R2 может еще больше ослабить позиции доминирующих игроков в сфере ИИ-разработок.

Office Life Бизнес-новости

DeepSeek планирует запустить новую модель ИИ до мая Новая модель R2 будет производить лучшее кодирование и сможет рассуждать не только на английском языке. По мнению экспертов, запуск R2 может еще больше ослабить позиции доминирующих игроков в сфере ИИ-разработок.

Технологии436 дней назад

42 секунды

Reuters: DeepSeek спешит запустить новую версию модели ИИ – DeepSeek хочет закрепить свое преимущество на рынке – Китайский стартап ускоряет выпуск новой ИИ-модели R2 – Ранее выход новой R2 планировался на начало мая 2025 – Теперь DeepSeek хочет выпустить R2 как можно раньше – Новая модель DeepSeek будет лучше работать с кодом – Также R2 должна лучше работать с различными языками – Запуск модели R2 будет поворотным моментом для рынка – Новая R2 может создать беспокойство для властей США

Технологии436 дней назад

DeepSeek стремится к общему ИИ, а не к прибыли Китайский стартап DeepSeek, получивший мировую известность благодаря своей «рассуждающей» модели R1, ставит научные исследования выше финансовой выгоды. Компания, основанная Лян Вэньфэном, придерживается стратегии минимальной публичности и избегает интервью со СМИ. DeepSeek сосредоточена на развитии общего искусственного интеллекта AGI , открыто делится своими разработками и не спешит привлекать дополнительные инвестиции, несмотря на интерес со стороны инвесторов и статус одной из самых уважаемых компаний Китая.

Хайтек+

DeepSeek стремится к общему ИИ, а не к прибыли Китайский стартап DeepSeek, получивший мировую известность благодаря своей «рассуждающей» модели R1, ставит научные исследования выше финансовой выгоды. Компания, основанная Лян Вэньфэном, придерживается стратегии минимальной публичности и избегает интервью со СМИ. DeepSeek сосредоточена на развитии общего искусственного интеллекта AGI , открыто делится своими разработками и не спешит привлекать дополнительные инвестиции, несмотря на интерес со стороны инвесторов и статус одной из самых уважаемых компаний Китая.

Технологии432 дня назад