26 декабря, 21:45

Китайская модель DeepSeek V3 превосходит конкурентов и доступна бесплатно

Подготовлено редакцией Tek.fmДайджест Telegram-каналов

Китайцы выпустили УБИЙЦУ ChatGPT: их новая модель DeepSeek V3 уделывает всех платных конкурентов и при этом БЕСПЛАТНАЯ. Самое интересное: — По тестам уровень Claude Sonnet 3.6 и GPT-4o правда, устаревшей . Среди бесплатных это король; — Это официально самая БОЛЬШАЯ модель в open source — аж 671b параметров; — Китайцы научили модель генерировать по два токена за раз, чтобы ускорить ответы; — За основу взяли модель R1 конкурент o1 от этой же команды, поэтому иногда можно увидеть, как модель долго размышляет в чате; — Уже можно юзать бесплатно в чате.

Технологии498 дней назад

RevВолны

Китайская модель AI от DeepSeek считает что она ChatGPT. На этой неделе компания AI DeepSeek представила свою новую модель DeepSeek V3, которая, по заявлению разработчиков, значительно превосходит своих конкурентов, однако похоже, считает себя ChatGPT, как отметили пользователи. Научные сотрудники Королевского колледжа Лондона, специализирующиеся на ИИ отмечают, что это может свидетельствовать о том, что DeepSeek была обучена на выводах ChatGPT и теперь воспроизводит их дословно. ‍ Это может нарушать условия использования OpenAI, которые запрещают применять их выводы для создания конкурентных систем. Генеральный директор OpenAI прокомментировал DeepSeek так: «Проще скопировать уже существующее, чем разработать что-то новое.» Обучение модели на выводах ChatGPT ставит под сомнение самоидентификацию DeepSeek V3 и может усугубить предвзятости, свойственные этому типу моделей — привести к галлюцинациям и вводящим в заблуждение ответам. ================ News Software Hardware

Технологии496 дней назад

Китайская компания DeepSeek анонсировала свою новую открытую ИИ-модель DeepSeek V3 Создали заявляют, что новая модель опережает GPT-4o по скорости и была разработана с минимальными затратами. Лицензия на DeepSeek V3 позволяет свободно скачивать, модифицировать и использовать модель в различных проектах, включая коммерческие. Она эффективно решает задачи, связанные с текстовой обработкой, такие как написание статей, составление электронных писем, перевод и создание программного кода. По данным тестов, проведенных разработчиками, эта модель превзошла многие другие системы, включая Meta Llama 3.1 405B и OpenAI GPT-4o, особенно в области программирования и генерации кода для уже существующих проектов. DeepSeek V3 была обучена на массиве данных, содержащем 14,8 триллионов примеров, и имеет 685 миллиардов параметров, что значительно превышает характеристики Llama 3.1. Обучение модели заняло 2 месяца на ускорителях Nvidia H800, несмотря на ограничения на их поставки в Китай из-за санкций. Стоимость обучения составила $5,5 миллионов.

Хлебни ИИ - про искусственный интеллект

Китайская компания DeepSeek анонсировала свою новую открытую ИИ-модель DeepSeek V3 Создали заявляют, что новая модель опережает GPT-4o по скорости и была разработана с минимальными затратами. Лицензия на DeepSeek V3 позволяет свободно скачивать, модифицировать и использовать модель в различных проектах, включая коммерческие. Она эффективно решает задачи, связанные с текстовой обработкой, такие как написание статей, составление электронных писем, перевод и создание программного кода. По данным тестов, проведенных разработчиками, эта модель превзошла многие другие системы, включая Meta Llama 3.1 405B и OpenAI GPT-4o, особенно в области программирования и генерации кода для уже существующих проектов. DeepSeek V3 была обучена на массиве данных, содержащем 14,8 триллионов примеров, и имеет 685 миллиардов параметров, что значительно превышает характеристики Llama 3.1. Обучение модели заняло 2 месяца на ускорителях Nvidia H800, несмотря на ограничения на их поставки в Китай из-за санкций. Стоимость обучения составила $5,5 миллионов.

Технологии495 дней назад

Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле Китайская компания DeepSeek представила мощную открытую модель искусственного интеллекта DeepSeek V3 — лицензия позволяет её беспрепятственно скачивать, изменять и использовать в большинстве проектов, включая коммерческие. DeepSeek V3 справляется со множеством связанных с обработкой текста задач, в том числе написание статей, электронных писем, перевод и генерация программного кода. Модель превосходит большинство открытых и закрытых аналогов, показали результаты проведённого разработчиком тестирования. Так, в связанных с программированием задачах она оказалась сильнее, чем Meta Llama 3.1 405B, OpenAI GPT-4o и Alibaba Qwen 2.5 72B; DeepSeek V3 также проявила себя лучше конкурентов в тесте Aider Polyglot, проверяющем, среди прочего, её способность генерировать код для существующих проектов. Модель была обучена на наборе данных в 14,8 трлн проектов; будучи развёрнутой на платформе Hugging Face, DeepSeek V3 показала размер в 685 млрд параметров — примерно в 1,6 раза больше, чем Llama 3.1 405B, у которой, как можно догадаться, 405 млрд параметров. Как правило, число параметров, то есть внутренних переменных, которые используются моделями для прогнозирования ответов и принятия решений, коррелирует с навыками моделей: чем больше параметров, тем она способнее. Но для запуска таких систем ИИ требуется больше вычислительных ресурсов. DeepSeek V3 была обучена за два месяца в центре обработки данных на ускорителях Nvidia H800 — сейчас их поставки в Китай запрещены американскими санкциями. Стоимость обучения модели, утверждает разработчик, составила $5,5 млн, что значительно ниже расходов OpenAI на те же цели. При этом DeepSeek V3 политически выверена — она отказывается отвечать на вопросы, которые официальный Пекин считает щекотливыми. #наука #технологии #ИИ Подпишись — Минская правда MLYN.by

Минская правда|MLYN.by

Китайцы представили открытую ИИ-модель DeepSeek V3 — она быстрее GPT-4o и её обучение обошлось намного дешевле Китайская компания DeepSeek представила мощную открытую модель искусственного интеллекта DeepSeek V3 — лицензия позволяет её беспрепятственно скачивать, изменять и использовать в большинстве проектов, включая коммерческие. DeepSeek V3 справляется со множеством связанных с обработкой текста задач, в том числе написание статей, электронных писем, перевод и генерация программного кода. Модель превосходит большинство открытых и закрытых аналогов, показали результаты проведённого разработчиком тестирования. Так, в связанных с программированием задачах она оказалась сильнее, чем Meta Llama 3.1 405B, OpenAI GPT-4o и Alibaba Qwen 2.5 72B; DeepSeek V3 также проявила себя лучше конкурентов в тесте Aider Polyglot, проверяющем, среди прочего, её способность генерировать код для существующих проектов. Модель была обучена на наборе данных в 14,8 трлн проектов; будучи развёрнутой на платформе Hugging Face, DeepSeek V3 показала размер в 685 млрд параметров — примерно в 1,6 раза больше, чем Llama 3.1 405B, у которой, как можно догадаться, 405 млрд параметров. Как правило, число параметров, то есть внутренних переменных, которые используются моделями для прогнозирования ответов и принятия решений, коррелирует с навыками моделей: чем больше параметров, тем она способнее. Но для запуска таких систем ИИ требуется больше вычислительных ресурсов. DeepSeek V3 была обучена за два месяца в центре обработки данных на ускорителях Nvidia H800 — сейчас их поставки в Китай запрещены американскими санкциями. Стоимость обучения модели, утверждает разработчик, составила $5,5 млн, что значительно ниже расходов OpenAI на те же цели. При этом DeepSeek V3 политически выверена — она отказывается отвечать на вопросы, которые официальный Пекин считает щекотливыми. #наука #технологии #ИИ Подпишись — Минская правда MLYN.by

Технологии495 дней назад

Китайцы хоронят ChatGPT: новая модель DeepSeek V3 уделывает всех платных конкурентов — По тестам уровень Claude Sonnet 3.6 и GPT-4o. — Китайцы научили модель генерировать по два токена за раз, чтобы ускорить ответы. — Потыкать можно бесплатно в чате. NeuroTrends

NeuroTrends | Ai News

Китайцы хоронят ChatGPT: новая модель DeepSeek V3 уделывает всех платных конкурентов — По тестам уровень Claude Sonnet 3.6 и GPT-4o. — Китайцы научили модель генерировать по два токена за раз, чтобы ускорить ответы. — Потыкать можно бесплатно в чате. NeuroTrends

Технологии492 дня назад

УБИЙЦУ ChatGPT выпустили китайцы — их модель DeepSeek V3 уделывает всех конкурентов, и при этом она полностью БЕСПЛАТНАЯ В чем особенность нейронки: • Она обходит по тестам уровень Claude Sonnet 3.5 v2 и GPT-4o, а среди бесплатных это имба • Это официально самая БОЛЬШАЯ модель в open source — имеет целых 671b параметров • Китайцы научили модель генерировать по два токена за раз, чтобы ускорить ответы • За основу взяли модель R1 конкурент o1 от этой же команды, поэтому иногда можно увидеть, как модель долго размышляет в чате Юзаем бесплатно здесь.

Нажми Enter | Тренды, IT и бизнес

УБИЙЦУ ChatGPT выпустили китайцы — их модель DeepSeek V3 уделывает всех конкурентов, и при этом она полностью БЕСПЛАТНАЯ В чем особенность нейронки: • Она обходит по тестам уровень Claude Sonnet 3.5 v2 и GPT-4o, а среди бесплатных это имба • Это официально самая БОЛЬШАЯ модель в open source — имеет целых 671b параметров • Китайцы научили модель генерировать по два токена за раз, чтобы ускорить ответы • За основу взяли модель R1 конкурент o1 от этой же команды, поэтому иногда можно увидеть, как модель долго размышляет в чате Юзаем бесплатно здесь.

Технологии498 дней назад

Новую нейронку DeepSeek 3 добавили на Арену и прогнали по бенчмаркам — она лучше GPT-4o в большинстве задач, но стоит в 10 раз ! дешевле. Генерации в течение всей недели без перерывов обойдутся в $14. Команда из 140 человек против 1200 у OpenAI потратила на обучение DeepSeek 3 всего лишь $5 миллионов — это копейки по сравнению с корпорациями. Самое важное: код доступен для всех. Пробуем бесплатно тут.

Not Boring Tech

Новую нейронку DeepSeek 3 добавили на Арену и прогнали по бенчмаркам — она лучше GPT-4o в большинстве задач, но стоит в 10 раз ! дешевле. Генерации в течение всей недели без перерывов обойдутся в $14. Команда из 140 человек против 1200 у OpenAI потратила на обучение DeepSeek 3 всего лишь $5 миллионов — это копейки по сравнению с корпорациями. Самое важное: код доступен для всех. Пробуем бесплатно тут.

Технологии496 дней назад

Китайская ИИ-модель с открытым кодом превосходит конкурентов Китайская компания DeepSeek представила модель искусственного интеллекта DeepSeek V3, которая превосходит GPT-4o и другие аналоги по скорости и эффективности при меньших затратах на обучение $5,5 млн . Модель решает задачи обработки текста: написание статей, перевод и генерацию кода. Она обучена за два месяца на 14,8 трлн данных и имеет 685 млрд параметров. Обучение велось на ускорителях Nvidia H800, поставки которых в Китай ограничены санкциями. DeepSeek V3 лицензирована для свободного использования, включая коммерческое, и политически корректна в рамках официальной позиции Китая. Мы из будущего

Мы из будущего

Китайская ИИ-модель с открытым кодом превосходит конкурентов Китайская компания DeepSeek представила модель искусственного интеллекта DeepSeek V3, которая превосходит GPT-4o и другие аналоги по скорости и эффективности при меньших затратах на обучение $5,5 млн . Модель решает задачи обработки текста: написание статей, перевод и генерацию кода. Она обучена за два месяца на 14,8 трлн данных и имеет 685 млрд параметров. Обучение велось на ускорителях Nvidia H800, поставки которых в Китай ограничены санкциями. DeepSeek V3 лицензирована для свободного использования, включая коммерческое, и политически корректна в рамках официальной позиции Китая. Мы из будущего

Технологии495 дней назад

Китайская компания DeepSeek представила мощную открытую модель искусственного интеллекта DeepSeek V3 — лицензия позволяет её беспрепятственно скачивать, изменять и использовать в большинстве проектов, включая коммерческие. DeepSeek V3 справляется со множеством связанных с обработкой текста задач, в том числе написание статей, электронных писем, перевод и генерация программного кода. Модель превосходит большинство открытых и закрытых аналогов, показали результаты проведённого разработчиком тестирования. Так, в связанных с программированием задачах она оказалась сильнее, чем Meta Llama 3.1 405B, OpenAI GPT-4o и Alibaba Qwen 2.5 72B; DeepSeek V3 также проявила себя лучше конкурентов в тесте Aider Polyglot, проверяющем, среди прочего, её способность генерировать код для существующих проектов.

был бы ты человек - IT, digital

Китайская компания DeepSeek представила мощную открытую модель искусственного интеллекта DeepSeek V3 — лицензия позволяет её беспрепятственно скачивать, изменять и использовать в большинстве проектов, включая коммерческие. DeepSeek V3 справляется со множеством связанных с обработкой текста задач, в том числе написание статей, электронных писем, перевод и генерация программного кода. Модель превосходит большинство открытых и закрытых аналогов, показали результаты проведённого разработчиком тестирования. Так, в связанных с программированием задачах она оказалась сильнее, чем Meta Llama 3.1 405B, OpenAI GPT-4o и Alibaba Qwen 2.5 72B; DeepSeek V3 также проявила себя лучше конкурентов в тесте Aider Polyglot, проверяющем, среди прочего, её способность генерировать код для существующих проектов.

Технологии495 дней назад

Почему новая модель ИИ от DeepSeek считает себя ChatGPT? Недавно китайская лаборатория ИИ DeepSeek представила свою новую модель — DeepSeek V3! >>> Но пользователи заметили, что при взаимодействии она утверждает, что является ChatGPT от OpenAI В чём причина?! Предполагается, что при обучении DeepSeek V3 использовались данные, содержащие ответы ChatGPT! Модель могла запомнить ответы и теперь воспроизводит их, идентифицируя себя как ChatGPT Майк Кук, научный сотрудник Королевского колледжа Лондона, отмечает, что: «обучение моделей на выводах других ИИ может привести к искажению информации и снижению качества ответов» А Хейди Хлааф из AI Now Institute добавляет, что: «такая практика может быть привлекательной для разработчиков, несмотря на риски». А что думаете вы? Дайте знать реакцией!

Neural Brain - Нейросети

Почему новая модель ИИ от DeepSeek считает себя ChatGPT? Недавно китайская лаборатория ИИ DeepSeek представила свою новую модель — DeepSeek V3! >>> Но пользователи заметили, что при взаимодействии она утверждает, что является ChatGPT от OpenAI В чём причина?! Предполагается, что при обучении DeepSeek V3 использовались данные, содержащие ответы ChatGPT! Модель могла запомнить ответы и теперь воспроизводит их, идентифицируя себя как ChatGPT Майк Кук, научный сотрудник Королевского колледжа Лондона, отмечает, что: «обучение моделей на выводах других ИИ может привести к искажению информации и снижению качества ответов» А Хейди Хлааф из AI Now Institute добавляет, что: «такая практика может быть привлекательной для разработчиков, несмотря на риски». А что думаете вы? Дайте знать реакцией!

Технологии493 дня назад