21 августа, 10:36

Запуск обновленной модели DeepSeek v3 1 с улучшенной архитектурой и расширенными возможностями

Новый DeepSeek v3 1 Китайцы обновили базовую модель линейки V3 Архитектура осталась прежней но теперь модель   расходует меньше токенов   поддерживает до 128 000 токенов в контексте   построена на Mixture of Experts 685 млрд параметров но активно используется только 37 млрд на токен а значит ниже нагрузка на железо Впервые такую большую модель обучали с точностью FP8 Добавили также новые механизмы внимания и многотокенное предсказание для ускорения вывода Пока это только базовая модель без файнтюна Потестить можно в чате chat deepseek com Hugging Face НЕЙРО ПУШКА НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
🎯 НЕЙРО-ПУШКА
🎯 НЕЙРО-ПУШКА
Новый DeepSeek v3 1 Китайцы обновили базовую модель линейки V3 Архитектура осталась прежней но теперь модель расходует меньше токенов поддерживает до 128 000 токенов в контексте построена на Mixture of Experts 685 млрд параметров но активно используется только 37 млрд на токен а значит ниже нагрузка на железо Впервые такую большую модель обучали с точностью FP8 Добавили также новые механизмы внимания и многотокенное предсказание для ускорения вывода Пока это только базовая модель без файнтюна Потестить можно в чате chat deepseek com Hugging Face НЕЙРО ПУШКА НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
DeepSeek прокачала память Китайская DeepSeek представила модель V3 1 с увеличенным контекстным окном теперь она способна удерживать больше информации в диалоге и дольше помнить запросы пользователя Других подробностей компания не раскрыла
Уютный IT
Уютный IT
DeepSeek прокачала память Китайская DeepSeek представила модель V3 1 с увеличенным контекстным окном теперь она способна удерживать больше информации в диалоге и дольше помнить запросы пользователя Других подробностей компания не раскрыла
Вышла DeepSeek V3 1 мощная модель с открытым исходным кодом Модель теперь гибридная она может рассуждать или отвечать в обычном режиме зависит от вашей задачи Имеет контекстное окно до 128к токенов а знания актуальны до июля 2024 года Также прокачали работу с кодом математикой и логикой Уже можно потестить в веб версии neurohub
NEUROHUB🔥
NEUROHUB🔥
Вышла DeepSeek V3 1 мощная модель с открытым исходным кодом Модель теперь гибридная она может рассуждать или отвечать в обычном режиме зависит от вашей задачи Имеет контекстное окно до 128к токенов а знания актуальны до июля 2024 года Также прокачали работу с кодом математикой и логикой Уже можно потестить в веб версии neurohub
DeepSeek 3 1 была выпущена без громких анонсов разработчики загрузили модель на Hugging Face вызвав оживлённое обсуждение в AI сообществе Это открытая модель с 685 млрд параметров и контекстным окном в 128 000 токенов около 300 страниц текста Гибридная архитектура объединяет чат рассуждения и кодирование в одной системе Обнаружены скрытые токены обеспечивающие интеграцию поиска и внутренние рассуждения DeepSeek 3 1 позволяет работать с длинными сессиями переключаясь между режимами Модель доступна для локального использования и признаётся производительной и экономичной по сравнению с западными аналогами Бесплатный GPT Экспертный канал
PROAI
PROAI
DeepSeek 3 1 была выпущена без громких анонсов разработчики загрузили модель на Hugging Face вызвав оживлённое обсуждение в AI сообществе Это открытая модель с 685 млрд параметров и контекстным окном в 128 000 токенов около 300 страниц текста Гибридная архитектура объединяет чат рассуждения и кодирование в одной системе Обнаружены скрытые токены обеспечивающие интеграцию поиска и внутренние рассуждения DeepSeek 3 1 позволяет работать с длинными сессиями переключаясь между режимами Модель доступна для локального использования и признаётся производительной и экономичной по сравнению с западными аналогами Бесплатный GPT Экспертный канал
DeepSeek официально представила модель V3 1 с поддержкой китайских процессоров и новым форматом FP8 Компания DeepSeek выпустила обновленную версию своей флагманской ИИ модели DeepSeek V3 1 Одной из особенностей модели стала оптимизация под чипы китайского производства что связано со стремлением Пекина сформировать собственную полупроводниковую экосистему на фоне экспортных ограничений США
DNS_Club
DNS_Club
DeepSeek официально представила модель V3 1 с поддержкой китайских процессоров и новым форматом FP8 Компания DeepSeek выпустила обновленную версию своей флагманской ИИ модели DeepSeek V3 1 Одной из особенностей модели стала оптимизация под чипы китайского производства что связано со стремлением Пекина сформировать собственную полупроводниковую экосистему на фоне экспортных ограничений США
Вышла улучшенная версия DeepSeek на уровне с GPT 5 но на порядок дешевле Китайский стартап DeepSeek тихо выпустил новую модель DeepSeek V3 1 с 685 млрд параметров сразу сделав её доступной на Hugging Face Модель обрабатывает до 128 тысяч токенов контекста поддерживает разные режимы точности и быстро обрабатывает даже большие объемы данных Главный прорыв V3 1 заключается в её гибридной архитектуре объединяющей функции чата логического рассуждения и программирования в одной системе По производительности DeepSeek сравнима с последними моделями OpenAI и Anthropic при этом использование системы обходится почти на 2 порядка дешевле   hightech plus 2025 08 20 vishla uluchshennaya versiya deepseek na urovne s gpt 5 no na poryadok deshevle
Хайтек+
Хайтек+
Вышла улучшенная версия DeepSeek на уровне с GPT 5 но на порядок дешевле Китайский стартап DeepSeek тихо выпустил новую модель DeepSeek V3 1 с 685 млрд параметров сразу сделав её доступной на Hugging Face Модель обрабатывает до 128 тысяч токенов контекста поддерживает разные режимы точности и быстро обрабатывает даже большие объемы данных Главный прорыв V3 1 заключается в её гибридной архитектуре объединяющей функции чата логического рассуждения и программирования в одной системе По производительности DeepSeek сравнима с последними моделями OpenAI и Anthropic при этом использование системы обходится почти на 2 порядка дешевле hightech plus 2025 08 20 vishla uluchshennaya versiya deepseek na urovne s gpt 5 no na poryadok deshevle
Новую нейросеть DeepSeek V3 1 представили официально и по тестам релиз тянет на гораздо большее чем минорное 3 1   Модель теперь гибридная может рассуждать или отвечать в обычном режиме в зависимости от задачи   V3 1 сильно прокачали в агентности и использовании инструментов По другим бенчмаркам модель слегка обгоняет R1 0528   DeepSeek V3 1 уже работает по умолчанию в веб версии Для активации рассуждающего режима нужно нажать DeepThink
AI и точка.
AI и точка.
Новую нейросеть DeepSeek V3 1 представили официально и по тестам релиз тянет на гораздо большее чем минорное 3 1 Модель теперь гибридная может рассуждать или отвечать в обычном режиме в зависимости от задачи V3 1 сильно прокачали в агентности и использовании инструментов По другим бенчмаркам модель слегка обгоняет R1 0528 DeepSeek V3 1 уже работает по умолчанию в веб версии Для активации рассуждающего режима нужно нажать DeepThink
DeepSeek представил новую модель DeepSeek V3 1 модель в 685 миллиардов параметров показала результаты на уровне лучших разработок OpenAI и Anthropic особенно в написании кода Она может обрабатывать огромные объемы информации до 128 тысяч токенов контекста что сравнимо с целой книгой Ключевая особенность гибридная архитектура которая объединяет в одной модели чат функции сложные рассуждения и генерацию кода без потери производительности И самое приятное модель выложена в открытый доступ без геополитических ограничений Источник
Технопроходцы
Технопроходцы
DeepSeek представил новую модель DeepSeek V3 1 модель в 685 миллиардов параметров показала результаты на уровне лучших разработок OpenAI и Anthropic особенно в написании кода Она может обрабатывать огромные объемы информации до 128 тысяч токенов контекста что сравнимо с целой книгой Ключевая особенность гибридная архитектура которая объединяет в одной модели чат функции сложные рассуждения и генерацию кода без потери производительности И самое приятное модель выложена в открытый доступ без геополитических ограничений Источник
Video is not supported
Чёрный Треугольник
Чёрный Треугольник
DeepSeek V3 1 официально запущен В X аккаунте DeepSeek представили новую модель V3 1 которая уже доступна для пользователей Разработчики позиционируют её как первый шаг в эру агентов Модель предлагает два режима работы для быстрых ответов и рассуждений при этом расход токенов на рассуждения сократился на 28 46 что значительно увеличивает скорость обработки С 5 сентября произойдут изменения в тарифах на API 1M исходящих токенов будет стоить 1 68 а входящие 0 07 кэшированные или 0 56 без кэша Цены на быструю модель возрастут в то время как на рассуждающую снизятся также отменяется ночная скидка Веб версия и мобильные приложения с V3 1 останутся бесплатными Китайская цензура сохранена News Soft Gear Links