21 августа, 10:36
Запуск обновленной модели DeepSeek v3 1 с улучшенной архитектурой и расширенными возможностями


🎯 НЕЙРО-ПУШКА
Новый DeepSeek v3 1 Китайцы обновили базовую модель линейки V3 Архитектура осталась прежней но теперь модель расходует меньше токенов поддерживает до 128 000 токенов в контексте построена на Mixture of Experts 685 млрд параметров но активно используется только 37 млрд на токен а значит ниже нагрузка на железо Впервые такую большую модель обучали с точностью FP8 Добавили также новые механизмы внимания и многотокенное предсказание для ускорения вывода Пока это только базовая модель без файнтюна Потестить можно в чате chat deepseek com Hugging Face НЕЙРО ПУШКА НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
Технологии114 дня назад


Уютный IT
DeepSeek прокачала память Китайская DeepSeek представила модель V3 1 с увеличенным контекстным окном теперь она способна удерживать больше информации в диалоге и дольше помнить запросы пользователя Других подробностей компания не раскрыла
Технологии113 дня назад


NEUROHUB🔥
Вышла DeepSeek V3 1 мощная модель с открытым исходным кодом Модель теперь гибридная она может рассуждать или отвечать в обычном режиме зависит от вашей задачи Имеет контекстное окно до 128к токенов а знания актуальны до июля 2024 года Также прокачали работу с кодом математикой и логикой Уже можно потестить в веб версии neurohub
Технологии113 дня назад


PROAI
DeepSeek 3 1 была выпущена без громких анонсов разработчики загрузили модель на Hugging Face вызвав оживлённое обсуждение в AI сообществе Это открытая модель с 685 млрд параметров и контекстным окном в 128 000 токенов около 300 страниц текста Гибридная архитектура объединяет чат рассуждения и кодирование в одной системе Обнаружены скрытые токены обеспечивающие интеграцию поиска и внутренние рассуждения DeepSeek 3 1 позволяет работать с длинными сессиями переключаясь между режимами Модель доступна для локального использования и признаётся производительной и экономичной по сравнению с западными аналогами Бесплатный GPT Экспертный канал
Технологии113 дня назад


DNS_Club
DeepSeek официально представила модель V3 1 с поддержкой китайских процессоров и новым форматом FP8 Компания DeepSeek выпустила обновленную версию своей флагманской ИИ модели DeepSeek V3 1 Одной из особенностей модели стала оптимизация под чипы китайского производства что связано со стремлением Пекина сформировать собственную полупроводниковую экосистему на фоне экспортных ограничений США
Технологии113 дня назад

ForkLog FEED
Апдейт DeepSeek опубликовал официальный анонс V3 1 в X Среди ключевых особенностей декларируются гибридный режим рассуждений модель сама принимает решение о необходимости задействования большего количества ресурсов для обдумывания вопроса более быстрое мышление V3 1 предоставляет ответ оперативнее DeepSeek R1 0528 улучшение агентских навыков Подробнее Новости AI YouTube
Технологии113 дня назад



Хайтек+
Вышла улучшенная версия DeepSeek на уровне с GPT 5 но на порядок дешевле Китайский стартап DeepSeek тихо выпустил новую модель DeepSeek V3 1 с 685 млрд параметров сразу сделав её доступной на Hugging Face Модель обрабатывает до 128 тысяч токенов контекста поддерживает разные режимы точности и быстро обрабатывает даже большие объемы данных Главный прорыв V3 1 заключается в её гибридной архитектуре объединяющей функции чата логического рассуждения и программирования в одной системе По производительности DeepSeek сравнима с последними моделями OpenAI и Anthropic при этом использование системы обходится почти на 2 порядка дешевле hightech plus 2025 08 20 vishla uluchshennaya versiya deepseek na urovne s gpt 5 no na poryadok deshevle
Технологии114 дня назад


AI и точка.
Новую нейросеть DeepSeek V3 1 представили официально и по тестам релиз тянет на гораздо большее чем минорное 3 1 Модель теперь гибридная может рассуждать или отвечать в обычном режиме в зависимости от задачи V3 1 сильно прокачали в агентности и использовании инструментов По другим бенчмаркам модель слегка обгоняет R1 0528 DeepSeek V3 1 уже работает по умолчанию в веб версии Для активации рассуждающего режима нужно нажать DeepThink
Технологии113 дня назад


Технопроходцы
DeepSeek представил новую модель DeepSeek V3 1 модель в 685 миллиардов параметров показала результаты на уровне лучших разработок OpenAI и Anthropic особенно в написании кода Она может обрабатывать огромные объемы информации до 128 тысяч токенов контекста что сравнимо с целой книгой Ключевая особенность гибридная архитектура которая объединяет в одной модели чат функции сложные рассуждения и генерацию кода без потери производительности И самое приятное модель выложена в открытый доступ без геополитических ограничений Источник
Технологии113 дня назад

Чёрный Треугольник
DeepSeek V3 1 официально запущен В X аккаунте DeepSeek представили новую модель V3 1 которая уже доступна для пользователей Разработчики позиционируют её как первый шаг в эру агентов Модель предлагает два режима работы для быстрых ответов и рассуждений при этом расход токенов на рассуждения сократился на 28 46 что значительно увеличивает скорость обработки С 5 сентября произойдут изменения в тарифах на API 1M исходящих токенов будет стоить 1 68 а входящие 0 07 кэшированные или 0 56 без кэша Цены на быструю модель возрастут в то время как на рассуждающую снизятся также отменяется ночная скидка Веб версия и мобильные приложения с V3 1 останутся бесплатными Китайская цензура сохранена News Soft Gear Links
Технологии113 дня назад

Похожие новости






+22










+1


Китайский стартап DeepSeek представляет модель R1, конкурирующую с OpenAI
Технологии
21 час назад


OpenAI анонсировала обновление GPT-5.2 с улучшенной производительностью и новыми функциями
Технологии
18 часов назад


+22
Яндекс Маркет представляет обновлённого AI агента для улучшения качества ответов
Технологии
22 часа назад



Лян Вэньфэн и Ду Мэнжань вошли в список самых влиятельных ученых 2025 года по версии Nature
Наука
1 день назад


Прогнозы роста инвестиций в центры обработки данных до 3 трлн долларов к 2028 году
Технологии
5 часов назад


+1
Qwen запускает режим Learn Mode для поддержки студентов и школьников
Общество
4 часа назад