21 августа, 10:36
Запуск обновленной модели DeepSeek v3 1 с улучшенной архитектурой и расширенными возможностями


🎯 НЕЙРО-ПУШКА
Новый DeepSeek v3 1 Китайцы обновили базовую модель линейки V3 Архитектура осталась прежней но теперь модель расходует меньше токенов поддерживает до 128 000 токенов в контексте построена на Mixture of Experts 685 млрд параметров но активно используется только 37 млрд на токен а значит ниже нагрузка на железо Впервые такую большую модель обучали с точностью FP8 Добавили также новые механизмы внимания и многотокенное предсказание для ускорения вывода Пока это только базовая модель без файнтюна Потестить можно в чате chat deepseek com Hugging Face НЕЙРО ПУШКА НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ
Технологии1 день назад


Уютный IT
DeepSeek прокачала память Китайская DeepSeek представила модель V3 1 с увеличенным контекстным окном теперь она способна удерживать больше информации в диалоге и дольше помнить запросы пользователя Других подробностей компания не раскрыла
Технологии20 часов назад


NEUROHUB🔥
Вышла DeepSeek V3 1 мощная модель с открытым исходным кодом Модель теперь гибридная она может рассуждать или отвечать в обычном режиме зависит от вашей задачи Имеет контекстное окно до 128к токенов а знания актуальны до июля 2024 года Также прокачали работу с кодом математикой и логикой Уже можно потестить в веб версии neurohub
Технологии4 часа назад


PROAI
DeepSeek 3 1 была выпущена без громких анонсов разработчики загрузили модель на Hugging Face вызвав оживлённое обсуждение в AI сообществе Это открытая модель с 685 млрд параметров и контекстным окном в 128 000 токенов около 300 страниц текста Гибридная архитектура объединяет чат рассуждения и кодирование в одной системе Обнаружены скрытые токены обеспечивающие интеграцию поиска и внутренние рассуждения DeepSeek 3 1 позволяет работать с длинными сессиями переключаясь между режимами Модель доступна для локального использования и признаётся производительной и экономичной по сравнению с западными аналогами Бесплатный GPT Экспертный канал
Технологии3 часа назад


DNS_Club
DeepSeek официально представила модель V3 1 с поддержкой китайских процессоров и новым форматом FP8 Компания DeepSeek выпустила обновленную версию своей флагманской ИИ модели DeepSeek V3 1 Одной из особенностей модели стала оптимизация под чипы китайского производства что связано со стремлением Пекина сформировать собственную полупроводниковую экосистему на фоне экспортных ограничений США
Технологии3 часа назад


Хайтек+
Вышла улучшенная версия DeepSeek на уровне с GPT 5 но на порядок дешевле Китайский стартап DeepSeek тихо выпустил новую модель DeepSeek V3 1 с 685 млрд параметров сразу сделав её доступной на Hugging Face Модель обрабатывает до 128 тысяч токенов контекста поддерживает разные режимы точности и быстро обрабатывает даже большие объемы данных Главный прорыв V3 1 заключается в её гибридной архитектуре объединяющей функции чата логического рассуждения и программирования в одной системе По производительности DeepSeek сравнима с последними моделями OpenAI и Anthropic при этом использование системы обходится почти на 2 порядка дешевле hightech plus 2025 08 20 vishla uluchshennaya versiya deepseek na urovne s gpt 5 no na poryadok deshevle
Технологии1 день назад


AI и точка.
Новую нейросеть DeepSeek V3 1 представили официально и по тестам релиз тянет на гораздо большее чем минорное 3 1 Модель теперь гибридная может рассуждать или отвечать в обычном режиме в зависимости от задачи V3 1 сильно прокачали в агентности и использовании инструментов По другим бенчмаркам модель слегка обгоняет R1 0528 DeepSeek V3 1 уже работает по умолчанию в веб версии Для активации рассуждающего режима нужно нажать DeepThink
Технологии7 часов назад


Технопроходцы
DeepSeek представил новую модель DeepSeek V3 1 модель в 685 миллиардов параметров показала результаты на уровне лучших разработок OpenAI и Anthropic особенно в написании кода Она может обрабатывать огромные объемы информации до 128 тысяч токенов контекста что сравнимо с целой книгой Ключевая особенность гибридная архитектура которая объединяет в одной модели чат функции сложные рассуждения и генерацию кода без потери производительности И самое приятное модель выложена в открытый доступ без геополитических ограничений Источник
Технологии4 часа назад

Чёрный Треугольник
DeepSeek V3 1 официально запущен В X аккаунте DeepSeek представили новую модель V3 1 которая уже доступна для пользователей Разработчики позиционируют её как первый шаг в эру агентов Модель предлагает два режима работы для быстрых ответов и рассуждений при этом расход токенов на рассуждения сократился на 28 46 что значительно увеличивает скорость обработки С 5 сентября произойдут изменения в тарифах на API 1M исходящих токенов будет стоить 1 68 а входящие 0 07 кэшированные или 0 56 без кэша Цены на быструю модель возрастут в то время как на рассуждающую снизятся также отменяется ночная скидка Веб версия и мобильные приложения с V3 1 останутся бесплатными Китайская цензура сохранена News Soft Gear Links
Технологии3 часа назад
Похожие новости



+23



+10



+20



+10



+2



+17

Проблемы с конфиденциальностью: Чаты Grok оказались в поисковой выдаче Google
Технологии
20 часов назад




Минцифры представило концепцию регулирования ИИ до 2030 года
Общество
1 день назад




Чистая прибыль Т Технологий за II квартал 2025 года выросла почти в 2 раза
Экономика
4 часа назад




Газпром нефть анонсировала открытие нового топливного терминала в Челябинской области в 2026 году
Технологии
4 часа назад




В России представлен дрон Ветер Спасатель для мониторинга ЧС
Технологии
1 час назад




Google анонсировала новые смартфоны Pixel 10 и аксессуары на мероприятии с Джимми Феллоном
Технологии
18 часов назад


