Запуск обновленной модели DeepSeek v3 1 с улучшенной архитектурой и расширенными возможностями

🎯 НЕЙРО-ПУШКА

Новый DeepSeek v3 1 Китайцы обновили базовую модель линейки V3 Архитектура осталась прежней но теперь модель расходует меньше токенов поддерживает до 128 000 токенов в контексте построена на Mixture of Experts 685 млрд параметров но активно используется только 37 млрд на токен а значит ниже нагрузка на железо Впервые такую большую модель обучали с точностью FP8 Добавили также новые механизмы внимания и многотокенное предсказание для ускорения вывода Пока это только базовая модель без файнтюна Потестить можно в чате chat deepseek com Hugging Face НЕЙРО ПУШКА НОВОСТИ И ОБЗОРЫ НЕЙРОСЕТЕЙ

Технологии263 дня назад

Уютный IT

DeepSeek прокачала память Китайская DeepSeek представила модель V3 1 с увеличенным контекстным окном теперь она способна удерживать больше информации в диалоге и дольше помнить запросы пользователя Других подробностей компания не раскрыла

Технологии262 дня назад

NEUROHUB🔥

Вышла DeepSeek V3 1 мощная модель с открытым исходным кодом Модель теперь гибридная она может рассуждать или отвечать в обычном режиме зависит от вашей задачи Имеет контекстное окно до 128к токенов а знания актуальны до июля 2024 года Также прокачали работу с кодом математикой и логикой Уже можно потестить в веб версии neurohub

Технологии262 дня назад

PROAI

DeepSeek 3 1 была выпущена без громких анонсов разработчики загрузили модель на Hugging Face вызвав оживлённое обсуждение в AI сообществе Это открытая модель с 685 млрд параметров и контекстным окном в 128 000 токенов около 300 страниц текста Гибридная архитектура объединяет чат рассуждения и кодирование в одной системе Обнаружены скрытые токены обеспечивающие интеграцию поиска и внутренние рассуждения DeepSeek 3 1 позволяет работать с длинными сессиями переключаясь между режимами Модель доступна для локального использования и признаётся производительной и экономичной по сравнению с западными аналогами Бесплатный GPT Экспертный канал

Технологии262 дня назад

DNS_Club

DeepSeek официально представила модель V3 1 с поддержкой китайских процессоров и новым форматом FP8 Компания DeepSeek выпустила обновленную версию своей флагманской ИИ модели DeepSeek V3 1 Одной из особенностей модели стала оптимизация под чипы китайского производства что связано со стремлением Пекина сформировать собственную полупроводниковую экосистему на фоне экспортных ограничений США

Технологии262 дня назад

ForkLog FEED

Апдейт DeepSeek опубликовал официальный анонс V3 1 в X Среди ключевых особенностей декларируются гибридный режим рассуждений модель сама принимает решение о необходимости задействования большего количества ресурсов для обдумывания вопроса более быстрое мышление V3 1 предоставляет ответ оперативнее DeepSeek R1 0528 улучшение агентских навыков Подробнее Новости AI YouTube

Технологии262 дня назад

Хайтек+

Вышла улучшенная версия DeepSeek на уровне с GPT 5 но на порядок дешевле Китайский стартап DeepSeek тихо выпустил новую модель DeepSeek V3 1 с 685 млрд параметров сразу сделав её доступной на Hugging Face Модель обрабатывает до 128 тысяч токенов контекста поддерживает разные режимы точности и быстро обрабатывает даже большие объемы данных Главный прорыв V3 1 заключается в её гибридной архитектуре объединяющей функции чата логического рассуждения и программирования в одной системе По производительности DeepSeek сравнима с последними моделями OpenAI и Anthropic при этом использование системы обходится почти на 2 порядка дешевле hightech plus 2025 08 20 vishla uluchshennaya versiya deepseek na urovne s gpt 5 no na poryadok deshevle

Технологии263 дня назад

AI и точка.

Новую нейросеть DeepSeek V3 1 представили официально и по тестам релиз тянет на гораздо большее чем минорное 3 1 Модель теперь гибридная может рассуждать или отвечать в обычном режиме в зависимости от задачи V3 1 сильно прокачали в агентности и использовании инструментов По другим бенчмаркам модель слегка обгоняет R1 0528 DeepSeek V3 1 уже работает по умолчанию в веб версии Для активации рассуждающего режима нужно нажать DeepThink

Технологии262 дня назад

Технопроходцы

DeepSeek представил новую модель DeepSeek V3 1 модель в 685 миллиардов параметров показала результаты на уровне лучших разработок OpenAI и Anthropic особенно в написании кода Она может обрабатывать огромные объемы информации до 128 тысяч токенов контекста что сравнимо с целой книгой Ключевая особенность гибридная архитектура которая объединяет в одной модели чат функции сложные рассуждения и генерацию кода без потери производительности И самое приятное модель выложена в открытый доступ без геополитических ограничений Источник

Технологии262 дня назад

Video is not supported

Чёрный Треугольник

DeepSeek V3 1 официально запущен В X аккаунте DeepSeek представили новую модель V3 1 которая уже доступна для пользователей Разработчики позиционируют её как первый шаг в эру агентов Модель предлагает два режима работы для быстрых ответов и рассуждений при этом расход токенов на рассуждения сократился на 28 46 что значительно увеличивает скорость обработки С 5 сентября произойдут изменения в тарифах на API 1M исходящих токенов будет стоить 1 68 а входящие 0 07 кэшированные или 0 56 без кэша Цены на быструю модель возрастут в то время как на рассуждающую снизятся также отменяется ночная скидка Веб версия и мобильные приложения с V3 1 останутся бесплатными Китайская цензура сохранена News Soft Gear Links

Технологии262 дня назад

Запуск обновленной модели DeepSeek v3 1 с улучшенной архитектурой и расширенными возможностями

Источники

Павел Дуров анонсировал успех TON в стейкинге среди криптовалют

OpenAI интегрировала ChatGPT в Excel и Google Sheets для всех пользователей

Кремниевая долина нанимает философов для обучения ИИ с зарплатой до 400 тыс. долларов

Обсуждение промышленного потенциала Чувашии и меры поддержки легкой промышленности в России

Инвестиции в ИИ приводят к снижению свободного денежного потока у американских IT гигантов

Александра Пахмутова делится кадрами инсталляции Свет Великой Победы в Волгограде