21 ноября, 07:11

Сбер анонсирует открытие флагманских ИИ моделей GigaChat в рамках крупнейшего open source проекта Европы

Греф на AIJ анонсировал крупнейший open source проект Европы Сбер выложит в open source свои флагманские ИИ модели от GigaChat 3 Ultra Preview и GigaChat Lightning до новых поколений речевых систем GigaAM и генераторов картинок и видео Kandinsky 5 0 Все веса будут открыты часть проектов по лицензии разрешающей коммерческой использование Для экосистемы ГигаЧата шаг логичный Open source дает возможность ускорить развитие продукта и заинтересовать им сторонних разработчиков по всему миру
AI и точка.
AI и точка.
Греф на AIJ анонсировал крупнейший open source проект Европы Сбер выложит в open source свои флагманские ИИ модели от GigaChat 3 Ultra Preview и GigaChat Lightning до новых поколений речевых систем GigaAM и генераторов картинок и видео Kandinsky 5 0 Все веса будут открыты часть проектов по лицензии разрешающей коммерческой использование Для экосистемы ГигаЧата шаг логичный Open source дает возможность ускорить развитие продукта и заинтересовать им сторонних разработчиков по всему миру
Hi, AI! | Нейросети и технологии
Hi, AI! | Нейросети и технологии
Сбер на AI Journey представил open source модели и собственного ИИ робота В открытый доступ выложили веса GigaChat 3 Ultra Preview и Lightning GigaAM v3 и Kandinsky 5 0 Теперь это крупнейший open source проект в Европе Открытость должна помочь Сберу стать ИИ фундаментом для всей страны объясняет старший вице президент и руководитель блока Технологическое развитие Андрей Белявцев Когда мы отдаем модели любая компания в России может установить их внутри своего закрытого контура Это и есть настоящий технологический суверенитет объясняет он GigaChat Ultra скоро обещают выпустить в корпоративном формате Модель оптимизируют чтобы снизить стоимость владения и упростить жизнь техкомандам ГигаЧат полноценный помощник На основе своего ассистента Сбер начинает строить полноценную экосистему Появился маркетплейс агентов разговорный режим и умение закрывать задачи под ключ От покупок до дел по работе один ассистент который подхватывает рутину и упрощает взаимодействие с цифровым миром Новые модели Kandinsky 5 0 Также показали генераторы видео Kandinsky 5 0 Video Pro и картинок Kandinsky 5 0 Image Lite Модели лучше понимают культурный контекст и выдают фотореалистичное качество Генерации стали быстрее и чище художникам и бизнесу проще реализовать задумки без боли и сложных пайплайнов Финал презентации с танцем хореографа Мигеля и робота Грина уже разлетается по соцсетям Впечатляет да конечно нужно увидеть вживую Подпишитесь на Hi AI
concertzaal
concertzaal
Сбер на втором дне AI Journey открыл веса сразу нескольких моделей Ultra Preview Lightning GigaAM v3 и всей линейки Kandinsky 5 0 теперь можно запускать их у себя менять дообучать и использовать в коммерции лицензия MIT Плюс готовят корпоративную версию Ultra её можно будет запускать прямо внутри компании рассказал Андрей Белевцев старший вице президент Сбера финал тоже был неожиданный Мигель Ксения и робот который танцевал лучше половины людей concertzaal
GigaChat 3 Ultra Preview тяжёлый Open Source SberDevices выкатили настоящего титана модель с весом в 712 миллиардов параметров И самое приятное всё это добро отдают в Open Source под лицензией MIT Чтобы серверные стойки не плавились использовали архитектуру Mixture of Experts в моменте активны всего 36 млрд параметров около 5 так что инференс остаётся в рамках разумного а качество генерации на высоте Это не очередная надстройка над зарубежной ламой а честное обучение с нуля на 14 триллионах токенов Модель понимает наш культурный код мемы и морфологию лучше западных аналогов Разработчики раскрывают карты по архитектуре использованию MTP и MLA для ускорения и рассказывают как учили модель быть полезной но не скучной
Хабр
Хабр
GigaChat 3 Ultra Preview тяжёлый Open Source SberDevices выкатили настоящего титана модель с весом в 712 миллиардов параметров И самое приятное всё это добро отдают в Open Source под лицензией MIT Чтобы серверные стойки не плавились использовали архитектуру Mixture of Experts в моменте активны всего 36 млрд параметров около 5 так что инференс остаётся в рамках разумного а качество генерации на высоте Это не очередная надстройка над зарубежной ламой а честное обучение с нуля на 14 триллионах токенов Модель понимает наш культурный код мемы и морфологию лучше западных аналогов Разработчики раскрывают карты по архитектуре использованию MTP и MLA для ускорения и рассказывают как учили модель быть полезной но не скучной
ИИ модели GigaChat ВЫКАТИЛИ в опенсорс все опубликовано с MIT лицензией и разрешением на коммерческое использование Доступная линейка моделей GigaChat 3 Ultra Preview флагман на 702 млрд параметров полностью обученный с нуля Модель обгоняет DeepSeek V3 1 в русскоязычных задачах и запоминает 128 тысяч токенов 8 раз больше чем у конкурентов вроде babymmly 2 Sage MMLU Ru Lightning компактная модель для быстрых ответов при этом по скорости сравнима Qwen3 1 7B но намного умнее и больше по параметрам GigaAM v3 пять моделей для аудио на русском которые превращают голос в текст с пунктуацией понимают акценты спонтанную речь и даже музыкальные запросы Отлично распознает речь и показывает 50 WER к Whisper large v3 Свою альтернативу DeepSeek сделали GitHub здесь exploitex
Эксплойт
Эксплойт
ИИ модели GigaChat ВЫКАТИЛИ в опенсорс все опубликовано с MIT лицензией и разрешением на коммерческое использование Доступная линейка моделей GigaChat 3 Ultra Preview флагман на 702 млрд параметров полностью обученный с нуля Модель обгоняет DeepSeek V3 1 в русскоязычных задачах и запоминает 128 тысяч токенов 8 раз больше чем у конкурентов вроде babymmly 2 Sage MMLU Ru Lightning компактная модель для быстрых ответов при этом по скорости сравнима Qwen3 1 7B но намного умнее и больше по параметрам GigaAM v3 пять моделей для аудио на русском которые превращают голос в текст с пунктуацией понимают акценты спонтанную речь и даже музыкальные запросы Отлично распознает речь и показывает 50 WER к Whisper large v3 Свою альтернативу DeepSeek сделали GitHub здесь exploitex
Loading indicator gif
Сбер опубликовал в открытом доступе новое поколение своих моделей ИИ GigaChat 3 Ultra Preview Топ 1 на MERA и GigaChat 3 Lightning Это масштабные MoE модели которые обучались в России с нуля Модели сразу стали доступны сообществу с лицензией для коммерческого использования что открывает новые возможности для бизнеса и разработчиков GigaChat 3 Ultra Preview Поддерживает огромный контекст в 131 тысячу токенов А GigaChat 3 Lightning Идеальна для локального использования Обе модели полностью совместимы с Hugging Face и другими стандартными платформами Разработчики готовятся к новым проектам
TrendWatching
TrendWatching
Сбер опубликовал в открытом доступе новое поколение своих моделей ИИ GigaChat 3 Ultra Preview Топ 1 на MERA и GigaChat 3 Lightning Это масштабные MoE модели которые обучались в России с нуля Модели сразу стали доступны сообществу с лицензией для коммерческого использования что открывает новые возможности для бизнеса и разработчиков GigaChat 3 Ultra Preview Поддерживает огромный контекст в 131 тысячу токенов А GigaChat 3 Lightning Идеальна для локального использования Обе модели полностью совместимы с Hugging Face и другими стандартными платформами Разработчики готовятся к новым проектам
Сбер открыл модели GigaChat и Kandinsky На конференции AI Journey Сбер объявил об открытии весов своих флагманских моделей GigaChat Ultra Kandinsky 5 0 GigaAM v3 и K VAE 1 0 Все модели доступны под лицензией MIT включая коммерческое использование Это значит что теперь любой может скачать доработать и внедрить их в свои проекты от стартапов до корпоративных решений GigaChat Ultra и Lightning русскоязычные MoE модели Семейство GigaChat построено на архитектуре Mixture of Experts MoE и изначально разрабатывалось для русскоязычных задач Самая мощная версия GigaChat Ultra Preview пока обучается но уже обходит DeepSeek V3 1 по качеству ответов на русском в бенчмарке MERA GigaChat Lightning компактная модель оптимизированная для локального запуска которая при этом превосходит Qwen3 4B по качеству и работает быстрее Qwen3 1 7B Обе модели доступны в нескольких вариантах весов fp8 bf16 pretrain на Hugging Face Kandinsky 5 0 генерация изображений и видео Линейка Kandinsky 5 0 включает модели для генерации изображений Image Lite и видео Video Lite и Video Pro Image Lite генерирует HD изображения с учётом российского культурного контекста и поддерживает кириллицу Video Pro создаёт до 10 секунд HD видео в 24 fps а Video Lite оптимизирована для домашних видеокарт от 12 Гб памяти Все модели открыты на GitHub GigaAM v3 и K VAE 1 0 распознавание речи и автокодировщики Набор GigaAM v3 пять моделей для автоматического распознавания русской речи ASR готовых к промышленному применению K VAE 1 0 автокодировщики для изображений и видео которые преобразуют медиа в скрытые представления и обратно упрощая обучение генеративных моделей Открытие весов шаг к демократизации ИИ инструментов Теперь даже небольшие команды могут использовать мощные модели для своих задач не завися от проприетарных решений Это сильный шаг со стороны Сбера для конкуренции с открытыми моделями На мой взгляд это позитивно повлияет на развитие рынка ИИ в России в целом Надеюсь в ближайшее время появится комьюнити которое будет развивать и дорабатывать эти модели что в свою очередь ускорит темпы развития отечественных ИИ технологий релиз ген ИИ
генеративный ии
генеративный ии
Сбер открыл модели GigaChat и Kandinsky На конференции AI Journey Сбер объявил об открытии весов своих флагманских моделей GigaChat Ultra Kandinsky 5 0 GigaAM v3 и K VAE 1 0 Все модели доступны под лицензией MIT включая коммерческое использование Это значит что теперь любой может скачать доработать и внедрить их в свои проекты от стартапов до корпоративных решений GigaChat Ultra и Lightning русскоязычные MoE модели Семейство GigaChat построено на архитектуре Mixture of Experts MoE и изначально разрабатывалось для русскоязычных задач Самая мощная версия GigaChat Ultra Preview пока обучается но уже обходит DeepSeek V3 1 по качеству ответов на русском в бенчмарке MERA GigaChat Lightning компактная модель оптимизированная для локального запуска которая при этом превосходит Qwen3 4B по качеству и работает быстрее Qwen3 1 7B Обе модели доступны в нескольких вариантах весов fp8 bf16 pretrain на Hugging Face Kandinsky 5 0 генерация изображений и видео Линейка Kandinsky 5 0 включает модели для генерации изображений Image Lite и видео Video Lite и Video Pro Image Lite генерирует HD изображения с учётом российского культурного контекста и поддерживает кириллицу Video Pro создаёт до 10 секунд HD видео в 24 fps а Video Lite оптимизирована для домашних видеокарт от 12 Гб памяти Все модели открыты на GitHub GigaAM v3 и K VAE 1 0 распознавание речи и автокодировщики Набор GigaAM v3 пять моделей для автоматического распознавания русской речи ASR готовых к промышленному применению K VAE 1 0 автокодировщики для изображений и видео которые преобразуют медиа в скрытые представления и обратно упрощая обучение генеративных моделей Открытие весов шаг к демократизации ИИ инструментов Теперь даже небольшие команды могут использовать мощные модели для своих задач не завися от проприетарных решений Это сильный шаг со стороны Сбера для конкуренции с открытыми моделями На мой взгляд это позитивно повлияет на развитие рынка ИИ в России в целом Надеюсь в ближайшее время появится комьюнити которое будет развивать и дорабатывать эти модели что в свою очередь ускорит темпы развития отечественных ИИ технологий релиз ген ИИ
эйай ньюз
эйай ньюз
Сбер выкатил сразу четыре ключевые линейки в полный MIT опенсорс Флагман GigaChat Ultra Preview новая MoE модель собранная под русский язык и натренированная полностью с нуля Ultra Preview уже обходит DeepSeek V3 1 на русском бенчмарке MERA поддерживает длинный контекст до 128к токенов и она все еще не закончила свое обучение GitHub HuggingFace GitVerse Читайте подробную статью на Хабре от команды Рядом выходит Lightning более лёгкая MoE модель компактная и быстрая Конкурирует с Qwen3 4B по скорости сравнима с Qwen3 1 7B но намного умнее и больше по параметрам Она не уступает лучшим опенсорс моделям своего класса держит планку на русском выше аналогов и выдаёт сверхбыстрый инференс благодаря чему модель можно использовать там где Ultra избыточна а скорость критична Плюс стабильная маршрутизация экспертов а еще приятный бонус в виде поддержки 256к контекста GitHub Hugging Face GitVerse Новая линейка моделей генерации картинок и видео Kandinsky 5 0 Video Pro и версия Lite Video Lite и Image Lite выпущенная в октябре нативно понимают русские промпты культурный код и нормально пишут кириллицу Флагманская Video Pro сравнялась с Veo 3 по качеству и обогнала Wan 2 2 A14B А ещё подъехал K VAE 1 0 сейчас это один из лучших опенсорсных энкодеров для сжатия визуального контента и база для обучения генеративных моделей GitHub GitVerse Hugging Face Технический репорт В аудионаправлении выходит GigaAM v3 новое поколение распознавания речи показывающее 50 WER к Whisper large v3 и закрывающее все открытые решения на русском языке GitHub HuggingFace GitVerse Все модели от текста до видео можно ставить в свой контур доучивать под задачи и использовать коммерчески По сути это первый полностью открытый большой набор под русский язык который позволяет строить полноценные ИИ системы без зависимости от зарубежных моделей и ограничений ai newz
Мой Компьютер
Мой Компьютер
GigaChat 3 Ultra новый уровень ИИ от Сбера Сбер представил новое поколение GigaChat с открытыми весами под MIT лицензией В линейку входят компактная GigaChat 3 Lightning и флагманская GigaChat 3 Ultra Preview на 702 млрд параметров GigaChat 3 Ultra это MoE модель с 36 млрд активных параметров на токен Её обучили с нуля на корпусе около 14 триллионов токенов включая 5 5 трлн синтетических данных Ultra нативно понимает русский язык и совместима со стандартными open source инструментами Hugging Face vLLM sglang В бенчмарках MERA MMLU Pro GSM8K MATH 500 и HumanEval она уверенно обгоняет прошлый флагман GigaChat 2 Max и входит в топ 5 крупнейших открытых моделей в мире Поддерживаемый контекст до 128 тысяч токенов GigaChat 3 Lightning компактная MoE модель на 10 млрд параметров 1 8 млрд активных рассчитанная на локальные запуски и быстрый инференс По качеству она превосходит Qwen3 4B и приближается к dense моделям размера 8B а по скорости с включённым Multi Token Prediction сравнима с Qwen3 1 7B Модель поддерживает контекст до 256 тысяч токенов и подходит для прототипирования и работы с длинными документами Статья на Хабре Мой Компьютер
Цифровой Журнал | IT, ChatGPT
Цифровой Журнал | IT, ChatGPT
Сбер выкатил ГигаЧат 3 мощную линейку моделей Флагманская Ultra превосходит DeepSeek Главный акцент сделан на топовой модели GigaChat Ultra Preview с открытыми весами Это собственная разработка Сбера которая стала критически важной для ML разработчиков По метрикам Ultra Preview уже обходит DeepSeek V3 1 Ultra Preview поддерживает контекст до 128 тысяч токенов включая логический вывод и понимание русского языка Вся линейка доступна для самостоятельного развертывания включая GigaChat Lightning оптимизированную MoE модель для локальных задач Модель лёгкая компактная и быстрая Конкурирует с Qwen3 4B по скорости сравнима с Qwen3 1 7B но намного умнее и больше по параметрам И GigaChatAM пять моделей которые превращают голос в текст с пунктуацией понимают акценты спонтанную речь и даже музыкальные запросы Подойдут для голосовых ассистентов контакт центров аналитики звонков Подробнее в статье на Хабр
Loading indicator gif