GPT/ChatGPT/AI Central Александра Горного
JetBrains выпустила открытую AI-модель для дописывания кода Модель Mellum-4b разработана специально для автоматического завершения фрагментов кода на основе окружающего контекста. Mellum создана для интеграции в профессиональные инструменты разработчиков. Базовая модель не работает «из коробки» и требует предварительной настройки. Код здесь:
godnoTECH - Новости IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах. — Супер — Ну выпустила и выпустила godnoTECH - Новости IT
БлоGнот
JetBrains выпустила свою первую "открытую" AI-модель для программирования. Модель Mellum, которая ранее была доступна только в программных продуктах компании, теперь открыто размещена на платформе Hugging Face. Mellum имеет 4 миллиарда параметров и обучена на более чем 4 триллионах токенов. Модель специально разработана для автодополнения кода завершения фрагментов кода на основе окружающего контекста . JetBrains обучила Mellum на нескольких наборах данных, включая код с открытыми лицензиями из GitHub и статьи из английской Википедии. Обучение заняло около 20 дней на кластере из 256 GPU Nvidia H200. Важно отметить, что базовую модель нельзя использовать прямо "из коробки" — её нужно дополнительно обучать под конкретные задачи. JetBrains предоставила несколько дообученных версий для Python, но предупреждает, что они предназначены для "оценки потенциальных возможностей", а не для использования в рабочей среде. Как-то культовая для разработчиков компания совсем медленно запрягает в теме AI, вам не кажется? У них что там внутри — Java?
42 секунды
TechCrunch: JetBrains выпустила «открытую» модель Mellum для кода – JetBrains выпустила свою первую «открытую» модель для кода – Модель для генерации кода Mellum появилась на Hugging Face – Новая модель от JetBrains была обучена на 4+ трлн токенов – Модель Mellum для генерации кода содержит 4 млрд параметров – Каждый 1 млн токенов соответствует около 30 тыс. строчек кода – Mellum также хорошо подходит для образовательных целей – Для обучения брали код из GitHub, статьи из Википедии и др. – Обучение заняло 20 дней на кластере из 256 чипов Nvidia H200 – Чтобы запустить Mellum нужно приложить некоторые усилия – Базовую модель Mellum нельзя использовать из «коробки» – Для использования модели Mellum, ее нужно будет доработать
Новости в Мире IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Программист | IT | Техника
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Библиотека программиста | программирование, кодинг, разработка
JetBrains опубликовала исходный код Mellum — компактной языковой модели для автодополнения кода JetBrains объявила об открытии кода Mellum — компактной LLM, предназначенной для дополнения, а не генерации кода с нуля. Модель содержит всего 4 миллиарда параметров, что позволяет запускать её локально или на собственных серверах. Mellum работает с Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. Размер контекстного окна — 8000 токенов. Для кого выпустили Mellum: – Облачный запуск через vLLM с интеграцией в любые приложения. – Локальный запуск через llama.cpp или Ollama — подходит для работы с закрытым кодом. – Интеграция в редакторы кода и среды разработки. Код и веса Mellum доступны на Hugging Face. Библиотека программиста #свежак
Похожие новости +8 +10 +4
Сотрудники крупных компаний используют ИИ для накрутки внутренних метрик
Технологии
21 час назадКонференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку
Технологии
1 день назадThreads запускает ИИ-бота Meta AI в пяти странах, пользователи выражают недовольство
Технологии
1 день назадМинстрой предлагает использовать ИИ для контроля строительства 50 многоквартирных домов к 2030 году
Общество
1 день назадTelegram внедрил поиск по 100 миллионам стикеров и эмодзи на 36 языках
Технологии
1 день назадOpenAI интегрировала Codex в мобильное приложение ChatGPT
Технологии
15 часов назад