
GPT/ChatGPT/AI Central Александра Горного
JetBrains выпустила открытую AI-модель для дописывания кода Модель Mellum-4b разработана специально для автоматического завершения фрагментов кода на основе окружающего контекста. Mellum создана для интеграции в профессиональные инструменты разработчиков. Базовая модель не работает «из коробки» и требует предварительной настройки. Код здесь:
Технологии2 дня назад


Новости в Мире IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Технологии2 дня назад


Программист | IT | Техника
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Технологии2 дня назад


Библиотека программиста | программирование, кодинг, разработка
JetBrains опубликовала исходный код Mellum — компактной языковой модели для автодополнения кода JetBrains объявила об открытии кода Mellum — компактной LLM, предназначенной для дополнения, а не генерации кода с нуля. Модель содержит всего 4 миллиарда параметров, что позволяет запускать её локально или на собственных серверах. Mellum работает с Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. Размер контекстного окна — 8000 токенов. Для кого выпустили Mellum: – Облачный запуск через vLLM с интеграцией в любые приложения. – Локальный запуск через llama.cpp или Ollama — подходит для работы с закрытым кодом. – Интеграция в редакторы кода и среды разработки. Код и веса Mellum доступны на Hugging Face. Библиотека программиста #свежак
Технологии1 день назад



godnoTECH - Новости IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах. — Супер — Ну выпустила и выпустила godnoTECH - Новости IT
Технологии2 дня назад

БлоGнот
JetBrains выпустила свою первую "открытую" AI-модель для программирования. Модель Mellum, которая ранее была доступна только в программных продуктах компании, теперь открыто размещена на платформе Hugging Face. Mellum имеет 4 миллиарда параметров и обучена на более чем 4 триллионах токенов. Модель специально разработана для автодополнения кода завершения фрагментов кода на основе окружающего контекста . JetBrains обучила Mellum на нескольких наборах данных, включая код с открытыми лицензиями из GitHub и статьи из английской Википедии. Обучение заняло около 20 дней на кластере из 256 GPU Nvidia H200. Важно отметить, что базовую модель нельзя использовать прямо "из коробки" — её нужно дополнительно обучать под конкретные задачи. JetBrains предоставила несколько дообученных версий для Python, но предупреждает, что они предназначены для "оценки потенциальных возможностей", а не для использования в рабочей среде. Как-то культовая для разработчиков компания совсем медленно запрягает в теме AI, вам не кажется? У них что там внутри — Java?
Технологии2 дня назад
Похожие новости



+3



+6



+1



+2



+1



DeepSeek представляет новую ИИ-модель Prover-V2 для математических доказательств
Технологии
1 день назад




Google внедряет рекламу в ИИ-ботах и запускает новый режим поиска
Технологии
1 день назад




Apple и Anthropic объединяют усилия для разработки ИИ-платформы
Технологии
14 часов назад




Meta сообщает о росте выручки и прибыли, увеличивая инвестиции в искусственный интеллект
Экономика
1 день назад




Википедия анонсировала трехлетнюю стратегию использования ИИ для автоматизации задач редакторов
Технологии
16 часов назад




Google и Apple обсуждают интеграцию ИИ Gemini в iOS 19
Технологии
1 день назад

