2 мая, 12:03

JetBrains запускает открытую AI-модель Mellum для разработчиков

GPT/ChatGPT/AI Central Александра Горного
GPT/ChatGPT/AI Central Александра Горного
JetBrains выпустила открытую AI-модель для дописывания кода Модель Mellum-4b разработана специально для автоматического завершения фрагментов кода на основе окружающего контекста. Mellum создана для интеграции в профессиональные инструменты разработчиков. Базовая модель не работает «из коробки» и требует предварительной настройки. Код здесь:
JetBrains выкатила Mellum — открытую AI-модель для кода  JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов.    Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Новости в Мире IT
Новости в Мире IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
JetBrains выкатила Mellum — открытую AI-модель для кода  JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов.    Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Программист | IT | Техника
Программист | IT | Техника
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
JetBrains опубликовала исходный код Mellum — компактной языковой модели для автодополнения кода  JetBrains объявила об открытии кода Mellum — компактной LLM, предназначенной для дополнения, а не генерации кода с нуля. Модель содержит всего 4 миллиарда параметров, что позволяет запускать её локально или на собственных серверах.  Mellum работает с Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. Размер контекстного окна — 8000 токенов.   Для кого выпустили Mellum:  – Облачный запуск через vLLM с интеграцией в любые приложения. – Локальный запуск через llama.cpp или Ollama — подходит для работы с закрытым кодом. – Интеграция в редакторы кода и среды разработки.    Код и веса Mellum доступны на Hugging Face.    Библиотека программиста #свежак
Библиотека программиста | программирование, кодинг, разработка
Библиотека программиста | программирование, кодинг, разработка
JetBrains опубликовала исходный код Mellum — компактной языковой модели для автодополнения кода JetBrains объявила об открытии кода Mellum — компактной LLM, предназначенной для дополнения, а не генерации кода с нуля. Модель содержит всего 4 миллиарда параметров, что позволяет запускать её локально или на собственных серверах. Mellum работает с Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. Размер контекстного окна — 8000 токенов. Для кого выпустили Mellum: – Облачный запуск через vLLM с интеграцией в любые приложения. – Локальный запуск через llama.cpp или Ollama — подходит для работы с закрытым кодом. – Интеграция в редакторы кода и среды разработки. Код и веса Mellum доступны на Hugging Face. Библиотека программиста #свежак
Спроси что угодно — умный ИИ уже готов ответить
1chatgpt.ru
1chatgpt.ru
Спроси что угодно — умный ИИ уже готов ответить
‍  JetBrains выкатила Mellum — открытую AI-модель для кода  JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов.      Что известно о Mellum?   — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код;   — обучена на 4 трлн токенов;   — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200;   — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.    — Супер   — Ну выпустила и выпустила    godnoTECH - Новости IT
godnoTECH - Новости IT
godnoTECH - Новости IT
‍ JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах. — Супер — Ну выпустила и выпустила godnoTECH - Новости IT
БлоGнот
БлоGнот
JetBrains выпустила свою первую "открытую" AI-модель для программирования. Модель Mellum, которая ранее была доступна только в программных продуктах компании, теперь открыто размещена на платформе Hugging Face. Mellum имеет 4 миллиарда параметров и обучена на более чем 4 триллионах токенов. Модель специально разработана для автодополнения кода завершения фрагментов кода на основе окружающего контекста . JetBrains обучила Mellum на нескольких наборах данных, включая код с открытыми лицензиями из GitHub и статьи из английской Википедии. Обучение заняло около 20 дней на кластере из 256 GPU Nvidia H200. Важно отметить, что базовую модель нельзя использовать прямо "из коробки" — её нужно дополнительно обучать под конкретные задачи. JetBrains предоставила несколько дообученных версий для Python, но предупреждает, что они предназначены для "оценки потенциальных возможностей", а не для использования в рабочей среде. Как-то культовая для разработчиков компания совсем медленно запрягает в теме AI, вам не кажется? У них что там внутри — Java?