
GPT/ChatGPT/AI Central Александра Горного
JetBrains выпустила открытую AI-модель для дописывания кода Модель Mellum-4b разработана специально для автоматического завершения фрагментов кода на основе окружающего контекста. Mellum создана для интеграции в профессиональные инструменты разработчиков. Базовая модель не работает «из коробки» и требует предварительной настройки. Код здесь:
Технологии3 дня назад


Новости в Мире IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Технологии3 дня назад


Программист | IT | Техника
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Технологии2 дня назад


Библиотека программиста | программирование, кодинг, разработка
JetBrains опубликовала исходный код Mellum — компактной языковой модели для автодополнения кода JetBrains объявила об открытии кода Mellum — компактной LLM, предназначенной для дополнения, а не генерации кода с нуля. Модель содержит всего 4 миллиарда параметров, что позволяет запускать её локально или на собственных серверах. Mellum работает с Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. Размер контекстного окна — 8000 токенов. Для кого выпустили Mellum: – Облачный запуск через vLLM с интеграцией в любые приложения. – Локальный запуск через llama.cpp или Ollama — подходит для работы с закрытым кодом. – Интеграция в редакторы кода и среды разработки. Код и веса Mellum доступны на Hugging Face. Библиотека программиста #свежак
Технологии1 день назад



godnoTECH - Новости IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах. — Супер — Ну выпустила и выпустила godnoTECH - Новости IT
Технологии2 дня назад

БлоGнот
JetBrains выпустила свою первую "открытую" AI-модель для программирования. Модель Mellum, которая ранее была доступна только в программных продуктах компании, теперь открыто размещена на платформе Hugging Face. Mellum имеет 4 миллиарда параметров и обучена на более чем 4 триллионах токенов. Модель специально разработана для автодополнения кода завершения фрагментов кода на основе окружающего контекста . JetBrains обучила Mellum на нескольких наборах данных, включая код с открытыми лицензиями из GitHub и статьи из английской Википедии. Обучение заняло около 20 дней на кластере из 256 GPU Nvidia H200. Важно отметить, что базовую модель нельзя использовать прямо "из коробки" — её нужно дополнительно обучать под конкретные задачи. JetBrains предоставила несколько дообученных версий для Python, но предупреждает, что они предназначены для "оценки потенциальных возможностей", а не для использования в рабочей среде. Как-то культовая для разработчиков компания совсем медленно запрягает в теме AI, вам не кажется? У них что там внутри — Java?
Технологии2 дня назад
Похожие новости



+8



+2



+2



+1






+43

Google внедряет рекламу в ИИ-ботах и запускает новый режим поиска
Технологии
1 день назад




Apple и Anthropic объединяют усилия для разработки ИИ-платформы
Технологии
1 день назад




Meta сообщает о росте выручки и прибыли, увеличивая инвестиции в искусственный интеллект
Экономика
1 день назад




Википедия анонсировала трехлетнюю стратегию использования ИИ для автоматизации задач редакторов
Технологии
1 день назад




Krea AI представляет новый инструмент GPT Paint для создания коллажей
Технологии
9 часов назад



В Китае гуманоидный робот вышел из-под контроля во время тестирования
Происшествия
1 день назад


