
GPT/ChatGPT/AI Central Александра Горного
JetBrains выпустила открытую AI-модель для дописывания кода Модель Mellum-4b разработана специально для автоматического завершения фрагментов кода на основе окружающего контекста. Mellum создана для интеграции в профессиональные инструменты разработчиков. Базовая модель не работает «из коробки» и требует предварительной настройки. Код здесь:
Технологии66 дней назад


Новости в Мире IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Технологии66 дней назад


Программист | IT | Техника
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах.
Технологии66 дней назад


Библиотека программиста | программирование, кодинг, разработка
JetBrains опубликовала исходный код Mellum — компактной языковой модели для автодополнения кода JetBrains объявила об открытии кода Mellum — компактной LLM, предназначенной для дополнения, а не генерации кода с нуля. Модель содержит всего 4 миллиарда параметров, что позволяет запускать её локально или на собственных серверах. Mellum работает с Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust и Ruby. Размер контекстного окна — 8000 токенов. Для кого выпустили Mellum: – Облачный запуск через vLLM с интеграцией в любые приложения. – Локальный запуск через llama.cpp или Ollama — подходит для работы с закрытым кодом. – Интеграция в редакторы кода и среды разработки. Код и веса Mellum доступны на Hugging Face. Библиотека программиста #свежак
Технологии65 дней назад



godnoTECH - Новости IT
JetBrains выкатила Mellum — открытую AI-модель для кода JetBrains, создатель популярных IDE вроде IntelliJ и PyCharm, открыла доступ к своей нейросети Mellum. Модель уже на Hugging Face, но разработчики честно предупреждают: это не готовый продукт, а стартовая площадка для экспериментов. Что известно о Mellum? — 4 млрд параметров — сопоставимо с GPT-3.5, но фокус строго на код; — обучена на 4 трлн токенов; — «прокачали» за 20 дней на кластере из 256 графических процессоров Nvidia H200; — лицензия Apache 2.0 — можно легально кастомизировать и использовать в коммерческих проектах. — Супер — Ну выпустила и выпустила godnoTECH - Новости IT
Технологии66 дней назад

БлоGнот
JetBrains выпустила свою первую "открытую" AI-модель для программирования. Модель Mellum, которая ранее была доступна только в программных продуктах компании, теперь открыто размещена на платформе Hugging Face. Mellum имеет 4 миллиарда параметров и обучена на более чем 4 триллионах токенов. Модель специально разработана для автодополнения кода завершения фрагментов кода на основе окружающего контекста . JetBrains обучила Mellum на нескольких наборах данных, включая код с открытыми лицензиями из GitHub и статьи из английской Википедии. Обучение заняло около 20 дней на кластере из 256 GPU Nvidia H200. Важно отметить, что базовую модель нельзя использовать прямо "из коробки" — её нужно дополнительно обучать под конкретные задачи. JetBrains предоставила несколько дообученных версий для Python, но предупреждает, что они предназначены для "оценки потенциальных возможностей", а не для использования в рабочей среде. Как-то культовая для разработчиков компания совсем медленно запрягает в теме AI, вам не кажется? У них что там внутри — Java?
Технологии66 дней назад

42 секунды
TechCrunch: JetBrains выпустила «открытую» модель Mellum для кода – JetBrains выпустила свою первую «открытую» модель для кода – Модель для генерации кода Mellum появилась на Hugging Face – Новая модель от JetBrains была обучена на 4+ трлн токенов – Модель Mellum для генерации кода содержит 4 млрд параметров – Каждый 1 млн токенов соответствует около 30 тыс. строчек кода – Mellum также хорошо подходит для образовательных целей – Для обучения брали код из GitHub, статьи из Википедии и др. – Обучение заняло 20 дней на кластере из 256 чипов Nvidia H200 – Чтобы запустить Mellum нужно приложить некоторые усилия – Базовую модель Mellum нельзя использовать из «коробки» – Для использования модели Mellum, ее нужно будет доработать
Технологии56 дней назад
Похожие новости



+2



+1



+2



+3



+5



+6

Развитие агропромышленного комплекса: внедрение автономных тракторов и беспилотников в Амурской области
Технологии
1 день назад




Искусственный интеллект успешно управляет космическим кораблем в симуляторе
Технологии
1 день назад




OpenAI и Microsoft запускают проект дата-центра Stargate с инвестициями $500 млрд
Технологии
1 день назад




Искусственный интеллект улучшает диагностику в здравоохранении Краснодарского края
Наука
20 часов назад




Благоустройство общественных пространств: проект в Любиме и сад-трансформер в Петербурге
Общество
1 день назад




На Алтае создают уникальный арт-объект из старых автомобилей
Технологии
1 день назад


