12 сентября, 14:09
Mistral AI представил мультимодальную модель Pixtral-12b с возможностью распознавания изображений

addmeto
Mistral AI выложили веса от своей новой мультимодальной модели pixtral-12b. Традиционно скачать можно в торренте
Технологии398 дней назад


Технопроходцы
Французский стартап Mistral выпустил свою первую мультимодальную модель искусственного интеллекта. Она называется Pixtral 12B и может обрабатывать текст и изображения. Модель имеет 12 миллиардов параметров и занимает 24 ГБ. Она была разработана на базе текстовой нейросети Nemo 12B и способна отвечать на вопросы по изображениям. Pixtral 12B уже доступна для загрузки на GitHub и Hugging Face, а вскоре появится и в чат-боте Mistral. Источник
Технологии398 дней назад


Все о блокчейн, мозге и WEB 3.0 в России и мире
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг CEO NVIDIA . Ключевые особенности: 1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения. 2. Расширенные возможности: - Контекстное окно в 128k токенов - Обработка больших документов с чередующимся текстом и изображениями 3. Модель распространяется под лицензией Apache 2.0. Производительность Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках: - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах. Сравнение с конкурентами В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision, особенно в мультимодальных задачах и задачах следования инструкциям.
Технологии397 дней назад


Хлебни ИИ - про искусственный интеллект
Разработчики модели ИИ Mistral выбрали способ распространения через торрент Компания Mistral AI анонсировала запуск Pixtral 12B, своей первой мультимодальной модели, что ставит её в конкурентное положение с OpenAI и Anthropic. Новая модель доступна для скачивания на таких платформах, как Hugging Face, GitHub и даже через торрент. Хотя подробности о данных, на которых происходило обучение, не раскрываются, Pixtral 12B создана для того, чтобы пользователи могли загружать изображения и запрашивать информацию о их содержимом посредством текстовых запросов. София Янг, руководитель отдела работы с разработчиками в Mistral, подчеркнула уникальную возможность модели обрабатывать любое количество и размеры изображений. Первые пользователи отметили, что Pixtral 12B имеет сложную архитектуру. Зрительный компонент включает специализированное программное обеспечение, поддерживающее разрешение 1024×1024, а также 24 скрытых слоя для глубокой обработки изображений. Скоро Pixtral 12B будет доступен через API.
Технологии396 дней назад

GPT/ChatGPT/AI Central Александра Горного
Mistral AI анонсировал мультимодальную модель Pixtral-12b Pixtral распознает картинки и умеет отвечать на вопросы по ним. Пока для модели выложены только веса. Результатов тестов и бенчмарков еще нет. — GPT-4o и Midjourney v6.1 доступны в c.aiacademy.me
Технологии398 дней назад


NN
Французская Mistral AI выпустила свою первую мультимодальную языковую модель. Pixtral 12B работает с текстом, а также способен генерировать и распознавать изображения. При 12 миллиардах параметров, Pixtral 12B удалось уместить всего в 24GB. Модель уже выложили на Hugging Face, GutHub. Можно использовать по лицензии Apache 2.0 — то есть, даже в коммерческих проектах с указанием авторства. Ждем прожарку бенчмарками через 3, 2, 1...
Технологии398 дней назад

42 секунды
TechCrunch: Mistral выпустил свою первую мультимодальную модель – Французский Mistral выпустил мультимодальную модель Pixtral 12B – Новая модель обладает 12 млрд параметров и весит около 24 ГБ – Pixtral 12B стала доступна на GitHub и на платформе Hugging Face – Разработчики могут загружать и дорабатывать модель от Mistral – Новая модель Pixtral 12B от Mistral доступна по лицензии Apache 2.0 – На каких именно изображениях обучали Pixtral 12B неизвестно – Большинство моделей Mistral использовали публичные данные – Ранее Mistral привлек $645 млн инвестиций по оценке $6 млрд – Одним из миноритарных инвесторов Mistral является Microsoft
Технологии397 дней назад


Техно Творец
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг CEO NVIDIA . Ключевые особенности: 1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения. 2. Расширенные возможности: - Контекстное окно в 128k токенов - Обработка больших документов с чередующимся текстом и изображениями 3. Модель распространяется под лицензией Apache 2.0. Производительность Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках: - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах. Сравнение с конкурентами В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vis...
Технологии397 дней назад


PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
Французский стартап Mistral выпустил Pixtral 12B - первую мультимодальную модель, способную обрабатывать как изображения, так и текст, доступную для бесплатного скачивания под лицензией Apache 2.0. Pixtral 12B — это модель с 12 миллиардами параметров, построенная на основе текстовой модели Mistral Nemo 12B. Pixtral доступен для загрузки через GitHub и Hugging Face под лицензией Apache 2.0, что позволяет неограниченное использование и тонкую настройку. Mistral планирует в скором времени сделать Pixtral 12B доступным на своих чат-ботах и платформах API, Le Chat и Le Plateforme. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ
Технологии395 дней назад
Похожие новости



+9



+6



+17







+2



+6

Ученик из Электростали разработал робота для обучения жестовому языку
Общество
1 день назад




Искусственный интеллект: симбиоз технологий и человеческого творчества меняет глобальную экономику
Технологии
5 часов назад




Google запускает ИИ режим в России с функционалом, аналогичным Perplexity и ChatGPT
Технологии
13 часов назад




OpenAI завершила тестирование ChatGPT на политическую предвзятость
Технологии
1 день назад




Беспилотные тракторы нового поколения начнут работать в Подмосковье
Происшествия
11 часов назад




Андрей Карпаты представил nanochat: простой способ создания чат-бота за 4 часа
Технологии
23 часа назад


