12 сентября, 14:09
Mistral AI представил мультимодальную модель Pixtral-12b с возможностью распознавания изображений

addmeto
Mistral AI выложили веса от своей новой мультимодальной модели pixtral-12b. Традиционно скачать можно в торренте
Технологии249 дней назад

GPT/ChatGPT/AI Central Александра Горного
Mistral AI анонсировал мультимодальную модель Pixtral-12b Pixtral распознает картинки и умеет отвечать на вопросы по ним. Пока для модели выложены только веса. Результатов тестов и бенчмарков еще нет. — GPT-4o и Midjourney v6.1 доступны в c.aiacademy.me
Технологии249 дней назад


Технопроходцы
Французский стартап Mistral выпустил свою первую мультимодальную модель искусственного интеллекта. Она называется Pixtral 12B и может обрабатывать текст и изображения. Модель имеет 12 миллиардов параметров и занимает 24 ГБ. Она была разработана на базе текстовой нейросети Nemo 12B и способна отвечать на вопросы по изображениям. Pixtral 12B уже доступна для загрузки на GitHub и Hugging Face, а вскоре появится и в чат-боте Mistral. Источник
Технологии248 дней назад


Все о блокчейн, мозге и WEB 3.0 в России и мире
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг CEO NVIDIA . Ключевые особенности: 1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения. 2. Расширенные возможности: - Контекстное окно в 128k токенов - Обработка больших документов с чередующимся текстом и изображениями 3. Модель распространяется под лицензией Apache 2.0. Производительность Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках: - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах. Сравнение с конкурентами В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision, особенно в мультимодальных задачах и задачах следования инструкциям.
Технологии248 дней назад


Хлебни ИИ - про искусственный интеллект
Разработчики модели ИИ Mistral выбрали способ распространения через торрент Компания Mistral AI анонсировала запуск Pixtral 12B, своей первой мультимодальной модели, что ставит её в конкурентное положение с OpenAI и Anthropic. Новая модель доступна для скачивания на таких платформах, как Hugging Face, GitHub и даже через торрент. Хотя подробности о данных, на которых происходило обучение, не раскрываются, Pixtral 12B создана для того, чтобы пользователи могли загружать изображения и запрашивать информацию о их содержимом посредством текстовых запросов. София Янг, руководитель отдела работы с разработчиками в Mistral, подчеркнула уникальную возможность модели обрабатывать любое количество и размеры изображений. Первые пользователи отметили, что Pixtral 12B имеет сложную архитектуру. Зрительный компонент включает специализированное программное обеспечение, поддерживающее разрешение 1024×1024, а также 24 скрытых слоя для глубокой обработки изображений. Скоро Pixtral 12B будет доступен через API.
Технологии247 дней назад



NN
Французская Mistral AI выпустила свою первую мультимодальную языковую модель. Pixtral 12B работает с текстом, а также способен генерировать и распознавать изображения. При 12 миллиардах параметров, Pixtral 12B удалось уместить всего в 24GB. Модель уже выложили на Hugging Face, GutHub. Можно использовать по лицензии Apache 2.0 — то есть, даже в коммерческих проектах с указанием авторства. Ждем прожарку бенчмарками через 3, 2, 1...
Технологии248 дней назад

42 секунды
TechCrunch: Mistral выпустил свою первую мультимодальную модель – Французский Mistral выпустил мультимодальную модель Pixtral 12B – Новая модель обладает 12 млрд параметров и весит около 24 ГБ – Pixtral 12B стала доступна на GitHub и на платформе Hugging Face – Разработчики могут загружать и дорабатывать модель от Mistral – Новая модель Pixtral 12B от Mistral доступна по лицензии Apache 2.0 – На каких именно изображениях обучали Pixtral 12B неизвестно – Большинство моделей Mistral использовали публичные данные – Ранее Mistral привлек $645 млн инвестиций по оценке $6 млрд – Одним из миноритарных инвесторов Mistral является Microsoft
Технологии248 дней назад


Техно Творец
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг CEO NVIDIA . Ключевые особенности: 1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения. 2. Расширенные возможности: - Контекстное окно в 128k токенов - Обработка больших документов с чередующимся текстом и изображениями 3. Модель распространяется под лицензией Apache 2.0. Производительность Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках: - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах. Сравнение с конкурентами В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vis...
Технологии248 дней назад


PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
Французский стартап Mistral выпустил Pixtral 12B - первую мультимодальную модель, способную обрабатывать как изображения, так и текст, доступную для бесплатного скачивания под лицензией Apache 2.0. Pixtral 12B — это модель с 12 миллиардами параметров, построенная на основе текстовой модели Mistral Nemo 12B. Pixtral доступен для загрузки через GitHub и Hugging Face под лицензией Apache 2.0, что позволяет неограниченное использование и тонкую настройку. Mistral планирует в скором времени сделать Pixtral 12B доступным на своих чат-ботах и платформах API, Le Chat и Le Plateforme. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ
Технологии245 дней назад
Похожие новости



+3



+2



+7



+21





+3

Искусственный интеллект как инструмент повышения эффективности бизнеса
Технологии
1 день назад




Инженеры разработали нейроморфное устройство, имитирующее работу человеческого мозга
Технологии
21 час назад




Сэм Альтман предлагает ChatGPT запоминать всю жизнь пользователя для улучшения персонализированного опыта
Технологии
1 день назад




OpenAI представляет Codex — облачного AI-разработчика для программирования
Технологии
1 день назад




Pixverse представляет обновление V4.5 с улучшенным качеством видео и физикой
Технологии
1 день назад


ОАЭ запускает крупнейший датацентр вне США с поддержкой американских компаний
Технологии
23 часа назад


