12 сентября, 14:09

Mistral AI представил мультимодальную модель Pixtral-12b с возможностью распознавания изображений

addmeto
addmeto
Mistral AI выложили веса от своей новой мультимодальной модели pixtral-12b. Традиционно скачать можно в торренте
GPT/ChatGPT/AI Central Александра Горного
GPT/ChatGPT/AI Central Александра Горного
Mistral AI анонсировал мультимодальную модель Pixtral-12b Pixtral распознает картинки и умеет отвечать на вопросы по ним. Пока для модели выложены только веса. Результатов тестов и бенчмарков еще нет. — GPT-4o и Midjourney v6.1 доступны в c.aiacademy.me
Французский стартап Mistral выпустил свою первую мультимодальную модель искусственного интеллекта.   Она называется Pixtral 12B и может обрабатывать текст и изображения.  Модель имеет 12 миллиардов параметров и занимает 24 ГБ. Она была разработана на базе текстовой нейросети Nemo 12B и способна отвечать на вопросы по изображениям.  Pixtral 12B уже доступна для загрузки на GitHub и Hugging Face, а вскоре появится и в чат-боте Mistral.  Источник
Технопроходцы
Технопроходцы
Французский стартап Mistral выпустил свою первую мультимодальную модель искусственного интеллекта. Она называется Pixtral 12B и может обрабатывать текст и изображения. Модель имеет 12 миллиардов параметров и занимает 24 ГБ. Она была разработана на базе текстовой нейросети Nemo 12B и способна отвечать на вопросы по изображениям. Pixtral 12B уже доступна для загрузки на GitHub и Hugging Face, а вскоре появится и в чат-боте Mistral. Источник
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision  Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг  CEO NVIDIA .  Ключевые особенности:  1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения.  2. Расширенные возможности:    - Контекстное окно в 128k токенов    - Обработка больших документов с чередующимся текстом и изображениями  3. Модель распространяется под лицензией Apache 2.0.  Производительность  Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках:  - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах.  Сравнение с конкурентами  В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision, особенно в мультимодальных задачах и задачах следования инструкциям.
Все о блокчейн, мозге и WEB 3.0 в России и мире
Все о блокчейн, мозге и WEB 3.0 в России и мире
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг CEO NVIDIA . Ключевые особенности: 1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения. 2. Расширенные возможности: - Контекстное окно в 128k токенов - Обработка больших документов с чередующимся текстом и изображениями 3. Модель распространяется под лицензией Apache 2.0. Производительность Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках: - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах. Сравнение с конкурентами В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision, особенно в мультимодальных задачах и задачах следования инструкциям.
Разработчики модели ИИ Mistral выбрали способ распространения через торрент  Компания Mistral AI анонсировала запуск Pixtral 12B, своей первой мультимодальной модели, что ставит её в конкурентное положение с OpenAI и Anthropic.   Новая модель доступна для скачивания на таких платформах, как Hugging Face, GitHub и даже через торрент.  Хотя подробности о данных, на которых происходило обучение, не раскрываются, Pixtral 12B создана для того, чтобы пользователи могли загружать изображения и запрашивать информацию о их содержимом посредством текстовых запросов.   София Янг, руководитель отдела работы с разработчиками в Mistral, подчеркнула уникальную возможность модели обрабатывать любое количество и размеры изображений.   Первые пользователи отметили, что Pixtral 12B имеет сложную архитектуру. Зрительный компонент включает специализированное программное обеспечение, поддерживающее разрешение 1024×1024, а также 24 скрытых слоя для глубокой обработки изображений.  Скоро Pixtral 12B будет доступен через API.
Хлебни ИИ - про искусственный интеллект
Хлебни ИИ - про искусственный интеллект
Разработчики модели ИИ Mistral выбрали способ распространения через торрент Компания Mistral AI анонсировала запуск Pixtral 12B, своей первой мультимодальной модели, что ставит её в конкурентное положение с OpenAI и Anthropic. Новая модель доступна для скачивания на таких платформах, как Hugging Face, GitHub и даже через торрент. Хотя подробности о данных, на которых происходило обучение, не раскрываются, Pixtral 12B создана для того, чтобы пользователи могли загружать изображения и запрашивать информацию о их содержимом посредством текстовых запросов. София Янг, руководитель отдела работы с разработчиками в Mistral, подчеркнула уникальную возможность модели обрабатывать любое количество и размеры изображений. Первые пользователи отметили, что Pixtral 12B имеет сложную архитектуру. Зрительный компонент включает специализированное программное обеспечение, поддерживающее разрешение 1024×1024, а также 24 скрытых слоя для глубокой обработки изображений. Скоро Pixtral 12B будет доступен через API.
Умный помощник, который всегда под рукой
1chatgpt.ru
1chatgpt.ru
Умный помощник, который всегда под рукой
Французская Mistral AI выпустила свою первую мультимодальную языковую модель.   Pixtral 12B работает с текстом, а также способен генерировать и распознавать изображения.   При 12 миллиардах параметров, Pixtral 12B удалось уместить всего в 24GB. Модель уже выложили на Hugging Face, GutHub. Можно использовать по лицензии Apache 2.0 — то есть, даже в коммерческих проектах с указанием авторства.   Ждем прожарку бенчмарками через 3, 2, 1...
NN
NN
Французская Mistral AI выпустила свою первую мультимодальную языковую модель. Pixtral 12B работает с текстом, а также способен генерировать и распознавать изображения. При 12 миллиардах параметров, Pixtral 12B удалось уместить всего в 24GB. Модель уже выложили на Hugging Face, GutHub. Можно использовать по лицензии Apache 2.0 — то есть, даже в коммерческих проектах с указанием авторства. Ждем прожарку бенчмарками через 3, 2, 1...
42 секунды
42 секунды
TechCrunch: Mistral выпустил свою первую мультимодальную модель – Французский Mistral выпустил мультимодальную модель Pixtral 12B – Новая модель обладает 12 млрд параметров и весит около 24 ГБ – Pixtral 12B стала доступна на GitHub и на платформе Hugging Face – Разработчики могут загружать и дорабатывать модель от Mistral – Новая модель Pixtral 12B от Mistral доступна по лицензии Apache 2.0 – На каких именно изображениях обучали Pixtral 12B неизвестно – Большинство моделей Mistral использовали публичные данные – Ранее Mistral привлек $645 млн инвестиций по оценке $6 млрд – Одним из миноритарных инвесторов Mistral является Microsoft
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision  Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг  CEO NVIDIA .  Ключевые особенности:  1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения.  2. Расширенные возможности:    - Контекстное окно в 128k токенов    - Обработка больших документов с чередующимся текстом и изображениями  3. Модель распространяется под лицензией Apache 2.0.  Производительность  Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках:  - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах.  Сравнение с конкурентами  В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vis...
Техно Творец
Техно Творец
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг CEO NVIDIA . Ключевые особенности: 1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения. 2. Расширенные возможности: - Контекстное окно в 128k токенов - Обработка больших документов с чередующимся текстом и изображениями 3. Модель распространяется под лицензией Apache 2.0. Производительность Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках: - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах. Сравнение с конкурентами В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vis...
Французский стартап Mistral выпустил Pixtral 12B - первую мультимодальную модель, способную обрабатывать как изображения, так и текст, доступную для бесплатного скачивания под лицензией Apache 2.0.    Pixtral 12B — это модель с 12 миллиардами параметров, построенная на основе текстовой модели Mistral Nemo 12B.    Pixtral доступен для загрузки через GitHub    и Hugging Face     под лицензией Apache 2.0, что позволяет неограниченное использование и тонкую настройку.    Mistral планирует в скором времени сделать Pixtral 12B доступным на своих чат-ботах и платформах API, Le Chat и Le Plateforme.    PRO AI   ПОЛЕЗНЫЙ СОФТ   НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
Французский стартап Mistral выпустил Pixtral 12B - первую мультимодальную модель, способную обрабатывать как изображения, так и текст, доступную для бесплатного скачивания под лицензией Apache 2.0. Pixtral 12B — это модель с 12 миллиардами параметров, построенная на основе текстовой модели Mistral Nemo 12B. Pixtral доступен для загрузки через GitHub и Hugging Face под лицензией Apache 2.0, что позволяет неограниченное использование и тонкую настройку. Mistral планирует в скором времени сделать Pixtral 12B доступным на своих чат-ботах и платформах API, Le Chat и Le Plateforme. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ