12 сентября, 14:09

Mistral AI представил мультимодальную модель Pixtral-12b с возможностью распознавания изображений

addmeto
addmeto
Mistral AI выложили веса от своей новой мультимодальной модели pixtral-12b. Традиционно скачать можно в торренте
GPT/ChatGPT/AI Central Александра Горного
GPT/ChatGPT/AI Central Александра Горного
Mistral AI анонсировал мультимодальную модель Pixtral-12b Pixtral распознает картинки и умеет отвечать на вопросы по ним. Пока для модели выложены только веса. Результатов тестов и бенчмарков еще нет. — GPT-4o и Midjourney v6.1 доступны в c.aiacademy.me
Французский стартап Mistral выпустил свою первую мультимодальную модель искусственного интеллекта.   Она называется Pixtral 12B и может обрабатывать текст и изображения.  Модель имеет 12 миллиардов параметров и занимает 24 ГБ. Она была разработана на базе текстовой нейросети Nemo 12B и способна отвечать на вопросы по изображениям.  Pixtral 12B уже доступна для загрузки на GitHub и Hugging Face, а вскоре появится и в чат-боте Mistral.  Источник
Технопроходцы
Технопроходцы
Французский стартап Mistral выпустил свою первую мультимодальную модель искусственного интеллекта. Она называется Pixtral 12B и может обрабатывать текст и изображения. Модель имеет 12 миллиардов параметров и занимает 24 ГБ. Она была разработана на базе текстовой нейросети Nemo 12B и способна отвечать на вопросы по изображениям. Pixtral 12B уже доступна для загрузки на GitHub и Hugging Face, а вскоре появится и в чат-боте Mistral. Источник
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision  Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг  CEO NVIDIA .  Ключевые особенности:  1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения.  2. Расширенные возможности:    - Контекстное окно в 128k токенов    - Обработка больших документов с чередующимся текстом и изображениями  3. Модель распространяется под лицензией Apache 2.0.  Производительность  Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках:  - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах.  Сравнение с конкурентами  В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision, особенно в мультимодальных задачах и задачах следования инструкциям.
Все о блокчейн, мозге и WEB 3.0 в России и мире
Все о блокчейн, мозге и WEB 3.0 в России и мире
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг CEO NVIDIA . Ключевые особенности: 1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения. 2. Расширенные возможности: - Контекстное окно в 128k токенов - Обработка больших документов с чередующимся текстом и изображениями 3. Модель распространяется под лицензией Apache 2.0. Производительность Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках: - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах. Сравнение с конкурентами В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision, особенно в мультимодальных задачах и задачах следования инструкциям.
Разработчики модели ИИ Mistral выбрали способ распространения через торрент  Компания Mistral AI анонсировала запуск Pixtral 12B, своей первой мультимодальной модели, что ставит её в конкурентное положение с OpenAI и Anthropic.   Новая модель доступна для скачивания на таких платформах, как Hugging Face, GitHub и даже через торрент.  Хотя подробности о данных, на которых происходило обучение, не раскрываются, Pixtral 12B создана для того, чтобы пользователи могли загружать изображения и запрашивать информацию о их содержимом посредством текстовых запросов.   София Янг, руководитель отдела работы с разработчиками в Mistral, подчеркнула уникальную возможность модели обрабатывать любое количество и размеры изображений.   Первые пользователи отметили, что Pixtral 12B имеет сложную архитектуру. Зрительный компонент включает специализированное программное обеспечение, поддерживающее разрешение 1024×1024, а также 24 скрытых слоя для глубокой обработки изображений.  Скоро Pixtral 12B будет доступен через API.
Хлебни ИИ - про искусственный интеллект
Хлебни ИИ - про искусственный интеллект
Разработчики модели ИИ Mistral выбрали способ распространения через торрент Компания Mistral AI анонсировала запуск Pixtral 12B, своей первой мультимодальной модели, что ставит её в конкурентное положение с OpenAI и Anthropic. Новая модель доступна для скачивания на таких платформах, как Hugging Face, GitHub и даже через торрент. Хотя подробности о данных, на которых происходило обучение, не раскрываются, Pixtral 12B создана для того, чтобы пользователи могли загружать изображения и запрашивать информацию о их содержимом посредством текстовых запросов. София Янг, руководитель отдела работы с разработчиками в Mistral, подчеркнула уникальную возможность модели обрабатывать любое количество и размеры изображений. Первые пользователи отметили, что Pixtral 12B имеет сложную архитектуру. Зрительный компонент включает специализированное программное обеспечение, поддерживающее разрешение 1024×1024, а также 24 скрытых слоя для глубокой обработки изображений. Скоро Pixtral 12B будет доступен через API.
Подарок, который точно не разочарует
₿tc-card.com
₿tc-card.com
Подарок, который точно не разочарует
Французская Mistral AI выпустила свою первую мультимодальную языковую модель.   Pixtral 12B работает с текстом, а также способен генерировать и распознавать изображения.   При 12 миллиардах параметров, Pixtral 12B удалось уместить всего в 24GB. Модель уже выложили на Hugging Face, GutHub. Можно использовать по лицензии Apache 2.0 — то есть, даже в коммерческих проектах с указанием авторства.   Ждем прожарку бенчмарками через 3, 2, 1...
NN
NN
Французская Mistral AI выпустила свою первую мультимодальную языковую модель. Pixtral 12B работает с текстом, а также способен генерировать и распознавать изображения. При 12 миллиардах параметров, Pixtral 12B удалось уместить всего в 24GB. Модель уже выложили на Hugging Face, GutHub. Можно использовать по лицензии Apache 2.0 — то есть, даже в коммерческих проектах с указанием авторства. Ждем прожарку бенчмарками через 3, 2, 1...
42 секунды
42 секунды
TechCrunch: Mistral выпустил свою первую мультимодальную модель – Французский Mistral выпустил мультимодальную модель Pixtral 12B – Новая модель обладает 12 млрд параметров и весит около 24 ГБ – Pixtral 12B стала доступна на GitHub и на платформе Hugging Face – Разработчики могут загружать и дорабатывать модель от Mistral – Новая модель Pixtral 12B от Mistral доступна по лицензии Apache 2.0 – На каких именно изображениях обучали Pixtral 12B неизвестно – Большинство моделей Mistral использовали публичные данные – Ранее Mistral привлек $645 млн инвестиций по оценке $6 млрд – Одним из миноритарных инвесторов Mistral является Microsoft
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision  Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг  CEO NVIDIA .  Ключевые особенности:  1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения.  2. Расширенные возможности:    - Контекстное окно в 128k токенов    - Обработка больших документов с чередующимся текстом и изображениями  3. Модель распространяется под лицензией Apache 2.0.  Производительность  Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках:  - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах.  Сравнение с конкурентами  В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vis...
Техно Творец
Техно Творец
Mistral представила ИИ-модель Pixtral 12B, которая превосходит Qwen2 7B, LLaVA-OV 7B и Phi-3 Vision Эти слайды с закрытой конференции Mistral, на которой присутствовал Дженсен Хуанг CEO NVIDIA . Ключевые особенности: 1. Мультимодальная архитектура: используется передовой мультимодальный трансформер-декодер, способный эффективно обрабатывать как текст, так и изображения. 2. Расширенные возможности: - Контекстное окно в 128k токенов - Обработка больших документов с чередующимся текстом и изображениями 3. Модель распространяется под лицензией Apache 2.0. Производительность Pixtral 12B демонстрирует впечатляющие результаты в различных бенчмарках: - Превосходит многие открытые модели в задачах MMMU, MathVista, ChartQA и DocVQA. - Показывает высокие результаты в задачах, требующих точного выполнения инструкций. - Демонстрирует сильные показатели в различных текстовых задачах. Сравнение с конкурентами В большинстве тестов Pixtral 12B превосходит такие модели, как Qwen2 7B, LLaVA-OV 7B и Phi-3 Vis...
Французский стартап Mistral выпустил Pixtral 12B - первую мультимодальную модель, способную обрабатывать как изображения, так и текст, доступную для бесплатного скачивания под лицензией Apache 2.0.    Pixtral 12B — это модель с 12 миллиардами параметров, построенная на основе текстовой модели Mistral Nemo 12B.    Pixtral доступен для загрузки через GitHub    и Hugging Face     под лицензией Apache 2.0, что позволяет неограниченное использование и тонкую настройку.    Mistral планирует в скором времени сделать Pixtral 12B доступным на своих чат-ботах и платформах API, Le Chat и Le Plateforme.    PRO AI   ПОЛЕЗНЫЙ СОФТ   НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
Французский стартап Mistral выпустил Pixtral 12B - первую мультимодальную модель, способную обрабатывать как изображения, так и текст, доступную для бесплатного скачивания под лицензией Apache 2.0. Pixtral 12B — это модель с 12 миллиардами параметров, построенная на основе текстовой модели Mistral Nemo 12B. Pixtral доступен для загрузки через GitHub и Hugging Face под лицензией Apache 2.0, что позволяет неограниченное использование и тонкую настройку. Mistral планирует в скором времени сделать Pixtral 12B доступным на своих чат-ботах и платформах API, Le Chat и Le Plateforme. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ