30 августа, 10:58
Apple анонсировала FastVLM с поддержкой WebGPU для улучшенной обработки изображений и текста

AI Insider
Apple выпускает FastVLM и MobileCLIP2 на Hugging Face Модели стали в 85 раз быстрее и в 3 4 раза меньше чем в предыдущих версиях что позволяет использовать приложения VLM в реальном времени Он даже может создавать субтитры к видео в реальном времени локально прямо в браузере не требует установки
Технологии1 день назад

Python Community
Apple представила FastVLM на Hugging Face модели 0 5B 1 5B и 7B с поддержкой WebGPU VLM Vision Language Model это модель которая умеет одновременно работать с картинками и текстом понимать что изображено описывать картинку словами отвечать на вопросы по изображению и совмещать визуальные и текстовые данные Что это значит До 85 раз быстрее и в 3 4 раза компактнее аналогичных VLM У крупных моделей время до первого токена стало быстрее в 7 9 раз Меньше выходных токенов быстрее обработка картинок высокого разрешения Модель работает в реальном времени прямо в браузере через transformers js и WebGPU huggingface co spaces apple fastvlm webgpu Python Community ru
Технологии1 день назад
Похожие новости





+11



+1






TikTok расширяет функционал, добавляя голосовые сообщения и обмен фото
Технологии
22 часа назад


Alibaba разрабатывает ИИ чипы в ответ на ограничения Nvidia
Технологии
1 день назад




Утечка дорожной карты мобильных процессоров Intel и AMD до 2026 года
Технологии
1 день назад




Новая нейросеть превращает видео в конспекты за секунды
Технологии
1 час назад

Прорыв в компьютерном зрении: Янн ЛеКун представил LeNet, первую сверточную нейронную сеть
Технологии
14 часов назад



Илон Маск анонсировал высокие гарантированные доходы благодаря ИИ
Политика
1 день назад
