5 марта, 18:16

Сбер представил Green VLA: новая модель для управления роботами общего назначения

Сбер научит роботов планировать и понимать людей банк представил Green VLA модель для роботов общего назначения которая помогает им понимать человека и выполнять сложные задачи Систему обучили на большом количестве данных из интернета и с реальных роботов в несколько этапов поэтому она может управлять любым роботом с минимальным дообучением Красота Теперь есть кому поручить уборку
TrendWatching
TrendWatching
Сбер научит роботов планировать и понимать людей банк представил Green VLA модель для роботов общего назначения которая помогает им понимать человека и выполнять сложные задачи Систему обучили на большом количестве данных из интернета и с реальных роботов в несколько этапов поэтому она может управлять любым роботом с минимальным дообучением Красота Теперь есть кому поручить уборку
Сбер выпустил Green VLA это система управления разными роботами от простого манипулятора до антропоморфа В феврале компания уже выкладывала техотчёт Green VLA а сейчас полноценный релиз в открытый доступ Модель может управлять роботом понимать человеческие инструкции и различать любые предметы в реальном времени Те кто занимается роботами могут легко использовать модель в своих проектах ведь код уже доступен на GitHub и HuggingFace
NN
NN
Сбер выпустил Green VLA это система управления разными роботами от простого манипулятора до антропоморфа В феврале компания уже выкладывала техотчёт Green VLA а сейчас полноценный релиз в открытый доступ Модель может управлять роботом понимать человеческие инструкции и различать любые предметы в реальном времени Те кто занимается роботами могут легко использовать модель в своих проектах ведь код уже доступен на GitHub и HuggingFace
Сбер выложил в open source модель для управления роботами Опубликованы веса и код Green VLA модели класса Vision Language Action предназначенной для управления роботами общего назначения Проект ранее стал лучшей статьёй недели на Hugging Face Техническая основа Архитектура построена на Qwen3 VL 4B Используется трансформер с flow matching который предсказывает действия робота в реальном времени Обучение прошло пять этапов от мультимодальных веб данных до демонстраций с реальных роботов Унификация робототехнических датасетов улучшает обобщение между разными платформами По результатам тестов модель показывает сильные результаты на робототехнических бенчмарках Fractal и Bridge Что открыли разработчики код обучения и инференса предобученные веса модели Базовую модель можно дообучить под конкретную платформу и использовать для прикладных задач например в логистике на складах или производстве
OMG GPT: Midjourney, DeepSeek, IT
OMG GPT: Midjourney, DeepSeek, IT
Сбер выложил в open source модель для управления роботами Опубликованы веса и код Green VLA модели класса Vision Language Action предназначенной для управления роботами общего назначения Проект ранее стал лучшей статьёй недели на Hugging Face Техническая основа Архитектура построена на Qwen3 VL 4B Используется трансформер с flow matching который предсказывает действия робота в реальном времени Обучение прошло пять этапов от мультимодальных веб данных до демонстраций с реальных роботов Унификация робототехнических датасетов улучшает обобщение между разными платформами По результатам тестов модель показывает сильные результаты на робототехнических бенчмарках Fractal и Bridge Что открыли разработчики код обучения и инференса предобученные веса модели Базовую модель можно дообучить под конкретную платформу и использовать для прикладных задач например в логистике на складах или производстве
Опубликованы веса и код Green VLA модели для управления роботами общего назначения Сбер открыл доступ к своей Vision Language Action модели В феврале эта работа стала лучшей статьей недели на Hugging Face а сейчас всё выложили в open source Главное о технической части В основе лежит Qwen3 VL 4B и трансформер который с помощью flow matching предсказывает действия робота в реальном времени Модель обучалась в пять этапов от мультимодальных веб данных до примеров с реальных роботов Унификация робототехнических данных позволяет модели лучше обобщаться и работать на разных роботах Благодаря такому подходу модель получает лучшие метрики на робототехнических бенчмарках Fractal и Bridge Состав релиза исходный код для обучения и инференса на GitHub предобученные веса на платформе Hugging Face Релиз может быть важен для всех кто занимается робототехникой Базовую модель можно быстро дообучить под конкретного робота и использовать ее для решения реальных задач например на производствах или складах ai machinelearning big data ai ml sber
Machinelearning
Machinelearning
Опубликованы веса и код Green VLA модели для управления роботами общего назначения Сбер открыл доступ к своей Vision Language Action модели В феврале эта работа стала лучшей статьей недели на Hugging Face а сейчас всё выложили в open source Главное о технической части В основе лежит Qwen3 VL 4B и трансформер который с помощью flow matching предсказывает действия робота в реальном времени Модель обучалась в пять этапов от мультимодальных веб данных до примеров с реальных роботов Унификация робототехнических данных позволяет модели лучше обобщаться и работать на разных роботах Благодаря такому подходу модель получает лучшие метрики на робототехнических бенчмарках Fractal и Bridge Состав релиза исходный код для обучения и инференса на GitHub предобученные веса на платформе Hugging Face Релиз может быть важен для всех кто занимается робототехникой Базовую модель можно быстро дообучить под конкретного робота и использовать ее для решения реальных задач например на производствах или складах ai machinelearning big data ai ml sber
Сбер открыл код и веса модели для своего робота Грина теперь можно посмотреть как работает нейронка Green VLA Она учит роботов выполнять всевозможные задачи на разных типах железа Моделька рулит ВСЕМ антропоморфами мобильными манипуляторами и стационарными руками Обучают ее поэтапно от веб данных до примеров с роботов подкручивая через RL Главное есть лицензия MIT можно спокойно юзать для своих проектов Смотрим код на GitHub тут Веса на Hugging Face здесь Бэкдор
Бэкдор
Бэкдор
Сбер открыл код и веса модели для своего робота Грина теперь можно посмотреть как работает нейронка Green VLA Она учит роботов выполнять всевозможные задачи на разных типах железа Моделька рулит ВСЕМ антропоморфами мобильными манипуляторами и стационарными руками Обучают ее поэтапно от веб данных до примеров с роботов подкручивая через RL Главное есть лицензия MIT можно спокойно юзать для своих проектов Смотрим код на GitHub тут Веса на Hugging Face здесь Бэкдор