5 марта, 18:16
Сбер представил Green VLA: новая модель для управления роботами общего назначения


TrendWatching
Сбер научит роботов планировать и понимать людей банк представил Green VLA модель для роботов общего назначения которая помогает им понимать человека и выполнять сложные задачи Систему обучили на большом количестве данных из интернета и с реальных роботов в несколько этапов поэтому она может управлять любым роботом с минимальным дообучением Красота Теперь есть кому поручить уборку


NN
Сбер выпустил Green VLA это система управления разными роботами от простого манипулятора до антропоморфа В феврале компания уже выкладывала техотчёт Green VLA а сейчас полноценный релиз в открытый доступ Модель может управлять роботом понимать человеческие инструкции и различать любые предметы в реальном времени Те кто занимается роботами могут легко использовать модель в своих проектах ведь код уже доступен на GitHub и HuggingFace


OMG GPT: Midjourney, DeepSeek, IT
Сбер выложил в open source модель для управления роботами Опубликованы веса и код Green VLA модели класса Vision Language Action предназначенной для управления роботами общего назначения Проект ранее стал лучшей статьёй недели на Hugging Face Техническая основа Архитектура построена на Qwen3 VL 4B Используется трансформер с flow matching который предсказывает действия робота в реальном времени Обучение прошло пять этапов от мультимодальных веб данных до демонстраций с реальных роботов Унификация робототехнических датасетов улучшает обобщение между разными платформами По результатам тестов модель показывает сильные результаты на робототехнических бенчмарках Fractal и Bridge Что открыли разработчики код обучения и инференса предобученные веса модели Базовую модель можно дообучить под конкретную платформу и использовать для прикладных задач например в логистике на складах или производстве


Machinelearning
Опубликованы веса и код Green VLA модели для управления роботами общего назначения Сбер открыл доступ к своей Vision Language Action модели В феврале эта работа стала лучшей статьей недели на Hugging Face а сейчас всё выложили в open source Главное о технической части В основе лежит Qwen3 VL 4B и трансформер который с помощью flow matching предсказывает действия робота в реальном времени Модель обучалась в пять этапов от мультимодальных веб данных до примеров с реальных роботов Унификация робототехнических данных позволяет модели лучше обобщаться и работать на разных роботах Благодаря такому подходу модель получает лучшие метрики на робототехнических бенчмарках Fractal и Bridge Состав релиза исходный код для обучения и инференса на GitHub предобученные веса на платформе Hugging Face Релиз может быть важен для всех кто занимается робототехникой Базовую модель можно быстро дообучить под конкретного робота и использовать ее для решения реальных задач например на производствах или складах ai machinelearning big data ai ml sber


Бэкдор
Сбер открыл код и веса модели для своего робота Грина теперь можно посмотреть как работает нейронка Green VLA Она учит роботов выполнять всевозможные задачи на разных типах железа Моделька рулит ВСЕМ антропоморфами мобильными манипуляторами и стационарными руками Обучают ее поэтапно от веб данных до примеров с роботов подкручивая через RL Главное есть лицензия MIT можно спокойно юзать для своих проектов Смотрим код на GitHub тут Веса на Hugging Face здесь Бэкдор
Похожие новости





+2






+14



+5



Anthropic запускает режим Сновидений для самообучения ИИ агентов
Технологии
4 часа назад

РЖД запускает роботов-уборщиков на вокзалах Москвы и Санкт-Петербурга
Общество
3 часа назад


+2
Дженсен Хуанг: Искусственный интеллект создает рабочие места в новых отраслях
Технологии
1 день назад


Гуманоидный робот G1 стал почетным монахом в Сеуле
Технологии
1 день назад


+14
Anthropic запускает 10 ИИ агентов для оптимизации финансовых процессов
Технологии
1 день назад


+5
Selectel запускает новое юрлицо для развития ИИ и инвестирует 10 млрд рублей в экосистему
Технологии
23 часа назад
