Аватар автора

yandexforml

tech

10892 Подписчиков
19 Сообщений
17 Показано сообщений
Не указана Дата добавления
ГлавнаяАвторыyandexforml

Информация об авторе

Категория: tech

Последние сообщения автора

Аватар
Как в Яндекс Роботикс всего за 4 месяца сделали прототип нового робота Сегодня примерно половину рынка складской логистики занимает сборка готовых к отгрузке палет Выглядит этот процесс примерно так сотрудник забирает пустой поддон устанавливает его на тележку и последовательно объезжает ячейки склада собирая коробки которые нужно отправить дальше Готовая палета отправляется на обмотку плёнкой а затем в зону отгрузки Работникам складов приходится каждый день вручную переносить десятки тонн товара и наматывать километры по складу Бизнес и не против это всё автоматизировать но перестраивать помещения под роботов дорого людей полностью убирать никто не готов а при совместной работе человека и машины заметно падает общая производительность Мы решили что разработаем инструмент который органично встроится в уже существующие процессы на складе Поэтому в феврале 2025 года собрались на полигоне Яндекс Роботикс И начали проектировать У нас уже был робот инвентаризатор и рука UR10 которая использовалась в стационарном роботе депалетизаторе Они закрывали две основные операции отбор и перемещение товара Правда делали они это по отдельности один робот ездил между стеллажами и сканировал коробки а второй перемещал их с палеты в одну точку Поэтому мы начали собирать новый прототип который бы выполнял оба процесса одновременно Какие задачи пришлось решить Навигация Платформа инвентаризатора ездила строго по заданной траектории в виртуальной карте Но на складе всё меняется каждую минуту одни пути преграждают коробками или мусором другие освобождают Мы решили сделать локальное планирование прямо на роботе чтобы он мог автономно двигаться строить маршруты и объезжать препятствия Манипуляция Мы реализовали телеуправление вручную управляли рукой отлаживали компрессор тестировали позиции камер и настраивали сбор данных для обучения нейросетей Зрение Когда мы смотрим на стопку коробок может быть непонятно как глубоко нужно занести вакуумный гриппер потому что одни коробки закрывают обзор других Например можно просто не увидеть что с дальней от нас стороны отсутствует верхний ряд Поэтому мы установили две камеры одна сегментирует коробку как объект целиком а другая работает на захват и обеспечивает дополнительный обзор Связка всех элементов в один модуль Мы объединили софт для сканирования управления и Behavior Tree Теперь система сама может выполнять нужные действия по заданному сценарию в ROS2 Стекинг Наша стационарная роборука для депалетизации могла ставить коробки только в одну точку А мы сделали так чтобы она складывала товары по всей поверхности палеты Сейчас робот может доехать до ячейки обходя препятствия и собрать заказ Следующий шаг более длинная и грузоподъёмная рука прокачка автономности и выезд с полигона на реальные склады Подробности о проекте читайте на Хабре Статья будет интересна всем кто хочет узнать как в Яндексе идея превращается в рабочий прототип устройства которое ещё вчера казалось фантастикой Подписывайтесь Yandex4ML YandexML
Открыть в Telegram → Открыть новость на сайте →
Аватар
Как англоязычные блогеры и подкастеры заговорили на русском своими голосами Ребята из Яндекс Браузера совместно со службой синтеза речи прокачали модель для онлайн-перевода видео. Новая версия нейросети анализирует оригинальную аудиодорожку, чтобы подобрать тембр и интонации голоса, которые максимально похожи на изначальное аудио. Это стало возможным благодаря: Интеграции модели голосовой биометрии в языковую модель Управляемости качества синтеза через автометрику UTMOS Сокращению количества генерируемых гипотез в языковой модели и числа итераций диффузионной модели на стадии инференса Использованию общего фонемного представления текста для английского и русского языка Ещё подробнее об архитектуре, вызовах zero-shot-синтеза и быстром инференсе новой модели читайте на Хабре. Подписывайтесь:
Открыть в Telegram → Открыть новость на сайте →
Аватар
Анализируйте изображения с помощью опенсорсных нейросетей Yandex B2B Tech открыл доступ к опенсорсным визуально-генеративным моделям VLM . С ними бизнес-клиенты могут выстраивать свои сценарии обработки изображений — например, составлять описания товаров по фотографиям или быстро находить нужную информацию в документах. Уже доступны около 20 VLM- и LLM-моделей. Среди них: DeepSeek-VL2 Tiny и Gemma 3 27b, Qwen 2.5, LLaMa 3.3 и рассуждающие нейросети QwQ 32b и DeepSeek-R1. Модели доступны в пакетном режиме: за один раз в них можно отправить множество запросов. В будущем мы будем разворачивать на платформе новые опенсорсные модели, а ещё вскоре добавим собственную VLM-модель Яндекса. Попробовать их можно в Yandex Cloud AI Studio. А узнать подробности в статье на Хабре. Подписывайтесь:
Открыть в Telegram → Открыть новость на сайте →
Аватар
‍ Статья о новом методе сжатия LLM попала на NAACL Исследователи из Яндекса, НИУ ВШЭ, MIT, ISTA и KAUST представили новый метод сжатия LLM под названием HIGGS Hadamard Incoherence with Gaussian MSE-optimal GridS . Метод сжимает нейросети без использования дополнительных данных и без вычислительно сложной оптимизации параметров. Это позволяет запускать LLM на телефонах и компьютерах без дополнительного оборудования. Научную статью о HIGGS приняли на NAACL — одну из крупнейших в мире конференций по искусственному интеллекту. Вот всего два факта зато каких! про новый метод: С помощью HIGGS можно эффективно сжать DeepSeek-R1 на 671 млрд параметров и Llama 4 Maverick на 400 млрд параметров. Раньше такие большие модели удавалось квантовать только самыми простыми методами со значительной потерей в качестве HIGGS экспериментально проверили на Llama 3 и Qwen 2.5 — оказалось, что он лучше всех существующих методов квантизации без использования данных, в том числе NF4 4-bit NormalFloat и HQQ Half-Quadratic Quantization Мы надеемся, что HIGGS упростит тестирование и внедрение LLM, а ещё снизит порог входа в отрасль для некоммерческих лабораторий и институтов, индивидуальных разработчиков и исследователей. Опробовать новый метод сжатия вы можете уже сейчас на Hugging Face и GitHub. Подписывайтесь:
Открыть в Telegram → Открыть новость на сайте →
Аватар
Минувшая неделя выдалась богатой на громкие релизы, так что без лишних предисловий рассказываем о главном. Яндекс выпустил новое поколение своих моделей — YandexGPT 5. О том, как их обучали — читайте на Хабре. А претрейн-версию YandexGPT 5 Lite выложили в опенсорс. OpenAI представила свою самую большую модель — GPT-4.5. Она креативнее, точнее и эмоциональнее предшественниц. Пока доступна только подписчикам плана Pro, но скоро появится и на тарифе Plus. Google открыла доступ к мультимодальной модели Veo 2. Генерация одной секунды видео стоит 50 центов. Не самое дешевое решение на рынке, но съёмки кино в Голливуде обходятся значительно дороже. Вышла Claude 3.7 Sonnet. Модель показывает отличные результаты в программировании, поэтому разработчики даже представили специальный инструмент Claude Code, который способен здорово облегчить написание кода. Ещё в помощь разработчикам — Yandex Cloud и Yandex Infrastructure представили SourceCraft, платформу для разработки ПО с AI-ассистентом для кодинга, поддерживающим 30+ языков и доступным в VSCode и JetBrains. Подробности читайте на Хабре. Scribe — это новый продукт от ElevenLabs, созданный для перевода речи в текст. Поддерживает 99 языков и пригодится, если нужно, скажем, расшифровать интервью. Подписывайтесь:
Открыть в Telegram → Открыть новость на сайте →
Аватар
Яндекс наградил 14 учёных за достижения в сфере машинного обучения В шестой раз мы провели ежегодную премию Yandex ML Prize. На ней мы поддерживаем научные и образовательные проекты, которые двигают развитие науки в области ИИ и открывают новые возможности для применения ML-технологий. В этом году награждали в номинациях: Первая публикация — за теоретико-информационный анализ нейронных сетей, когнитивную робототехнику, обучение с подкреплением и open-ended-learning Исследователи — за барицентры Вассерштейна, генеративные модели, многоагентное обучение с подкреплением, децентрализованную оптимизацию и асинхронные вычисления Молодые научные руководители — за развитие исследований в областях компьютерного зрения и векторной графики, оптимального транспорта и мостов Шрёдингера, ИИ для науки Преподаватели — за курсы по компьютерному зрению, методам компьютерного обучения и прикладному ML Научные руководители — за когнитивную робототехнику и многоагентное планирование, а ещё за исследования в области интерпретируемости и обобщения языковых моделей Поздравляем победителей! Узнать о них подробнее можно на сайте премии. Подписывайтесь:
Открыть в Telegram → Открыть новость на сайте →
Аватар
‍ Использование ML/Data-опенсорса Наши коллеги из сообщества разработчиков и пользователей открытого научного кода ITMO Opensource провели масштабное исследование российского рынка. Они проанализировали решения и инструменты, а ещё выделили главных игроков в индустрии. В выводах ребята обозначили проблемы и перспективы развития отрасли. Все подробности читайте на нашем лендинге. А в карточках мы рассказали, какое место занимает Яндекс в мире российского ML/Data-опенсорса. Подписывайтесь:
Открыть в Telegram → Открыть новость на сайте →