UMI: сбор данных и обучение пикера

Обзор

UMI (User Manipulating Interface) - рабочее место для сбора данных: видео с камер, IMU, показания датчиков. Собранные датасеты уходят в пайплайн обучения в Нирване (внутренняя ML-среда Яндекса), откуда выходят модели для робота Picker.

Зачем

Без нормальных данных пикер не обучишь. Нужен единый инструмент, где оператор снимает эпизоды, синхронизирует потоки видео+IMU+сенсоры и отправляет датасет в обучение. Иначе каждый круг «сняли данные -> обучили -> проверили» растягивается на недели.

Эффект

Дешевле и быстрее итерации: меньше ручной возни с логами, быстрее отладка датасетов, раньше видно, что модель ведёт себя плохо на реальном стенде. Без этого Picker растёт медленно, каждая новая версия модели стоит команде лишнего времени.

Моя роль

Сбор и передача датасетов (видео + IMU + датчики), пайплайн обучения в Нирване и стыковка embedded-стека с циклом «сняли -> обучили -> проверили на роботе».

Обзор

Зачем

Эффект

Моя роль

Видео работы