Перейти к содержимому

Как роботы научились работать с незнакомыми объектами: адаптивный захват, машинное зрение и искусственный интеллект

Как промышленные роботы научились распознавать и захватывать незнакомые объекты

Ещё десять лет назад промышленный робот мог работать только с деталями, чётко зафиксированными в определённом положении. Каждый объект должен был лежать под конкретным углом, в точно заданном месте — иначе манипулятор просто промахивался. Любое изменение номенклатуры требовало перепрограммирования, а инженеры тратили недели на настройку новой задачи.

Ситуация радикально изменилась благодаря сочетанию трёх технологий: машинного зрения, искусственного интеллекта и адаптивных захватных устройств. Робот с такой комбинацией способен увидеть ранее незнакомую деталь, понять её геометрию и физические свойства, выбрать оптимальную стратегию захвата и выполнить задачу — без вмешательства оператора.

От Dense Object Nets к современным решениям

Одним из первых прорывов стала система Dense Object Nets (DON), разработанная в MIT. DON раскладывала объект на тысячи координатных точек, запоминала их расположение и искала аналогии с ранее изученными предметами. Если робот видел кроссовку — он понимал, где носок, где пятка, где шнуровка, и поднимал любую обувь одинаковым способом. Кружку с жидкостью DON захватывала за ручку независимо от ориентации.

Однако DON имела существенное ограничение: обучение одному объекту занимало около 20 минут, а система работала только с объектами, похожими на уже изученные. Для промышленного конвейера, где ежеминутно появляются десятки различных деталей, этого было недостаточно.

Следующее поколение систем — Dex-Net, GraspNet, а недавно Inbolt AI и B.AI от Blumenbecker — решили эту проблему через глубокое обучение на миллионах синтетических и реальных изображений. Вместо анализа одного объекта 20 минут, такие системы генерируют стратегию захвата менее чем за секунду.

Bin picking: робот извлекает детали из контейнера

Задача bin picking (захват объектов из контейнера с произвольным расположением) десятилетиями считалась «святым Граалем» робототехники. Детали лежат хаотично, частично перекрывают друг друга, имеют разные размеры и материалы. Человек решает это интуитивно, а для робота это было непосильной задачей.

Решение нашлось в комбинации 3D-камеры, смонтированной непосредственно на манипуляторе, и нейросети, работающей в реальном времени. Современный цикл bin picking выглядит так:

  1. Сканирование: 3D-камера строит облако точек (point cloud) содержимого контейнера
  2. Сегментация: AI выделяет отдельные объекты, даже если они частично спрятаны под другими
  3. Планирование захвата: нейросеть генерирует несколько вариантов захвата и выбирает оптимальный по критериям надёжности, скорости и безопасности
  4. Выполнение: манипулятор захватывает деталь, а AI продолжает уточнять траекторию движения во время перемещения (in-hand localization)
  5. Размещение: объект точно устанавливается в целевую позицию

Решение Inbolt, представленное в конце 2025 года, достигает скорости менее 1 секунды на захват с показателем успешности до 95%. Система уже работает на более чем пяти промышленных площадках.

Машинное зрение: как робот «видит» незнакомые объекты

Основа адаптивной манипуляции — машинное зрение. Современные системы используют несколько типов сенсоров одновременно:

  • 2D-камеры — для текстур, маркировок, цветов
  • 3D-камеры и структурированный свет — для точной геометрии объектов
  • Time-of-Flight (ToF) сенсоры — для быстрого определения расстояния
  • Тактильные датчики — для обратной связи во время захвата (сила сжатия, текстура поверхности, скольжение)

Данные со всех сенсоров объединяются (sensor fusion) и поступают в нейросеть, которая классифицирует объект, определяет его массу, материал и хрупкость. Для промышленного оборудования на базе сервоприводов и ПЛК это означает бесшовную интеграцию между системой зрения и исполнительными механизмами.

Адаптивные захватные устройства

Даже лучший AI бесполезен, если захват физически не может удержать деталь. Поэтому параллельно развиваются адаптивные грипперы — захватные устройства, подстраивающиеся под форму объекта:

  • Мягкие (soft) грипперы — из эластичных полимеров или пневматических камер, обволакивающих объект произвольной формы. Идеальны для хрупких предметов: стекло, электроника, пищевые продукты
  • Вакуумные присоски с адаптивной зоной — набор присосок разного диаметра, активируемых в зависимости от поверхности объекта
  • Многопальцевые грипперы — механические «пальцы» с индивидуальным управлением каждым, позволяющие захватывать объекты от мелких винтов до крупных корпусов
  • Магнитные захваты — для металлических деталей, с регулируемой силой магнитного поля через электромагниты

Наиболее продвинутые системы комбинируют два-три типа захвата в одном инструменте и автоматически переключаются между ними в зависимости от распознанного объекта.

Традиционные vs адаптивные роботы: сравнение

Параметр Традиционный промышленный робот Робот с адаптивным AI-захватом
Распознавание объектов Только заранее запрограммированные детали Любые объекты, включая ранее неизвестные
Время перенастройки Часы или дни (перепрограммирование) Секунды (автоматическая адаптация)
Точность позиционирования Высокая, но только для фиксированных позиций Высокая для произвольных позиций и ориентаций
Bin picking Невозможен без дополнительных систем Встроенная функция с успешностью 90-95%
Работа с хрупкими объектами Риск повреждения (фиксированная сила) Адаптивная сила захвата с тактильной обратной связью
Стоимость интеграции Ниже начальная, выше при смене продукции Выше начальная, значительно ниже при смене продукции
Номенклатура объектов Ограничена (обычно 1-5 типов) Неограничена
Обучение системы Ручное программирование точек Автоматическое через нейросеть или демонстрацию

Коллаборативные роботы (коботы) с адаптивным захватом

Коботы — это роботы, спроектированные для безопасной работы рядом с человеком без ограждений. Сочетание коботов с адаптивным AI-захватом открыло новые сценарии: робот может работать на той же линии, что и оператор, перехватывая тяжёлые или монотонные операции.

Лидеры рынка промышленных роботов — FANUC с серией CRX, ABB с коботами YuMi, KUKA с LBR iiwa и Universal Robots — активно интегрируют AI-зрение в свои коллаборативные платформы. FANUC, например, заключила партнёрство с Inbolt для внедрения точных операций на движущихся конвейерах — General Motors стал первым заказчиком этого решения.

Рынок коллаборативных роботов растёт с 1,42 миллиарда долларов в 2025 году до прогнозируемых 3,38 миллиарда долларов в 2030 году (CAGR 18,9%).

Роль частотных преобразователей и ПЛК в адаптивной робототехнике

За плавностью движения робота-манипулятора стоит точное управление электродвигателями. Частотные преобразователи (VFD) обеспечивают бесступенчатое регулирование скорости вращения двигателей, что критично для адаптивного захвата: робот должен плавно подводить захватное устройство, замедляться при приближении к объекту и мгновенно реагировать на сигналы от тактильных датчиков.

Программируемые логические контроллеры (ПЛК) координируют все компоненты системы — от камер машинного зрения до сервоприводов осей манипулятора. В современных решениях ПЛК взаимодействует с AI-модулем через промышленные протоколы (EtherCAT, PROFINET), передавая команды с миллисекундной точностью.

Системы на базе сервоприводов обеспечивают позиционирование с точностью до сотых долей миллиметра. Для bin picking это означает, что робот может достать мелкий винт из кучи деталей, не задев соседние.

Промышленные протоколы связи для AI-роботов

Интеграция нейросети с исполнительными механизмами требует быстрых промышленных сетей. Основные протоколы:

  • EtherCAT — цикл обновления менее 100 микросекунд, стандарт для сервоприводов
  • PROFINET IRT — синхронизация с точностью до 1 микросекунды
  • OPC UA — обмен данными между AI-сервером и ПЛК
  • ROS 2 — фреймворк для программирования роботов с поддержкой AI-модулей

Практические применения адаптивных роботов

Логистика и складское хозяйство

Amazon, Walmart и другие гиганты электронной коммерции используют адаптивных роботов для сортировки посылок разных размеров и форм. Один робот обрабатывает тысячи уникальных товарных позиций в сутки — от косметики до бытовой техники.

Автомобильная промышленность

Загрузка заготовок в станки ЧПУ, перекладывание деталей между этапами обработки, финальная инспекция качества — все эти операции автоматизируются через адаптивный bin picking. General Motors уже внедряет систему FANUC + Inbolt на своих заводах.

Электронная промышленность

Захват мелких компонентов (микросхемы, конденсаторы, разъёмы) из лотков-подавателей требует одновременно высокой точности и бережности. Платы расширения и модули для контроллеров автоматизации демонстрируют уровень миниатюризации, с которым справляются современные роботы.

Фармацевтика и пищевая промышленность

Мягкие грипперы позволяют работать с хрупкими продуктами: стеклянные ампулы, упаковки с лекарствами, кондитерские изделия. Робот адаптирует силу захвата под каждый конкретный предмет.

Технологии обучения роботов

Как именно нейросеть «понимает», как захватить незнакомый объект? Существует несколько подходов:

Обучение на синтетических данных (Sim-to-Real)

AI тренируется в 3D-симуляторе (Isaac Sim от NVIDIA, MuJoCo, PyBullet), где генерируются миллионы случайных объектов с разными формами, текстурами и физическими свойствами. Робот в виртуальной среде пробует тысячи стратегий захвата, и обученная модель затем переносится на реальное оборудование.

Обучение через демонстрацию (Learning from Demonstration)

Оператор вручную проводит робота через задачу несколько раз, а AI обобщает эти примеры. Этот подход используют для быстрого развёртывания новых задач без глубоких знаний программирования.

Обучение с подкреплением (Reinforcement Learning)

Робот самостоятельно экспериментирует, получая «награду» за успешный захват и «штраф» за неудачу. Через миллионы попыток AI находит оптимальную стратегию. Этот метод даёт лучшие результаты, но требует значительных вычислительных ресурсов.

Будущее: что дальше

Следующий шаг — foundation models для робототехники. Так же, как GPT работает с текстом, а DALL-E с изображениями, новые модели (Google RT-2, Open X-Embodiment) учатся понимать физический мир и генерировать действия робота на основе текстовых или визуальных инструкций. Робот сможет выполнить команду «подними красную деталь и поставь её на конвейер» без какого-либо программирования.

Для промышленной автоматизации это означает переход от «настройки каждой задачи» к «объяснению задачи». А компоненты, обеспечивающие движение и контроль — частотные преобразователи, сервоприводы, контроллеры — останутся фундаментом, на котором будет работать следующее поколение интеллектуальных роботов. Подробнее о практическом применении этих компонентов — в нашей статье о применении частотных преобразователей и концепции промышленной автоматизации.

Поширені запитання

Bin picking — это технология автоматического захвата объектов из контейнера, где детали расположены хаотично. Робот с помощью 3D-камеры и нейросети распознаёт отдельные предметы, выбирает оптимальную стратегию захвата и извлекает детали со скоростью менее 1 секунды на захват. Это позволяет автоматизировать загрузку станков ЧПУ, сортировку на складах и упаковочных линиях.