Универсальный робот должен легко переключаться между задачами, например после уборки дома без пауз перейти к приготовлению ужина. Однако обучение такого робота пока остается проблемой. Сегодня инженеры сначала собирают данные для конкретной задачи, а затем тренируют робота в контролируемой среде. Сложность здесь в том, что обученному роботу уже трудно адаптироваться к новым задачам и новой среде.
Обычно во время тренировки робот получает данные от датчиков, например изображения с камер, а также информацию о движении своих приводов и манипуляторов. Зачастую робота учат имитировать действия человека, например движения его руки. Базами данных о роботах располагают множество фирм, но их трудно свести в единую, так как каждый робот уникален по конструкции, а их обучающие среды сильно отличаются. Робототехники часто говорят, что данных для обучения не хватает, но корень проблемы лежит в их разнообразии.
Чтобы лучше обучать роботов общего назначения, исследователи во главе с профессором Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института Каимингом Хе (Kaiming He) разработали универсальную методику, которая объединяет в систему разнородные данные множества источников. Авторы нового подхода черпали вдохновение в больших языковых моделях вроде знаменитого ChatGPT. Языковые модели сначала тренируют на огромном количестве разнообразных, но однородных символьных данных. Затем пользователь настраивает ИИ для конкретной задачи с помощью небольшого числа своих запросов. Это позволяет быстро адаптировать модели к различным заданиям.
За основу ученые взяли базовую для машинного обучения нейронную сеть типа трансформер. Здесь самой большой проблемой была широкая информационная база для предобучения. Ею стали 52 набора данных о двухстах тысячах траекторий движения роботов. Ученые привели к стандартному виду каждый входной сигнал трансформера, представляющий разные по смыслу характеристики. Им удалось объединить данные разных роботов и предварительно обучить сеть по аналогии с языковыми моделями. Теперь для ее дообучения надо только предоставить небольшой объем информации о конструкции своего робота, его настройках и конкретной задаче. И в модельных экспериментах, и в реальных условиях новая сеть превзошла обучаемого с нуля робота.
Профессор Хе говорит, что хочет создать универсальный мозг, который можно загрузить в робота и использовать вообще без обучения. Разные люди смогут адаптировать его под свои задачи, как сегодня они поступают с компьютерами. Исследование представлено на конференции по нейронным системам обработки информации (ArXiv).