Исследователи из группы AMOLF Soft Robotic Matter показали, что группа небольших автономных самообучающихся роботов может легко адаптироваться к меняющимся обстоятельствам. Они соединили этих простых роботов в линию, после чего каждый отдельный робот научился двигаться вперед как можно быстрее. Результаты были опубликованы сегодня в научном журнале PNAS .
Роботы — гениальные устройства, которые могут очень многое. Есть роботы, которые могут танцевать и ходить вверх и вниз по лестнице, и стаи дронов, которые могут независимо летать в строю, и это лишь некоторые из них. Однако все эти роботы в значительной степени запрограммированы — в их мозг заранее заложены различные ситуации или шаблоны, они управляются централизованно или сложная компьютерная сеть обучает их поведению с помощью машинного обучения. Бас Овервельде, главный исследователь группы Soft Robotic Matter в AMOLF, хотел вернуться к основам: создать максимально простой самообучающийся робот. «В конечном итоге мы хотим иметь возможность использовать самообучающиеся системы, построенные из простых строительных блоков, которые, например, состоят только из такого материала, как полимер. Мы также называем их роботизированными материалами».
Исследователям удалось получить очень простые взаимосвязанные роботизированные тележки, которые перемещаются по рельсам, чтобы узнать, как они могут двигаться с максимальной скоростью в определенном направлении. Тележки сделали это, не запрограммировав маршрут и не зная, что делают другие тележки-роботы. «Это новый образ мышления в разработке самообучающихся роботов. В отличие от большинства традиционных программируемых роботов, этот вид простого самообучающегося робота не требует каких-либо сложных моделей, позволяющих ему адаптироваться к сильно меняющейся среде», — сказал он. объясняет Овервельде. «В будущем это может найти применение в мягкой робототехнике, например, в роботизированных руках, которые узнают, как можно поднимать различные объекты, или в роботах, которые автоматически адаптируют свое поведение после получения повреждений».
Самообучающаяся система состоит из нескольких связанных строительных блоков размером в несколько сантиметров, отдельных роботов. Эти роботы состоят из микроконтроллера (миникомпьютера), датчика движения, насоса, который нагнетает воздух в сильфон, и иглы для выпуска воздуха. Эта комбинация позволяет роботу как бы дышать. Если вы соедините второго робота с помощью мехов первого робота, они оттолкнут друг друга. Это то, что позволяет перемещать весь роботизированный поезд. «Мы хотели сделать роботов как можно более простыми, поэтому мы выбрали сильфоны и воздух. Многие мягкие роботы используют этот метод», — говорит доктор философии. студент Луук ван Лааке.
Единственное, что исследователи делают заранее, это сообщают каждому роботу простой набор правил с помощью нескольких строк компьютерного кода (короткий алгоритм): включайте и выключайте насос каждые несколько секунд — это называется циклом — а затем постарайтесь как можно быстрее двигаться в определенном направлении. Чип на роботе постоянно измеряет скорость. Каждые несколько циклов робот вносит небольшие изменения в момент включения насоса и определяет, ускоряют ли эти настройки роботизированный поезд. Поэтому каждая роботизированная тележка постоянно проводит небольшие эксперименты.
Если вы позволите двум или более роботам толкать и тянуть друг друга таким образом, поезд рано или поздно пойдет в одном направлении. Следовательно, роботы узнают, что это лучшая настройка для их насоса без необходимости общаться и без точного программирования того, как двигаться вперед. Система медленно оптимизируется. Видео, опубликованные вместе со статьей, показывают, как поезд медленно, но верно движется по круговой траектории.
Исследователи использовали две разные версии алгоритма, чтобы увидеть, какая из них работает лучше. Первый алгоритм сохраняет лучшие измерения скорости робота и использует их для определения наилучшей настройки насоса. Второй алгоритм использует только последнее измерение скорости, чтобы определить лучший момент для включения насоса в каждом цикле. Последний алгоритм работал намного лучше. Он может справляться с ситуациями, не запрограммировав их заранее, потому что он не тратит время на поведение, которое могло хорошо сработать в прошлом, но больше не работает в новой ситуации. Например, он мог быстро преодолевать препятствие на траектории, тогда как роботы, запрограммированные другим алгоритмом, останавливались. «Если вам удастся найти правильный алгоритм, то эта простая система будет очень надежной», — говорит Овервельде. »
Какими бы простыми они ни были, исследователи считают, что роботы ожили. В одном из экспериментов они хотели повредить робота, чтобы увидеть, как восстановится вся система. «Мы удалили иглу, которая действует как насадка. Это было немного странно. Как будто мы снимали ее ножку». Роботы также адаптировали свое поведение в случае этого увечья, чтобы поезд снова двинулся в правильном направлении. Это было еще одним свидетельством надежности системы.
Систему легко масштабировать; исследователям уже удалось создать движущийся поезд из семи роботов. Следующий шаг — создание роботов с более сложным поведением. «Одним из таких примеров является конструкция, похожая на осьминога, — говорит Овервельде. «Интересно посмотреть, будут ли отдельные строительные блоки вести себя как руки осьминога. У них также есть децентрализованная нервная система , своего рода независимый мозг, как и наша роботизированная система».
Дополнительная информация: Джорджио Оливери и др., «Непрерывное изучение эмерджентного поведения в роботизированной материи», PNAS (2021 г.). www.pnas.org/cgi/doi/10.1073/pnas.2017015118