Нові ноги не завадили роботу вчитися ходити

Інженери з Disney Research розробили алгоритм для роботів, що дозволяє їм самостійно адаптуватися до змін конфігурації. З його допомогою робот-павук зміг навчитися ходити вперед після того, як інженери приєднали до нього нові ноги. Розробка була представлена на конференції International Conference on Ubiquitous Robots 2018.


Деякі тварини вміють не тільки вчитися ходити після народження, але і досить швидко адаптувати свої рухи навіть після втрати кінцівок. Наприклад, такою здатністю володіють сіножаті - у разі, якщо їх схопив хижак, вони можуть відкинути кінцівку і згодом практично повністю відновити свою швидкість пересування і здатність до маневрування.


Інженери з Disney Research під керівництвом Кацу Ямане (Katsu Yamane) з Disney Research вирішили навчити роботів підлаштовувати свої навички ходьби під нові конфігурації, але не для боротьби з хижаками, а для того, щоб полегшити створення алгоритмів для складних роботів з безліччю ніг. У своїй роботі автори використовували розробленого минулого року шестиногого робота Snapbot. Кожна його нога від'єднується від корпусу, причому передбачено три трохи різноманітних види ніг. У результаті робот може мати 700 різних конфігурацій. У випадку з однаковими і симетрично встановленими ногами підібрати оптимальну ходку вручну не так складно, але для асиметричних модифікацій це набагато важче, тому інженери вирішили, що легше навчити робота робити це самостійно.

Розробники обрали для цього метод навчання з підкріпленням, при якому навчаний алгоритм отримує відгук від середовища, що відповідає успішності його дій. В результаті, алгоритм поступово виробляє стратегію, при якій він отримує від середи максимальну нагороду. Оскільки в разі складної морфології роботу складно вчитися навіть таким способом, інженери вирішили трохи полегшити завдання - використовувати навик, вивчений для простої конфігурації, як вихідні дані при навчанні ходінню з більш складною конфігурацією. Спочатку робот вчився ходити з однією ногою, а при навчанні ходьбі з кількома ногами розробники дублювали вивчену навичку для кожної ноги.

Інженери створили автоматизоване середовище навчання, що дозволяє навчати алгоритм на реальному обладнанні, а не на моделі, яка не враховує реальну поведінку з'єднань між деталями та інші особливості. Система складається з відеокамери, яка відстежує, чи знаходиться робот в заданій області, і механізму з тросом, який повертає робота назад, коли він перетнув віртуальний кордон. У результаті робот самостійно навчився повзати або дертися з однією ногою, а потім зміг перенести ці навички на інші конфігурації з двома і трьома ногами і трьома видами ніг.

Торік група інженерів з Массачусетського технологічного інституту розробила систему, що дозволяє переносити вивчені навички між роботами різної конструкції. Наприклад, автори змогли успішно передати гуманоїдному роботу Atlas навички, отримані роботом Optimus.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND