Роботи навчилися не чіпати чуже

Американські розробники представили систему, яка навчає штучний інтелект поняттю володіння об'єктами. Така система складається з чотирьох алгоритмів, кожен з яких збирає інформацію про власника об'єкта і те, які дії до нього можна застосовувати. Препринт статті опубліковано на arXiv.org.


Однією з необхідних для успішної комунікації соціальних норм вважається поняття володіння: у звичайній ситуації у людей не прийнято розпоряджатися чужим майном без дозволу. Крім того, норма ця не тільки соціальна, але також етична і правова, і її відсутність може призвести до негативної реакції і небажаних наслідків.


Для успішної інтеграції роботів в людське суспільство вміння дотримуватися норм володіння необхідно і штучному інтелекту. Дослідники під керівництвом Брайана Сказеллаті з Єльського університету розробили єдину систему, за допомогою якої роботів можна навчити базовим принципам володіння.

Система працює на основі чотирьох алгоритмів. Перший алгоритм збирає інформацію про власників об'єктів на прикладі фрази «Це моє», сказаної власником. Другий алгоритм, навпаки, навчається правилам, відповідно до яких людина не є володарем об'єкта. Третій і четвертий алгоритм запам'ятовують правила, які поширюються власниками на об'єкти в їх володінні: наприклад, позначають те, що з об'єктами можна або не можна робити. Поняття «володіння», таким чином, представляється для навчаної системи у вигляді графа, в якому вершини являють собою об'єкти і потенційних власників, а ребра - відносини між ними, і великого масиву правил, що регулюють прийнятну і неприйнятну взаємодію робота з предметами. Наприклад, якщо дослідник попросить викинути якийсь об'єкт, система зможе звернутися до доступної йому інформації про те, що цей об'єкт комусь належить і, отже, не може бути викинутий, а потім відмовитися.

Отриману систему інтегрували в робота Baxter і провели експеримент з об'єктами - різнокольоровими кубиками - і їх володарями: різні люди просили робота піднімати або викидати різні об'єкти. З вбудованою системою визначення володіння робот успішно визначив валідність прохань дослідників для 14 об'єктів з 20.

Незважаючи на успішну роботу представленої системи, вчені відзначають, що поки що вона спрямована тільки на аналіз власної оцінки володіння об'єктами, тобто щодо дій самого робота. У майбутньому вчені також хочуть розширити можливості своєї системи, навчивши її, наприклад, поняття запозичення, при якому, крім власника, об'єкт може - в тій чи іншій мірі - бути використаний і іншими.

При навчанні штучного інтелекту багато дослідників відзначають упередженість даних, які використовуються для машинного навчання. Наприклад, взявши в якості навчальної вибірки тематичні тексти, можна навчити нейромережу «мислити» як психопат.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND