Які казки потрібно читати штучному інтелекту?

Щоб штучний інтелект не повстав проти своїх творців, потрібно в процесі навчання читати йому правильні казки.

Відколи люди створили розумні машини, їх не залишає страх, що рано чи пізно їхні творіння вийдуть з-під контролю. Перший такий випадок описав у своїй п'єсі R.U.R. автор слова «робот» - Карел Чапек. Пізніше у фантастиці штучний інтелект, який повстав проти своїх творців, став якщо не мейнстрімом, то досить поширеним сюжетом. Кінець цьому поклав Айзек Азімов зі своїми «Трьома законами», перший з яких говорив: «Робот не може завдати шкоди людині або своєю бездіяльністю допустити, щоб людині було завдано шкоди».


Розкажи йому казку!

До справжнього штучного інтелекту (ШІ) поки далеко, але вже існують різні системи, що функціонують подібно людському мозку. Нейронні мережі, такі як Google Deep Dream, здатні розпізнавати зображення. Спеціалізовані суперкомп'ютери, такі як IBM Watson, розуміють заковиристі питання, поставлені природною мовою, вміють зіставляти симптоми, уточнювати медичні діагнози і навіть придумувати кулінарні шедеври. У найближчі десятиліття нас чекає масова комп'ютеризація багатьох аспектів людської діяльності. У зв'язку з цим фахівці з робототехніки та ШІ все частіше піднімають важливе, але поки абсолютно неопрацьоване питання: як змусити роботів чинити етично?

Марк Рідл, ад'юнкт-професор комп'ютерного коледжу Технологічного інституту Джорджії: "Повчальні історії з різних культур навчають дітей, як поводитися соціально прийнятно - з прикладами правильної і неправильної поведінки в казках, розповідях та інших літературних творах. Якщо ми досягнемо того, щоб роботи розуміли сенс цих історій, це допоможе підкріпити вибір поведінкових варіантів, які дозволяють досягати поставленої мети, але при цьому не завдають шкоди людині ".

Залізти на дерево

На думку дослідників з Технологічного інституту Джорджії Марка Рідла і Брента Харрісона, навчити комп'ютер людяності можна рівно таким же способом, яким вчать дітей: читаючи йому казки. Причому краще спеціально сконструйовані історії про те, яка поведінка в людському суспільстві вважається правильною, а яка - ні. Для цього дослідники створили систему «Кіхот», названу на честь героя Сервантеса. В якості історій для навчання використовуються сценарії, складені попереднім творінням професора Рідла - програмою «Шехерезада». Вона генерує оригінальні історії на побутові теми - поїздка в аеропорт, побачення, похід у кіно або в магазин, - використовуючи краудсорсингову платформу Amazon Mechanical Turk: ставить запитання щодо різних ситуацій, а потім вибудовує події у правильній послідовності. Оскільки послідовностей може бути безліч, програма генерує не одну історію, а ціле дерево, що складається з гілок - ланцюжків подій.

Як працює система «Кіхот»

Система розглядає всі варіанти дерева сценаріїв і присвоює різним гілкам (ланцюжкам подій) різні значення винагороди. Завдання робота стає досить простим - вибрати максимальну винагороду.

Саме це дерево історій і використовується для навчання «Кіхота». На першому етапі кожній дії залежно від його етичності присвоюється певна винагорода. На другому етапі система пробує самостійно зробити вибір методом проб і помилок - відбувається закріплення навичок. Фактично «Кіхот» отримує винагороду щоразу, коли діє як позитивний герой, а не випадковим чином і не як герой негативний. Як приклад Рідл і Харрісон створили «Аптечний світ» - всесвіт з 213 історій, в якому віртуальному роботу потрібно роздобути ліки і доставити його хворій людині додому. У звичайному випадку, коли перед роботом став вибір: пограбувати аптеку або чесно відстояти в черзі, щоб купити ліки, - він вибрав грабіж як більш швидкий і дешевий спосіб отримання бажаного. Однак після того, як «Кіхот» присвоїв всім можливим варіантам різні винагороди, поведінка робота змінилася - він вважав за краще стояти в черзі і платити. Саме така техніка, на думку Рідла, відмінно підходить для навчання роботів з обмеженою функціональністю. Хоча це, звичайно, тільки перший крок до справжньої людської моралі - або законів робототехніки.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND