Інженери з лабораторії штучного інтелекту Uber AI Labs розробили сімейство алгоритмів Go-Explore, заснованих на навчанні з підкріпленням, які перевершують за ефективністю більшість існуючих алгоритмів у тестах на іграх Atari 1980-х років. Go-Explore пройшов 11 вважаються найбільш складними для навчання з підкріпленням ігор, включаючи Montezuma's Revenge і Pitfall, обійшовши за набраними в них очками більшість інших алгоритмів і середній людський результат. Основною особливістю Go-Explore стала здатність запам'ятовувати попередні перспективні стани і повертатися в них, здійснюючи звідти подальшу розвідку, що дозволяє підвищити ефективність алгоритму навчання з підкріпленням. Розробники продемонстрували можливе практичне застосування Go-Explore для робототехніки в завданні управління маніпулятором робота. Крім того в майбутньому алгоритм може бути корисний у вирішенні безлічі інших завдань від обробки природних мов до створення нових ліків, йдеться в роботі, опублікованій в журналі
COM_SPPAGEBUILDER_NO_ITEMS_FOUND