Комп'ютер освоїв StarCraft на рівні досвідчених гравців

Дослідники з китайської компанії Alibaba Group і Університетського коледжу Лондона продемонстрували комп'ютерну програму, яка самостійно освоїла в StarCraft деякі тактики, що використовуються досвідченими гравцями. Дослідження доступне на ArXiv.org.


Останнім часом штучний інтелект почав обігравати людей в ігри, які раніше комп'ютер не міг освоїти на рівні професійних гравців. Спочатку програма AlphaGo "перемогла людство в го", вигравши у одного з найсильніших гравців у світі, потім програма Libratus перемогла в 20-денному покерному турнірі "Brains Vs. Artificial Intelligence: Upping the Ante ", обігравши чотирьох професійних гравців в покер. Тим не менш, в деяких іграх з неповною інформацією комп'ютер все ще поступається людині, і поки що однією з таких ігор залишається перший StarCraft.


У новій роботі дослідники розповіли про прогрес комп'ютерного гравця, який для навчання використовує двонаправлено-скоординовану мережу (Bidirectionally-Coordinated Net, BiCNet) на основі рекуррентних нейромереж. За словами авторів, BiCNet краще за інші існуючі нейромережі підходить для навчання і взаємодії кількох агентів (підконтрольних ШІ бойових одиниць).

Представлена авторами програма самостійно досягла певних успіхів в області мікроконтролю юнітів при веденні бою в StarCraft. Для навчання використовувалися тестові битви - наприклад, три піхотинці проти зерглінгу з великою кількістю здоров'я. Спочатку піхотинці постійно стикалися один з одним, тікаючи від зерглінгу, але після 50 повторень битви і більш ніж 40 тисяч кроків агенти навчилися розбігатися від ворога практично бездоганно.

Крім переміщення юнітів з мінімальним блокуванням шляху прямування один одного ШІ також самостійно освоїв різні тактики ведення бою. Програма освоїла базову тактику «Hit & Run» («Вдарив-втік»), при якій один або кілька агентів з дистанційною атакою починають вести вогонь по противнику, проте потім відступають на умовно безпечну відстань. Також комп'ютер освоїв більш складну тактику, атаку прикриваючим вогнем, - кілька агентів використовують тактику «Hit & Run», поки один з них не буде обраний ворогом в якості основної мети, інші агенти при цьому продовжують вести зосереджений вогонь по ворогу.

Крім того, розробники продемонстрували, що комп'ютерний гравець освоїв зосереджене ведення вогню по одній меті малими групами, що дозволяє ефективно знищувати юніти противника в бою. Також штучний інтелект навчився враховувати можливості юнітів різного типу, при цьому в бою враховуються як можливості агентів (наприклад, десантні кораблі використовуються для того, щоб заховати танки від ультралісків), так і можливості ворога (ШІ при битві з муталісками розосереджує свої юніти, щоб снаряди-симбіонти не могли вразити кількох агентів).

Варто відзначити, що мікроконтроль може забезпечити в бою перемогу навіть при значно переважаючих силах противника. Однак крім цього в StarCraft необхідно приймати ще й глобальні стратегічні рішення - будувати будівлі, купувати поліпшення і оперативно відвойовувати ресурси. Загальну «просунутість» програми можна буде оцінити після участі її в Starcraft AI Competition - це щорічні змагання серед спеціалізованих алгоритмів.

Стратегія в реальному часі StarCraft разом з доповненням Brood War була випущена Blizzard в 1998 році. StarCraft прийнято вважати однією з найважливіших ігор у кіберспорті. Незважаючи на солідний для комп'ютерної гри вік і вже вийшла другу частину великі турніри за StarCraft: Нещодавно Blizzard Entertainment офіційно оголосила про створення ремайстернг-версії StarCraft, реліз запланований на літо 2017 року.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND