Що таке Deepfake, і я повинен бути стурбований?

Ми схильні довіряти змісту відео та аудіо записів. Але з ШІ обличчя або голос будь-якої людини можуть бути відтворені з високою точністю. Продукт являє собою deepfake, уособлення, які можуть бути використані для мемів, дезінформації або порно.

Один погляд на глибокі підробки Ніколаса Кейджа або глибокий підроблений PSA Джордана Піла дає зрозуміти, що ми маємо справу з дивною новою технологією. Ці приклади, хоча і відносно нешкідливі, викликають питання про майбутнє. Чи можемо ми довіряти відео і аудіо? Чи можемо ми притягнути людей до відповідальності за свої дії на екрані? Ми готові до підробок?

Deepfakes - нові, легені у виготовленні і швидко зростаючі

Технології Deepfake всього кілька років, але вона вже перетворилася на щось захоплююче і тривожне. Термін «глибокий обман», який був придуманий на нитці Reddit в 2017 році, використовується для опису відтворення зовнішнього вигляду або голосу людини за допомогою штучного інтелекту. Дивно, але майже кожен може створити глибоку підробку з лайновим ПК, деяким програмним забезпеченням і кількома годинами роботи.

Як і у випадку з будь-якою новою технологією, існує деяка плутанина навколо фальшивок. Відео «П'яна Пелосі» є чудовим прикладом цієї плутанини. Глибокі підробки створюються ШІ, і вони створені, щоб видавати себе за людей. Відео «dunk Pelosi», яке називають «глибоким підробленням», насправді є просто відео Ненсі Пелосі, яке було уповільнено і виправлено по висоті, щоб додати ефект нечіткої мови.

Це також те, що відрізняє Deepfakery від, скажімо, CGI Керрі Фішер в Star Wars: Rogue One. У той час як Дісней витратив купу грошей, вивчаючи обличчя Керрі Фішер і відтворюючи його від руки, ботанік з якимось глибоким програмним забезпеченням може зробити ту ж роботу безкоштовно протягом одного дня. ШІ робить роботу неймовірно простою, дешевою і переконливою.

Як зробити Deepfake

Як учень у класі, ШІ повинен «навчитися» виконувати поставлені перед ним завдання. Це відбувається за допомогою процесу проб і помилок методом грубої сили, зазвичай званого машинним навчанням або глибоким навчанням. Наприклад, ШІ, призначений для проходження першого рівня Super Mario Bros., буде грати в гру знову і знову, поки не з'ясує кращий спосіб виграти. Людина, що проектує ШІ, повинна надати деякі дані для початку роботи, а також кілька «правил», коли щось піде не так по дорозі. Крім того, AI робить всю роботу.

Те ж саме стосується і глибокого догляду за обличчям. Але, звичайно, відтворення осіб - це не те ж саме, що перемога у відеогрі. Якби нам потрібно було створити глибоку підробку Ніколаса Кейджа, де буде проходити шоу Венді Вільямс, ось що нам потрібно:

  • Відео призначення: на даний момент глибокі підробки найкраще працюють з чистими, чистими відео призначення. Ось чому деякі з найбільш переконливих підробок - це політики; вони мають тенденцію стояти на подіумі при постійному освітленні. Отже, нам просто потрібно відео, де Венді сидить і розмовляє.
  • Два набори даних: щоб рухи рота і голови виглядали точними, нам потрібен набір даних особи Венді Вільямс і набір даних обличчя Ніколаса Кейджа. Якщо Венді дивиться направо, нам потрібна фотографія Ніколаса Кейджа, який дивиться праворуч. Якщо Венді відкриває рот, нам потрібна фотографія Кейджа, що відкриває рот.

Після цього ми дозволяємо ШІ робити свою роботу. Він знову і знову намагається створити глибоку підробку, навчаючись на своїх помилках на своєму шляху. Просто, правда? Ну, відео з зображенням обличчя Кейджа на тілі Венді Вільям нікого не обдурить, так як ми можемо піти трохи далі?

Найбільш переконливими (і потенційно шкідливими) підробками є тотальні наслідування. Популярний Обама Deepfake Джордан Піл є хорошим прикладом. Отже, давайте зробимо одне з цих наслідувань. Давайте створимо глибоку підробку Марка Цукерберга, який оголошує його ненависть до мурашок - це звучить переконливо, вірно? Ось що нам потрібно:

  • Відео призначення: це може бути відео самого Цукерберга або актора, який схожий на Цукерберга. Якщо наше відео призначене для актора, ми просто приклеїмо обличчя Цукерберга до актора.
  • Фото: нам потрібні фотографії, на яких Цукерберг каже, моргає і рухає головою. Якщо ми накладаємо його обличчя на актора, нам також знадобиться набір даних про рухи обличчя актора.
  • The Zuck’s Voice: наш глибокий підробка повинен звучати як The Zuck. Ми можемо зробити це, записавши наслідувача або відтворивши голос Цукерберга з ШІ. Щоб відтворити його голос, ми просто запускаємо аудіосемпли Цукерберга через штучного інтелекту, такого як Лірохвіст, і потім друкуємо те, що хочемо, щоб він сказав.
  • ШІ з синхронізацією по губах: оскільки ми додаємо в наше відео голос фальшивого Цукерберга, ШІ щодо синхронізації з губами повинен переконатися, що глибокі фейкові рухи особи відповідають тому, що говориться.

Ми не намагаємося применшити роботу і досвід, які вкладаються в глибоку підробку. Але порівняно з роботою CGI за мільйон доларів, яка повернула Одрі Хепберн з мертвих, глибокі підробки - це прогулянка в парку. І хоча ми ще не закохалися в глибоких підробок політичних або знаменитостей, навіть найбільш грубі, найочевидніші глибокі підробки завдали реальної шкоди.

Deepfakes вже заподіяли шкоду реальному світу

Станом на даний момент, більшість deepfakes тільки Ніколас Кейдж мема, оголошення державних служб і моторошна знаменитість порно. Ці торгові точки відносно нешкідливі і їх легко ідентифікувати, але в деяких випадках підробки успішно використовуються для поширення дезінформації і нанесення шкоди життю інших людей.

В Індії індуїстські націоналісти використовують підробок для дискредитації та підбурювання до насильства щодо жінок-журналістів. У 2018 році журналіст на ім'я Рана Айюб став жертвою до такої кампанії дезінформації, яка включала deepfake відео її обличчя накладається на порнографічне відео. Це призвело до інших форм переслідування в Інтернеті і загрози фізичного насильства.

Stateside, deepfake технологія часто використовується для створення nonconsensual помсти порно. Як повідомив віце багато користувачів нині заборонений deepfakes Reddit форум запитав, як створити deepfakes колишніх подружок, закоханостей, друзів і однокласників (так, дитяче порно). Проблема настільки велика, що Вірджинія в даний час забороняє всі форми неконсенсуальної порнографії, в тому числі deepfakes.

Оскільки глибокі підробки стають все більш переконливими, технологія, безсумнівно, буде використовуватися для більш сумнівних цілей. Але є шанс, що ми занадто гостро реагуємо, вірно? Хіба це не найбільш природний крок після фотошопу?

Глибокі підробки - природне продовження зображень з лікарями

Навіть на самому базовому рівні глибокі підробки викликають тривогу. Ми довіряємо відео і аудіо записам, щоб відобразити слова і дії людей без будь-якої упередженості або дезінформації. Але, в деякому сенсі, загроза глибоких підробок зовсім не нова. Він існує з тих пір, як ми вперше почали використовувати фотографію.

Взяти, наприклад, кілька фотографій Авраама Лінкольна, які існують. Більшість цих фотографій (включаючи портрети на пенні і п'ятидоларову купюру) були сфокусовані фотографом на ім'я Метью Бреді, щоб поліпшити зовнішність Лінкольна (особливо його тонку шию). Деякі з цих портретів були відредаговані способом, що нагадує глибокі підробки, з головою Лінкольна, накладеною на тіла «сильних» людей, таких як Калхун (приклад нижче - це гравюра, а не фотографія).

Це звучить як дивна реклама, але в 1860-х роках фотографія несла певну кількість «правди», яку ми тепер залишаємо за відео і аудіо записами. Це вважалося полярною протилежністю мистецтва - науки. Ці фотографії були сфабриковані, щоб навмисно дискредитувати газети, які критикували Лінкольна за його слабке тіло. Зрештою, це спрацювало. Американці були вражені фігурою Лінкольна, і сам Лінкольн стверджував, що фотографії Бреді «зробили мене президентом».

Зв'язок між Deepfakes і редагуванням фотографій 19-го століття дивно втішний. Він пропонує нам розповідь про те, що, хоча ця технологія має серйозні наслідки, вона не знаходиться поза нашим контролем. Але, на жаль, ця розповідь не може тривати дуже довго.

Ми не зможемо виявити Deepfakes назавжди

Ми звикли бачити підроблені зображення і відео нашими очима. Легко поглянути на сімейний портрет Джозефа Геббельса і сказати: «Щось дивне в цьому хлопці ззаду». Погляд на пропагандистські фотографії Північної Кореї показує, що без підручників на YouTube люди смокчуть у Photoshop. І наскільки б вражаючими не були глибокі підробки, все ще можна розгледіти глибоку підробку поодинці.

Але ми не зможемо виявити глибоких підробок набагато довше. З кожним роком глибокі підробки стають все більш переконливими і їх легше створювати. Ви можете зробити глибоку підробку з однією фотографією, і ви можете використовувати AI, як Lyrebird, щоб клонувати голоси менш ніж за хвилину. Високотехнологічні глибокі підробки, які об'єднують підроблене відео та аудіо, неймовірно переконливі, навіть якщо вони створені для того, щоб наслідувати впізнаваних персонажів, таких як Марк Цукерберг.

У майбутньому ми можемо використовувати ШІ, алгоритми і технології блокчейна для боротьби з фальшивками. Теоретично, AI може сканувати відео, щоб знайти «підроблені відбитки пальців», а технологія блокчейна, встановлена в операційних системах, може позначати користувачів або файли, які стосувалися DeepFake.

Якщо ці анти-фальшиві методи звучать для вас нерозумно, вступайте в клуб. Навіть дослідники ШІ сумніваються в тому, що є правильне рішення для підробок. У міру того, як програмне забезпечення для виявлення стає кращим, будуть і фальшиві. Зрештою, ми досягнемо точки, де deepfakes буде неможливо виявити, і ми будемо мати набагато більше турбуватися про що підроблені знаменитості порно і Ніколас Кейдж відео.