Ультразвук дозволив приховано керувати голосовими помічниками

Інженери з Чжецзянського університету навчилися створювати нечувані для людей ультразвукові команди, які голосові помічники на смартфонах та інших пристроях сприймають так само, як і людську мову. Для того, щоб смартфон почув команди, ультразвуковий передавач повинен перебувати близько до нього і в не дуже галасливій обстановці. Також дослідники запропонували і спосіб захисту від такої атаки. Препринт опубліковано на сайті arXiv.org.


Голосові помічники вже є практично у всіх смартфонах, аналогічні технології використовуються в різних центрах управління розумним будинком, таких як Google Home або Amazon Echo. Вони можуть виконувати різні завдання, в тому числі дзвонити, посилати повідомлення або читати їх, вести фото і відеозйомку, а також володіють доступом до багатьох інших конфіденційних даних. Через це в останні роки часто з'являються повідомлення про нові методи злому таких програм.


Китайські дослідники вирішили створити метод злому, який буде універсальним для всіх платформ, і при цьому непомітним для жертви. Щоб атака була непомітною, інженери використовували ультразвук. Вони модулювали записи команд таким чином, щоб вихідний сигнал мав частоту, що не сприймається людським вухом. Однак, оскільки практично всі мікрофони в смартфонах містять фільтр нижніх частот, дослідникам довелося знайти спосіб назад перетворювати ультразвуковий сигнал на сприймається мікрофоном. Для цього вони скористалися неминучими нелінійними спотвореннями в мікрофонах і підсилюваннях, які створювали нові частоти вже в мікрофоні, а таким чином демодулювали сигнал.

Дослідники випробували методику з кількома голосовими помічниками. Один з них - Apple Siri - виявився трохи більш стійким до такої атаки за рахунок того, що він запам'ятовує голос господаря і відгукується тільки на нього. Інженери запропонували записувати невеликий фрагмент мови власника, вичленовувати з нього потрібні звуки, а потім формувати з них команди, які смартфон прийме за команди господаря. До речі, минулого року Google створив нейромережу, яка може реалістично імітувати промову людей, що також може бути використано для таких атак.

У такого методу злому є чимало обмежень. Наприклад, зловмисник або його обладнання з ультразвуковим випромінювачем повинні перебувати не далі, ніж в 1,75 метра від цілі. Також інженери протестували злом при різних рівнях навколишнього шуму, і якщо в умовах офісу розпізнавання було успішним в переважній більшості випадків, то на вулиці частка успішних команд знижувалася до 30 відсотків. В якості захисту від атаки за допомогою ультразвуку дослідники пропонують використовувати метод опорних векторів, який дозволить відрізнити такі команди від команд, вимовлених людиною.

Голосових помічників часто розглядають як зручну мету для атаки хакерів. Наприклад, нещодавно британський фахівець з інформаційної безпеки розробив спосіб злому смарт-динаміка Amazon Echo, завдяки якому зловмисники зможуть дистанційно прослуховувати все, що відбувається в будинку власника цього пристрою. Інші дослідники навпаки шукають методи захисту від атак через таких помічників. Наприклад, американські дослідники запропонували вимірювати невеликі обурення магнітного поля, створювані динаміками, і таким чином відрізняти реальний людський голос від його запису, відтвореного через динамік.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND