Google звинуватили в персоналізації пошукової видачі навіть у режимі інкогніто

Пошукова система Google персоналізує результати пошукових запитів, навіть якщо користувач вийшов з акаунта Google і використовує приватний режим браузера (режим інкогніто), показало дослідження, проведене іншим пошуковим сервісом DuckDuckGo. Значні відмінності для одних і тих же запитів, введених різними людьми, також торкнулися поля новин у видачі. Вихідні дані дослідження, а також код для їх аналізу опубліковані на GitHub.


Багато сучасних інтернет-сервісів збирають велику кількість інформації про своїх користувачів, і використовують її різними способами. Головний з них - персоналізація сервісу для адаптація під інтереси конкретної людини. Найпомітніший прояв такого підходу - таргетована реклама, що показує товари і послуги, які, на думку алгоритмів, найбільш близькі до інтересів користувача. Однак у персоналізації є ще один аспект, який вже не такий помітний, і тому викликає побоювання дослідників. Пошукові сервіси, соціальні мережі, та інші сайти, часто персоналізують і основну інформацію, таку як результати пошуку або запису користувачів.


Такий підхід викликає побоювання деяких фахівців через можливість утворення «бульбашки фільтрів». Під цим терміном мається на увазі ситуація, при якій сервіс поступово починає видавати користувачеві все більше інформації, що відповідає його інтересам і переконанням, і все менше інформації, що містить іншу точку зору на одні і ті ж події. В результаті, в деяких випадках картина світу, яка сприймається людиною через інтернет, може сильно відрізнятися від реальності, причому для кожного ця картина буде своєю.

Одне з очевидних рішень цієї проблеми - пошук інформації через приватний режим, що не містить даних про відвідування інших сторінок в інтернеті. Нове дослідження показало, що у випадку з пошуком через Google цей метод не такий ефективний, як вважалося раніше. Варто відзначити, що дослідження проведено компанією DuckDuckGo, основний бізнес якої пов'язаний з однойменним пошуковим сервісом. Крім того, методологія дослідження містить в собі спірні моменти. Наприклад, компанія відібрала всього 87 добровольців, прямо сказавши в твіттері про набір людей для дослідження «бульбашки фільтрів» в Google:

Hi all! We're looking for volunteers on Sunday pm to help examine the extent of Google's filter bubble, i.e. how much results are tailored. If you'd like to help and are:* In the US* Able to take screenshots* Happy to answer questionsplease email ""hi"" to Ця електронна адреса захищена від спам-ботів. Вам необхідно увімкнути JavaScript, щоб побачити її.

- DuckDuckGo (@ DuckDuckGo) 21 червня 2018 р.

Добровольців попросили ввести в пошуковий рядок Google три запити щодо гостросоціальних тем: контроль обігу зброї (gun control), імміграція (immigration) і вакцинації (vaccinations). Спочатку учасники вводили ці запити в приватному режимі браузера і будучи не авторизованими в Google, а потім у звичайному режимі.

В результаті дослідники отримали не ідентичні результати для всіх учасників, а 62 різних набори посилань (з урахуванням їх порядку на сторінці). Автори виключили можливість впливу часу пошуку тим, що всі добровольці проходили експеримент одночасно. Крім того, вони проаналізували вплив місця розташування. У пошукових запитах практично не було посилань на локальні ресурси, специфічні для конкретного міста або штату. Оскільки на одній сторінці пошуковика зазвичай відображається десять результатів, дослідники очікували побачити стільки ж доменів, проте серед усіх учасників доменів було близько 20, що також показує відмінність видачі.


Варіація у видачі торкнулася і полів з новинами і відео. Наприклад, за запитом про імміграцію люди побачили різні варіанти новин, причому найпопулярніший набір новин за темою побачили тільки 46 відсотків добровольців. Крім того, дослідники порівняли рівень варіативності результатів у приватному і звичайних режимах, і з'ясували, що він слабо розрізняється. Вихідні дані дослідження і код для їх аналізу опубліковані на GitHub.

У 2017 році група американських дослідників показала, що рекламні мережі в інтернеті можуть бути використані для відстеження конкретних людей, причому не тільки власником мережі, але і сторонніми людьми та організаціями. У рамках експерименту вони створили безліч оголошень, таргетованих на конкретний ідентифікатор користувача і на певні місця розташування. В результаті їм вдалося скласти карту переміщень конкретної людини по місту.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND