Исследование Mozilla: рекламщикам достаточно истории 150 посещённых доменов для идентификации пользователя

отметили
40
человек
в архиве

Сотрудники Mozilla провели новое исследование, которое подтвердило, что браузерные истории просмотров позволяют идентифицировать пользователей. Они выяснили, что большинство юзеров следуют привычным схемам просмотра веб-страниц, и это позволяет онлайн-рекламодателям создавать их точные профили.

источник: hsto.org

Это исследование стало продолжением аналогичной работы, которую уже провели в 2012 году. Первое исследование было одним из крупнейших проектов по анализу конфиденциальности пользователей в то время, а его авторы собрали данные истории браузера от более чем 380 тысяч пользователей. До этого, в период с января 2009 года по май 2011 года они попросили пользователей зайти на тестовый сайт. Там использовался умный CSS-код, чтобы определить, какие сайты из заранее составленного списка на 6000 доменов посетили люди из тестовой группы.

Исследование 2012 года показало, что 97% пользователей, которые заходили на этот сайт, имели уникальный список сайтов в своей истории посещений, что делало историю браузера фактически цифровым отпечатком.

Когда пользователей попросили снова зайти на тестовый сайт, он смог идентифицировать их на основе ранее составленных профилей. Точность составляла 38%, когда исследователи рассматривали наборы данных истории просмотров 50 самых популярных доменов пользователя, и 70%, когда они анализировали наборы данных с 500 доменами.

Новый эксперимент Mozilla проходил с 16 июля по 13 августа 2019 года. В нем принимали участие пользователи Firefox, всего более 52 тысяч человек. Они согласились предоставить данные о просмотрах на анонимной основе.

Однако на этот раз, поскольку данные были собраны из самого Firefox, а не через веб-страницу, они были гораздо более точными. Они относятся к тому же типу данных, которые современные компании собирают о пользователях-либо через партнерские соглашения, либо через мобильные приложения и онлайн-рекламу.

Как и в первый раз, сбор данных проходил в два этапа, в течение двух недель. Пользователи делились историей просмотров в первую неделю, а затем еще раз — во вторую.

В общей сложности, была собрана информация о 35 млн посещений веб-сайтов в 660 000 уникальных доменах. Mozilla заявила, что 99% профилей просмотров были уникальными. Точность идентификации в этот раз была выше, чем в исследовании 2012 года. Показатель повторной идентификации вырос до более чем 80%, когда исследователи Mozilla расширили набор данных истории просмотров до 150 доменов.


В исследовании отмечается, что рекламодателям не нужны длинные списки сайтов, к которым мы обращаемся в принципе, а достаточно 50-150 любимых ресурсов пользователя. По ним и составляют профили людей.

Кроме того, эти данные можно использовать для отслеживания и повторной идентификации конкретных пользователей в различных наборах данных, содержащих даже небольшие образцы истории посещений.

Добавил ramstor ramstor 2 Сентября 2020
проблема (2)
Комментарии участников:
fStrange
+2
fStrange, 2 Сентября 2020 , url

В реальности достаточно и пары десятков.

Юлька с н2
-2
Юлька с н2, 2 Сентября 2020 , url

Наверно копирайтеры и журналисты выносят мозг этим алгоритмам. Сегодня он пишет про пластиковые окна и биткоины, завтра про Путина и фаллоимитаторы. Каждый раз, конечно, гуглит инфу в сети, нажимает кучу ссылок по теме своей статьи.

comander
0
comander, 2 Сентября 2020 , url

у автора почти 1к постов на хабре

Юлька с н2
-1
Юлька с н2, 2 Сентября 2020 , url

Я не про этого автора, а про то, что рекламщики могут запутаться, если человек по профессиональной деятельности ищет совершенно разную информацию.



Войдите или станьте участником, чтобы комментировать