Ваша анонимная история просмотра веб-страниц не может быть анонимной

«Мы показываем, что истории просмотров могут быть связаны с профилями социальных сетей, такими как учетные записи Twitter, Facebook или Reddit», — написали исследователи в документе, который планируется представить на конференции World Wide Web в Перте, Австралия, в апреле 2017 года.
«Уже известно, что некоторые компании, такие как Google и Facebook, отслеживают пользователей в Интернете и знают их личности», — сказал Арвинд Нараянан, доцент кафедры информатики в Принстоне и один из авторов исследовательской статьи.

Но те компании, в которых потребители предпочитают создавать учетные записи, раскрывают свое отслеживание. Новое исследование показывает, что любой, у кого есть доступ к истории просмотров — большое количество компаний и организаций — может идентифицировать многих пользователей, анализируя общедоступную информацию из учетных записей социальных сетей, сказал Нараянан.
«Пользователи могут предполагать, что они анонимны, когда они просматривают новости или веб-сайт о здоровье, но наша работа добавляет к списку способов, с помощью которых отслеживающие компании могут узнать их личности», — сказал Нараянан, аффилированный преподаватель Принстонского центра. по политике в области информационных технологий.

Нараянан отметил, что Федеральная комиссия по связи недавно приняла правила конфиденциальности для интернет-провайдеров, которые позволяют им хранить и использовать информацию о потребителях только в том случае, если она «не имеет разумной связи» с отдельными пользователями.
«Наши результаты показывают, что истории просмотров под псевдонимами не проходят этот тест», — пишут исследователи.

В статье авторы отмечают, что компании, занимающиеся интернет-рекламой, создают истории просмотров пользователей с помощью программ отслеживания, встроенных на веб-страницы.

Некоторые рекламодатели прикрепляют идентификационные данные к этим профилям, но большинство обещают, что информация о просмотре веб-страниц не связана с чьей-либо личностью. Исследователи хотели знать, можно ли деанонимизировать просмотр веб-страниц и идентифицировать пользователя, даже если история просмотра веб-страниц не включала идентификационные данные.
Они решили ограничиться общедоступной информацией.

Профили в социальных сетях, особенно те, которые содержат ссылки на внешние веб-страницы, предлагают наибольшую вероятность. Исследователи создали алгоритм для сравнения анонимных историй просмотра веб-страниц со ссылками, появляющимися в публичных учетных записях людей в социальных сетях, которые называются «фидами»."
«История просмотров каждого человека уникальна и содержит контрольные признаки его личности», — сказал Шарад Гоэль, доцент Стэнфордского университета и автор исследования.
Программы смогли найти закономерности среди различных групп данных и использовать их для идентификации пользователей.

Исследователи отмечают, что этот метод не идеален и требует наличия ленты социальных сетей, содержащей ряд ссылок на внешние сайты. Однако они сказали, что «учитывая историю с 30 ссылками, исходящими из Twitter, мы можем вывести соответствующий профиль Twitter более чем в 50% случаев."

Исследователи добились еще большего успеха в эксперименте, который они провели с участием 374 добровольцев, отправивших информацию о просмотре веб-страниц. Исследователи смогли идентифицировать более 70 процентов этих пользователей, сравнив их данные о просмотре веб-страниц с сотнями миллионов общедоступных каналов социальных сетей. (Количество первоначальных участников исследования было больше, но некоторые пользователи были исключены из-за технических проблем с обработкой их информации.)

Ив-Александр де Монжуа, доцент Имперского колледжа Лондона, сказал, что исследование показывает, насколько "легко создать полномасштабный деанонимизатор", которому не нужно ничего, кроме того, что доступно любому, кто умеет программировать."
«Все доказательства, которые мы наблюдали за многие годы, демонстрирующие строгие ограничения анонимности данных, включая это исследование, действительно подчеркивают необходимость переосмысления нашего подхода к конфиденциальности и защите данных в эпоху больших данных», — сказал де Монжой, не участвовал в проекте.

Портал обо всем