Но насколько свежи эти данные? В конце концов, перепись обновляется раз в десять лет, а меньшее по размеру, но более подробное обследование американского сообщества, проводимое Бюро переписи США, — ежегодно.
Также существует задержка между сбором данных и их публикацией. (Публикация данных за 2016 год началась постепенно в сентябре 2017 года.)Войдите в Facebook, который, с некоторыми оговорками, может служить еще более актуальным источником информации, особенно о мигрантах. К такому выводу приводит исследование, проведенное Эмилио Загени, доцентом социологии Вашингтонского университета, опубликованное 11 октября в «Population and Development Review». Это исследование считается первым, демонстрирующим, как можно получить современные статистические данные о миграции, собрав те же данные, которые рекламодатели используют для таргетинга на свою аудиторию в Facebook, и объединив этот источник с информацией из Бюро переписи населения.
По словам Загени, миграция указывает на множество политических и экономических тенденций и является одним из основных факторов изменения численности населения. По мере того как исследователи продолжают изучать растущее количество баз данных, создаваемых для рекламодателей, утверждает Загени, социологи могут чаще использовать Facebook, LinkedIn и Twitter для сбора информации о географии, мобильности, поведении и занятости.
И хотя есть некоторые ограничения для данных — каждая платформа представляет собой самоотбираемый сегмент населения, сообщающий о себе, — количество мигрантов по данным Facebook может дополнять официальные цифры, зарегистрированные Бюро переписи населения США, сказал Загени.«Данные Facebook находятся в свободном доступе и дезагрегированы на уровне города или почтового индекса США», — сказал Загени. Исследование было сосредоточено на сервисе Facebook Ads Manager, который позволяет пользователям в интересах размещения рекламы вводить информацию о целевой аудитории — информацию, о которой платформа затем генерирует данные. В качестве примера исследователи определили аудиторию гипотетической рекламы, нацеленной на итальянских экспатриантов, проживающих в штате Вашингтон; Facebook сообщил о примерно 3800 активных пользователях в месяц в этой аудитории. (Этот процесс ввода данных бесплатный; продвижение к запуску рекламы требует определенных затрат.)
Ученые, изучающие тенденции миграции, скажем, где в США обосновались различные группы, могут обратиться к инструменту Facebook Ads Manager. Но важно признать предвзятость в данных и некоторую двусмысленность в способах измерения миграции, сказал Загени. Обследование американского сообщества, напротив, представляет собой современное воплощение старой «полной формы» переписи, которая ежегодно случайным образом рассылается домашним хозяйствам США для сбора не только демографической информации, но и статистики жилья, рабочих мест и других социально-экономических тенденций.
В исследовании UW Загени и его коллеги разработали компьютерную программу для извлечения данных из Facebook Ads Manager об эмигрантах из более чем 50 стран в каждый штат США с разбивкой по возрасту и полу. Команда собрала данные с платформы, насчитывающей более 1,8 миллиарда пользователей по всему миру, опираясь на инновационную статистическую модель, которую исследователи создали для корректировки типичного недостатка данных: пользователи Facebook не являются репрезентативными для всего основного населения.В качестве наглядного примера Загени и его коллеги сравнили количество мексиканцев, проживающих в Калифорнии и Техасе, в разбивке по возрасту и полу, с цифрами, полученными в ходе исследования американского сообщества. Исследователи сделали то же самое с оценками иммигрантов из Филиппин в оба штата.
Команда обнаружила, что, в целом, количество мексиканских мигрантов в Калифорнии и Техасе, оцененное Facebook, было заметно ниже, чем количество, указанное в опросе американского сообщества, особенно среди пожилых мексиканцев. Например, по оценке американского сообщества, мужчины мексиканского происхождения в возрасте от 40 до 44 лет составляют более 20 процентов мужского населения Калифорнии в этом возрастном диапазоне; Facebook оценивает эту пропорцию ближе к 15 процентам.
Эти расхождения могут отражать предвзятость в данных, сказал Загени, например, более низкое использование Facebook в этой демографической группе или различия между возрастными группами в объеме информации, размещаемой на Facebook, такой как сведения о родных городах пользователей — и, следовательно, будут ли они считаться эмигрантом.Для иммигрантов из Филиппин различия между оценками Facebook и American Community Survey меньше, с потенциальной завышенной оценкой для пожилых филиппинцев в обоих штатах. Например, в Техасе, по оценкам Facebook, филиппинцы в возрасте от 50 до 54 лет составляют 5 процентов мужского населения штата в этом возрастном диапазоне, тогда как оценка американского сообщества приближается к 2,5 процентам.
Загени и его коллеги работали над выявлением таких предубеждений в данных Facebook и их сходства между группами или штатами. Затем они разработали модель, которая позволяет исследователям вносить коррективы, объединив информацию из Facebook и опроса американского сообщества.«Что лучше: большая выборка с предвзятостью или небольшая выборка с непредвзятым отношением?
Исследование американского сообщества — это небольшая выборка, которая более репрезентативна для основного населения; Facebook — очень большая выборка, но не репрезентативная», — сказал Загени. сказал. «Идея состоит в том, что в определенных контекстах выборка из опроса американского сообщества слишком мала, чтобы сказать что-то существенное. В других обстоятельствах выборки Facebook слишком предвзяты. В этом проекте мы стремимся получить лучшее из обоих миров: путем калибровки Данные Facebook с помощью опроса американского сообщества, мы можем исправить систематическую ошибку и получить более точные оценки ».
Следующим шагом, добавил он, является проверка этого подхода в развивающихся странах, где своевременные и надежные статистические данные важны для развития.
