Данные о маршрутах такси и достопримечательностях могут улучшить прогнозирование преступности.

Анализ данных по достопримечательностям Чикаго, включая рестораны, магазины, ночные клубы и остановки общественного транспорта, обозначенных участниками FourSquare, сайта социальной сети, наряду с информацией о потоках такси в городе, позволил получить значительно более точные оценки уровня преступности по сравнению с традиционным средствам. Криминалисты в настоящее время в основном полагаются на демографические и географические данные для изучения преступности и прогнозирования тенденций.По словам Джесси Ли, доцента информационных наук и технологий, проекты с большими данными могут улучшить понимание преступности и помочь специалистам по планированию принимать более обоснованные решения, а также позволить сообществам и полиции использовать свои ресурсы для более эффективной борьбы с преступностью.

Маршруты такси похожи на гиперссылки, соединяющие различные сообщества друг с другом, добавил Ли, который работал с Хунцзян Ван, докторантом в области информационных наук и технологий; Дэниел Кифер, адъюнкт-профессор информатики и инженерии, и Корина Грейф, доцент социологии и криминологии, все в Penn State.«У нас была идея, что такси служат гиперссылками, потому что люди не только находятся под влиянием близлежащего местоположения, но и часто находятся под влиянием мест, куда они идут», — сказал Ли. «Например, ваш дом может находиться в получасе езды от вашей работы; они пространственно не близки. Но вы проводите там много времени и в конечном итоге попадаете под влияние таких людей, как ваши коллеги».Интересная информация может улучшить статистический анализ преступности, поскольку она показывает, как используются определенные области и почему люди хотят быть там, по словам исследователей, которые представили свои выводы сегодня (15 августа) на конференции по открытию знаний и данным.

Добыча в Сан-Франциско, Калифорния.«Согласно данным, районы с ночными клубами, как правило, являются районами с низким уровнем преступности, по крайней мере, в Чикаго, что может быть сюрпризом для многих», — сказал Ли. «Однако это может отражать выбор людей быть там — они хотят пойти в безопасный ночной клуб, а не в опасный».

Ли сказал, что это исследование также указывает на то, как область больших данных предоставляет как новые источники данных, так и новые способы изучения значения этих данных.Большие данные часто могут показывать корреляцию между источниками данных и определенными эффектами, такими как преступность, что помогает делать прогнозы.

Однако Ли указал, что источники данных не обязательно вызывают эффект.«Здесь мы видим корреляцию между данными о такси и достопримечательностях и уровнем преступности», — сказал Ли. «Данные показывают нам корреляцию, но с научной точки зрения, что касается причины, мы не знаем».Исследователи использовали данные о поездках на такси в Чикаго, которые включали время и место посадки и высадки, время работы и общую стоимость проезда, с октября по декабрь 2013 года. Они также собрали 112 000 точек интереса от FourSquare для исследования.

Статистические данные о преступлениях в Чикаго были собраны с портала данных города, а демографические данные включали информацию о населении, бедности, индексе неблагополучия и этническом разнообразии.


Портал обо всем