Новый метод улучшения прогнозов

Исследование появится на этой неделе в журнале Proceedings of the National Academy of Sciences.В предыдущих исследованиях исследователи показали, что значимые переменные не могут быть прогностическими, а хорошие предсказатели могут не казаться статистически значимыми. Это поставило важный вопрос: как мы можем найти переменные с высокой степенью предсказания, если не с помощью руководства статистической значимости? Общие подходы к прогнозированию включают использование критерия на основе значимости для оценки переменных, используемых в моделях, и одновременной оценки переменных и моделей для прогнозирования с использованием перекрестной проверки или данных независимых тестов.

Стремясь снизить частоту ошибок с помощью этих методов, исследователи предложили новую меру, называемую оценкой влияния, или I-оценкой, чтобы лучше измерить способность переменной предсказывать. Они обнаружили, что I-оценка эффективна при различении зашумленных и прогнозирующих переменных в больших данных и может значительно улучшить скорость прогнозирования. Например, показатель I улучшил прогнозируемость данных о раке груди с 70 до 92 процентов.

I-score может применяться в различных областях, включая терроризм, гражданскую войну, выборы и финансовые рынки.«Практические последствия — вот что двигало проектом, поэтому они довольно широки», — говорит ведущий автор Аделина Ло, научный сотрудник Департамента политики Принстона. «Практически в любое время, когда вы можете быть заинтересованы в прогнозировании и выявлении переменных с высокой степенью предсказания, вы можете что-то получить, проводя выбор переменных с помощью статистики, такой как I-оценка, которая связана с предсказуемостью переменной. многомерные данные и со множеством сложных взаимодействий между переменными являются дополнительным благом для исследователя или политического эксперта, заинтересованного в прогнозировании чего-либо с помощью больших размерных данных ».