Надлежащая статистическая практика является важным компонентом надлежащей научной практики, отмечается в заявлении, и такая практика «подчеркивает принципы хорошего дизайна и проведения исследования, разнообразия числовых и графических сводок данных, понимания изучаемого явления, интерпретации результатов в контекст, полная отчетность и правильное логическое и количественное понимание того, что означают сводные данные ».«Значение p никогда не предназначалось для замены научных рассуждений», — сказал Рон Вассерштейн, исполнительный директор ASA. «Хорошо аргументированные статистические аргументы содержат гораздо больше, чем значение одного числа и то, превышает ли это число произвольный порог. Заявление ASA предназначено для направления исследования в«Со временем выясняется, что p-значение стало ключом к тому, можно ли опубликовать работу, по крайней мере, в некоторых областях», — сказала Джессика Уттс, президент ASA. «Эта очевидная редакционная предвзятость приводит к« эффекту картотеки », при котором исследования со статистически значимыми результатами с гораздо большей вероятностью будут опубликованы, в то время как другие работы, которые могут быть столь же важны с научной точки зрения, никогда не публикуются. к методам, называемым такими именами, как «p-hacking» и «data dredging», которые делают упор на поиск малых p-значений по сравнению с другими статистическими и научными рассуждениями ».Шесть принципов утверждения, многие из которых касаются неправильных представлений и неправильного использования p-значения, заключаются в следующем:
P-значения могут указывать на то, насколько данные несовместимы с указанной статистической моделью.P-значения не измеряют вероятность того, что изучаемая гипотеза верна, или вероятность того, что данные были получены исключительно случайным образом.Научные выводы и деловые или политические решения не должны основываться только на том, превышает ли p-значение определенный порог.Правильный вывод требует полной отчетности и прозрачности.
Значение p или статистическая значимость не измеряют размер эффекта или важность результата.Само по себе p-значение не является хорошей мерой доказательства относительно модели или гипотезы.В заявлении есть короткие абзацы, в которых подробно рассматривается каждый принцип.
В свете неправильного использования и неправильных представлений о p-значениях в заявлении отмечается, что статистики часто дополняют или даже заменяют p-значения другими подходами. К ним относятся методы, «которые делают упор на оценке, а не на тестировании, например, на достоверность, достоверность или интервалы прогнозирования; байесовские методы; альтернативные меры доказательства, такие как отношения правдоподобия или байесовские факторы; и другие подходы, такие как теоретико-аналитическое моделирование и частота ложных открытий».«Содержание заявления ASA и его доводы не новы — статистики и другие ученые писали на эту тему на протяжении десятилетий», — сказал Уттс. «Но это первый раз, когда сообщество статистиков, представленное Советом директоров ASA, выступило с заявлением по решению этих проблем».«Вопросы, связанные со статистическим выводом, сложны, потому что сам вывод сложен», — сказал Вассерштейн.
Он отметил, что в журнале ASA The American Statistician публикуется более дюжины дискуссионных документов, в которых содержится заявление, в котором содержится более подробная информация по этой широкой и сложной теме. «Мы надеемся, что последует широкая дискуссия в научном сообществе, которая приведет к более тонкому подходу к интерпретации, передаче и использованию результатов статистических методов в исследованиях».
