Десять простых правил эффективного использования статистики

По этой причине группа статистиков, в том числе Роберт Э. Касс из Университета Карнеги-Меллона, написала «Десять простых правил для эффективной статистической практики». Руководящие принципы, опубликованные в журнале «Вычислительная биология PLOS» для популярной серии «Десять простых правил», призваны помочь исследовательскому сообществу — особенно ученым, не являющимся экспертами по статистике или не имеющим специального специалиста по статистике в составе своей команды — понять, как избегайте ловушек благонамеренных, но неточных статистических рассуждений.

«Центральная и общая задача для нас как исследователей — расшифровать, какие данные могут сказать о проблемах, которые мы пытаемся решить», — написал Касс, профессор статистики и машинного обучения и временный содиректор Центра нейронных систем. Основы познания и его соавторы. «Статистика — это язык, созданный для помощи в этом процессе, с вероятностью в качестве грамматики».Они продолжили: «Хотя элементарные разговоры возможны без хорошего знания языка (и проводятся регулярно), принципиальный статистический анализ имеет решающее значение для борьбы со многими тонкими явлениями, чтобы гарантировать, что ничего серьезного не будет потеряно при переводе, и для повышения вероятности того, что ваш результаты исследований выдержат испытание временем ».

Правила, которые были опубликованы в Интернете 9 июня, привлекли к себе огромное внимание, поскольку их просмотрели более 37 000 страниц, что уже сделало эту статью одной из 20 самых просматриваемых статей в серии, которая включает в себя около 60 статей. Их популярность не удивляет Майкла Дж.

Тарра, главы отдела психологии КМУ.«Науки, и особенно области психологии и нейробиологии, в последние годы стали объектом пристального внимания из-за иногда плохой статистической практики», — сказал Тарр. "Прямые и понятные рекомендации, сформулированные Кассом и его коллегами, в огромной степени помогут напомнить студентам и преподавателям о важности статистически обоснованных исследований.

Их статья является незамедлительной" обязательной к прочтению "для всех, кто заботится о хорошей и воспроизводимой науке . "Краткое изложение 10 правил:# 1 — Статистические методы должны позволять получать данные для ответа на научные вопросыСотрудничество со статистиками часто бывает наиболее полезным на ранних этапах расследования, потому что неопытные пользователи статистики часто сосредотачиваются на том, какой метод использовать для анализа данных, а не на рассмотрении всех способов, которыми данные могут дать ответ на основной научный вопрос.# 2 — Сигналы всегда сопровождаются шумом

Вариабельность проявляется во многих формах, но очень важно понимать, когда это хорошо, а когда шумно, чтобы выразить неопределенность. Это также помогает определить вероятные источники систематической ошибки.# 3 — План впереди, действительно впередиЗадавая вопросы на этапе проектирования, можно избавиться от головной боли на этапе анализа.

Тщательный сбор данных также может значительно упростить анализ и сделать его более строгим.# 4 — Беспокойство о качестве данных

Когда дело доходит до анализа данных, «мусор на входе производит мусор на выходе». Сложность современного сбора данных требует многих предположений о функциях технологий, часто включая технологию предварительной обработки данных, которая может иметь глубокие последствия, которые легко могут остаться незамеченными.# 5 — Статистический анализ — это больше, чем набор вычисленийСтатистическое программное обеспечение предоставляет инструменты для помощи в анализе, а не для их определения.

Научный контекст имеет решающее значение, и ключом к принципиальному статистическому анализу является приведение аналитических методов в тесное соответствие с научными вопросами.# 6 — Будь прощеПростота важнее сложности. Большое количество измерений, взаимодействия между независимыми переменными, нелинейные механизмы действия, недостающие данные, искажение, смещения выборки и другие факторы могут потребовать увеличения сложности модели.

Но имейте в виду, что хороший дизайн, хорошо реализованный, часто позволяет простым методам анализа давать хорошие результаты.# 7 — Обеспечьте оценку изменчивостиОсновная цель статистического анализа — помочь оценить неопределенность, часто в форме стандартной ошибки или доверительного интервала, и одним из самых больших успехов статистического моделирования и вывода является то, что он может предоставить оценки стандартных ошибок на основе тех же данных, которые производят оценки количества интереса.

При сообщении результатов важно предоставить некоторое понятие статистической неопределенности.# 8 — Проверьте свои предположенияШироко доступное статистическое программное обеспечение позволяет легко выполнять анализ, не уделяя должного внимания внутренним допущениям, и это может привести к получению неточных или даже вводящих в заблуждение результатов. Поэтому важно понимать допущения, заложенные в методах, и делать все возможное, чтобы понять и оценить эти допущения.

# 9 — Если возможно, повторяйте!В идеале репликация выполняется независимым исследователем.

Научные результаты, которые выдерживают испытание временем, подтверждаются множеством различных, но тесно связанных ситуаций. Во многих контекстах полное воспроизведение очень сложно или невозможно, как в крупномасштабных экспериментах, таких как многоцентровые клинические испытания. В таких случаях минимальным стандартом будет соблюдение правила 10.# 10 — Сделайте свой анализ воспроизводимым

Учитывая тот же набор данных, вместе с полным описанием анализа, должна быть возможность воспроизвести таблицы, рисунки и статистические выводы. Значительно улучшите способность воспроизводить результаты, очень систематически описывая этапы анализа, предоставляя данные и код, используемые для получения результатов, и следуя принятым передовым методам статистики.

Помимо Касс, соавторами являются Брайан С. Каффо из Университета Джона Хопкинса, Мари Дэвидиан из Университета штата Северная Каролина, Сяо-Ли Мэн из Гарвардского университета и Нэнси Рид из Калифорнийского университета в Беркли и Университета Торонто.«Я очень верю в ценность выявления основных идей в статистике и их четкого и лаконичного изложения», — сказал Касс. «Серия из 10 простых правил потрясающая, доказавшая свою ценность в качестве формата для высокоуровневых научных концепций.

Эта статья была довольно тяжелой работой, но у нас была отличная команда, и я был очень доволен результатом».


Портал обо всем