Платформа краудсорсинга делает общедоступные данные об экспрессии генов более доступными

Общедоступные базы данных содержат миллионы профилей экспрессии генов — данные, описывающие степень включения или выключения генов при определенных условиях. Потенциально ученые могут повторно использовать эти данные для создания и решения новых исследовательских вопросов. Например, исследователи могут перенаправить набор данных, сравнивая образцы крови людей, лечившихся и не получавших лечение, для исследования влияния пола на лечение. Однако этот объем информации остается в значительной степени неиспользованным для такого повторного использования данных, отчасти потому, что многим биологам не хватает опыта компьютерного программирования, необходимого для поиска, обработки и анализа данных.

Кроме того, записи общедоступной базы данных обычно содержат необработанные данные исследования, которые необходимо структурировать для анализа.OMiCC стремится использовать методы краудсорсинга, чтобы использовать опыт исследовательского сообщества для решения этих проблем. В рамках платформы пользователи могут создавать группы данных экспрессии генов и «аннотировать» их, назначая параметры, такие как тип образца и болезнь, используя стандартизованный словарь. OMiCC сохраняет эти созданные пользователями группы и связанные с ними аннотации, делая их доступными для повторного использования другими пользователями.

В OMiCC пользователи могут объединять эти группы данных и анализировать информацию из нескольких исследований для поиска биологических взаимосвязей, статистический подход, известный как метаанализ. Ученые NIAID ожидают, что по мере роста сообщества пользователей OMiCC платформа превратится в богатый ресурс, способный преобразовывать растущие объемы общедоступных данных в новые биологические открытия.

OMiCC доступен по адресу https://omicc.niaid.nih.gov. На веб-сайте представлены видеоролики и пошаговые инструкции, которые помогут пользователям ориентироваться на платформе.