Новое программное обеспечение анализирует геномы человека быстрее, чем другие доступные технологии

«На секвенирование первого генома человека потребовалось около 13 лет и 3 миллиарда долларов, — говорит Питер Уайт, доктор философии, главный исследователь и директор Центра биомедицинской геномики в Nationwide Children’s и старший автор исследования. "Теперь даже самые маленькие исследовательские группы могут завершить геномное секвенирование за считанные дни. Однако, как только вы сгенерируете все эти данные, это момент, когда многие группы упадут в стену. После секвенирования генома ученым остается проанализировать миллиарды точек данных, прежде чем можно будет собрать какую-либо действительно полезную информацию для использования в исследованиях и клинических условиях."

Чтобы преодолеть проблемы анализа такого большого количества данных, доктор. Уайт и его команда разработали вычислительный конвейер под названием «Черчилль."Используя новые вычислительные методы, Черчилль позволяет эффективно анализировать образец всего генома всего за 90 минут.

«Черчилль полностью автоматизирует аналитический процесс, необходимый для получения необработанных данных последовательностей через ряд сложных и требующих большого объема вычислений процессов, в конечном итоге создавая список генетических вариантов, готовых для клинической интерпретации и третичного анализа», — сказал доктор. Уайт объясняет. "Каждый этап процесса был оптимизирован, чтобы значительно сократить время анализа без ущерба для целостности данных, в результате чего был получен 100-процентный воспроизводимый метод анализа."
Результат Черчилля был подтвержден с использованием тестов Национального института стандартов и технологий (NIST).

По сравнению с другими вычислительными конвейерами, Черчилль показал самую высокую чувствительность — 99.7 процентов; высочайшая точность при 99.99% и наивысшая общая диагностическая эффективность — 99%.66 процентов.
«У нас в Nationwide Children’s есть стратегическая цель — внедрить геномную медицину во многие области педиатрических исследований и здравоохранения.

Быстрая диагностика моногенного заболевания может иметь решающее значение у новорожденных, поэтому наша первоначальная цель заключалась в создании системы анализа, которая была бы чрезвычайно быстрой, но не жертвовала клиническими диагностическими стандартами воспроизводимости и точности », — говорит д-р. белый. «Достигнув этого, мы обнаружили, что второстепенным преимуществом Черчилля было то, что его можно было адаптировать для геномного анализа популяции."
Изучая использование вычислительных ресурсов в процессе анализа данных, Dr.

Команда Уайта смогла продемонстрировать высокую эффективность Черчилля (использование ресурсов> 90%) и очень эффективное масштабирование на многих серверах. Альтернативные подходы ограничивают анализ одним сервером и позволяют использовать ресурсы всего на 30 процентов.

Эта эффективность и возможность масштабирования позволяют проводить геномный анализ в масштабе популяции.
Чтобы продемонстрировать способность Черчилля проводить анализ численности населения, д-р. Уайт и его команда получили награду от Amazon Web Services (AWS) в программе Education Research Grants, которая позволила им успешно проанализировать фазу 1 необработанных данных, созданных в рамках проекта 1000 Genomes Project — международного сотрудничества для создания обширного общедоступного каталога человеческих ресурсов. генетическая изменчивость, представляющая несколько популяций со всего мира. Используя ресурсы облачных вычислений от AWS, Черчилль смог завершить анализ 1088 образцов полного генома за семь дней и идентифицировать миллионы новых генетических вариантов.

«Учитывая, что в настоящее время проводится несколько геномных исследований в масштабе популяции, мы считаем, что Черчилль может быть оптимальным подходом для решения проблем анализа данных, которые ставят эти исследования», — говорит д-р. белый.
Алгоритм Черчилля был лицензирован для компании GenomeNext LLC, расположенной в Колумбусе, которая на основе технологии Черчилля разработала безопасную и автоматизированную платформу программного обеспечения как услуги, которая позволяет пользователям просто загружать необработанные данные полногеномных, экзомных или целевых панельных последовательностей. в систему GenomeNext и запустить анализ, который не только идентифицирует генетические варианты, но и генерирует полностью аннотированные наборы данных, позволяющие фильтровать и идентифицировать патогенные варианты. Компания предоставляет решения для анализа геномных данных, которые упрощают процесс управления данными и автоматизируют анализ крупномасштабных геномных исследований.

Система также была разработана с учетом исследований и клинического рынка, предлагая стандартизированный конвейер, который хорошо подходит для условий, в которых клиенты должны соблюдать нормативные требования.

Портал обо всем