Новый алгоритм может точно определять мутации, одобренные естественным отбором, в больших участках генома человека.

Секвенированный геном одного человека дает около половины терабайта данных информации — это примерно столько же информации, сколько вы найдете на 106 DVD. Выборка населения размером 1000 человек содержит в 1000 раз больше информации.

Поэтому для изучения такого огромного количества данных исследователи обратились к вычислительным методам.«Информатика и наука о данных играют важную роль в лучшем понимании кода жизни и раскрытии скрытых закономерностей в нашем геноме», — сказал Али Акбари, первый автор статьи и доктор философии. студент факультета электротехники и вычислительной техники Калифорнийского университета в Сан-Диего. «Мы анализируем огромные массивы геномных данных человека, чтобы в конечном итоге улучшить наше понимание генетической основы болезней».Исследователи подробно описывают алгоритм, получивший название iSAFE, в выпуске журнала Nature Methods от 19 февраля.

Многие существующие подходы к геномному анализу позволяют определить, какие области генома человека развиваются под давлением отбора. Часто эти области большие, охватывают миллионы пар оснований и не проливают свет на конкретные мутации, которые реагируют на давление отбора. iSAFE не нужно знать функцию региона генома, который он анализирует, или какую-либо демографическую информацию о человеческой популяции, к которой он принадлежит. Вместо этого исследователи использовали популяционные генетические сигналы, отпечатанные в геномах выбранных людей, и методы машинного обучения, чтобы надежно идентифицировать мутацию, благоприятствующую отбору.

При естественном отборе соседние мутации «путешествуют автостопом» с мутацией, находящейся под положительным отбором, что приводит к потере генетического разнообразия рядом с предпочтительной мутацией. iSAFE использует сигналы в соседних последовательностях, так называемых «плечевых областях», чтобы точно определить желаемую мутацию.«Найти желаемую мутацию среди десятков тысяч других мутаций, связанных с автостопом, было похоже на проблему со стогом сена», — сказал Акбари, который работает в исследовательской группе профессора информатики Винита Бафны из инженерной школы Джейкобса в Калифорнийском университете в Сан-Диего. .Чтобы протестировать алгоритм, исследователи запустили iSAFE на тех участках генома, которые являются домом для известных предпочтительных мутаций. Алгоритм оценил правильную мутацию как лучшую из более чем 21 000 возможных в 69 процентах случаев, в отличие от современных методов, которые позволяли это делать только в 10 процентах случаев.

Алгоритм также выявил множество ранее неизвестных мутаций, в том числе пять, связанных с генами, связанными с пигментацией. В этих случаях iSAFE идентифицировал идентичные мутации во многих неафриканских популяциях. Это предполагает ранний ответ на начало отбора, когда люди мигрировали из Африки.Исследование было частично поддержано Национальным научным фондом и Национальными институтами здравоохранения.

Выявление предпочтительной мутации в положительном выборочном обследованииАвторы для переписки: Али Акбари, Департамент электротехники и вычислительной техники, и Винит Бафна, Департамент компьютерных наук и инженерии, Калифорнийский университет в Сан-Диего.Соавторы: Арья Иранмехр и Сиаваш Мирараб, Департамент электротехники и вычислительной техники, Калифорнийский университет в Сан-Диего; Мехрдад Бахтиари, Департамент компьютерных наук и инженерии, Калифорнийский университет в Сан-Диего; Джозеф Дж.

Витти и Пардис Сабети, Департамент органической и эволюционной биологии, Гарвард и Институт Броуда Массачусетского технологического института и Гарварда.


Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *