Один конвейер, сочетающий в себе множество инструментов для поиска генов

Однако эволюционные отношения внутри многих групп растений было трудно реконструировать, часто из-за таких факторов, как быстрая диверсификация, гибридизация и неполная сортировка по линиям. В таких случаях необходимы большие наборы данных, включая многочисленные генетические маркеры как ядерного, так и органеллярного генома, для точного определения взаимосвязей. Но разработка многочисленных генетических маркеров для филогенетических исследований часто затруднена из-за отсутствия обширных геномных ресурсов, которые доступны лишь для небольшой части видов растений.
К счастью, достижения в области технологий секвенирования помогают исследователям создавать большие наборы данных даже в сложных геномах.

Одним из примеров этого является конвейер аннотаций MAKER2, бесплатный конвейер с открытым исходным кодом, который сочетает в себе различные биоинформатические инструменты для анализа генома, более известные как «аннотации генома»."
Используя MAKER2, исследователи из Университета штата Огайо разработали рабочий процесс, который идентифицирует многочисленные генетические маркеры для филогенетических исследований на основе ограниченных геномных данных. Подход, опубликованный в недавнем выпуске журнала Applications in Plant Sciences, проиллюстрирован на примере цветковых растений рода Penstemon (Plantaginaceae), филогению которого было трудно решить из-за недавнего быстрого излучения.

На основании низкого покрытия (прибл. 0.005?-0.007?) геномных данных из шести образцов Penstemon, полученных с помощью секвенирования 454, исследователи использовали MAKER2 для определения генетических маркеров, полезных для филогенетического исследования из всех трех геномов растений. Затем были сконструированы праймеры для выбранных локусов с использованием Primer-BLAST и Primer3Plus, которые затем можно было использовать для параллельного секвенирования на основе ПЦР.

Пол Д. Блишак, ведущий автор исследования, отмечает, что преимущества MAKER2 для разработки маркеров на основе геномных данных с низким охватом включают «способность точно идентифицировать участки генов, собирать всю доступную информацию (предсказания генов, совпадения BLAST, границы экзонов, так далее.) для идентифицированного гена в один файл для легкого извлечения и его совместимости с инструментами визуализации.«Благодаря этим функциям, — говорит он, — рабочий процесс позволяет исследователям легко выбирать многочисленные локусы, полезные для их филогенетического исследования."
Хотя многие исследователи использовали транскриптомные данные для разработки маркеров, Блишак отмечает, что использование геномных данных облегчает идентификацию интронов, которые более полезны для реконструкции поверхностных или недавних эволюционных отношений.
"Нацеливание на интроны — довольно распространенный подход к разработке маркеров, который, вероятно, будет сложнее с данными транскриптома, потому что доступны только интроны, которые не сплайсированы."
Исследование демонстрирует, как функциональность MAKER2, объединяющая несколько программ в один конвейер, может быть использована для создания крупномасштабных наборов данных даже для геномов с чрезвычайно низким охватом.

Авторы также предоставляют образец протокола, библиотеки последовательностей, файлы функциональных аннотаций и другие ресурсы.

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *