Секвенирование ДНК стало настолько дешевым, что даже если исследователя действительно интересует последовательность нескольких генов, часто наиболее практично просто секвенировать весь геном. Биоинформатические методы могут выбрать желаемую последовательность гена позже, с меньшими трудностями, чем нацеливание конкретных генов на последовательность. Эта практика, известная как «анализ генома», становится все более популярным способом ответа на вопросы о взаимоотношениях между видами растений.Предпосылкой скимминга генома является использование секвенирования с малым охватом для извлечения последовательности ДНК из высококопийных фракций генома.
При секвенировании «дробовиком» геном разбивается на небольшие фрагменты для секвенирования, а затем снова сшивается вместе с помощью вычислений, используя перекрытия между фрагментами, процесс, называемый сборкой. Степень «покрытия» соответствует тому, сколько из этих маленьких фрагментов упорядочено; чем выше охват, тем легче сшить геном, что приведет к более полной последовательности генома.
Но более высокий охват обходится дороже, и на некоторые вопросы можно ответить с помощью более дешевого цикла секвенирования с низким охватом. «Высококопийные фракции» тотальной геномной ДНК, такие как геномы хлоропластов или ядерная рибосомная ДНК, находятся в большем количестве в пуле последовательностей, и поэтому могут быть полностью секвенированы даже в дешевых прогонах с низким охватом. Последовательности из этих высококопийных геномных фракций обычно используются для выяснения эволюционных взаимоотношений между различными видами и группами. Но в процессе сканирования генома исследователи производят, а затем отбрасывают огромные объемы потенциально ценных данных о последовательностях. «Многие наборы данных скимминга генома используются для сборки генома хлоропластов, который в нашем случае использовал только 3% секвенированных данных», — отметила д-р Дайанелла Ховарт, соавтор исследования.
В этом исследовании авторы еще раз взглянули на набор данных скимминга генома, который ранее использовался для выяснения эволюционных взаимосвязей в семействе растений Gderediaceae, обычно называемых «веерными цветками» или «полуцветками» из-за их интригующей формы цветка, которая похоже, кто-то разрезал цветок пополам. Авторы хотели посмотреть, можно ли использовать этот набор данных скимминга генома для получения дополнительной информации о генетике, лежащей в основе этой уникальной цветочной структуры.
Они использовали несколько программных пакетов для сборки ранее неиспользованных фрагментов последовательности из низкокопийной фракции исходного набора данных скимминга генома. Затем они провели поиск в полученной сборке последовательности из набора генов, называемых генами CYCLOIDEA, которые участвуют в структуре и симметрии цветков.
Авторам удалось получить достаточное количество частей генов от нескольких видов, чтобы создать полное выравнивание всех четырех генов CYCLOIDEA в ядре Gderediaceae. Эти данные могут оказаться полезными для будущих исследований эволюции причудливой цветочной структуры, наблюдаемой в этой группе. «Сравнение последовательностей генов, подобных CYCLOIDEA, в этой кладе может дать ключ к разгадке точных изменений последовательности, которые приводят к изменениям морфологии цветков», — пояснил д-р Ховарт.В более общем плане, продолжил доктор Ховарт, «кусочки любого интересующего гена потенциально могут быть извлечены из наборов данных скимминга генома, которые уже были завершены». Фрагмент гена может показаться не таким уж большим, но у этих фрагментов есть удивительное количество применений. «Эти данные могут предоставить достаточно информации для определения полезных ядерных регионов для филогенетического анализа или точного определения возможных событий дупликации генов.
Кроме того, зонды для целевого обогащения последовательности могут быть быстро сгенерированы по всей кладе для изучения генов-кандидатов и их регуляторных регионов в исследованиях evo -dev. "Подобные подходы к интеллектуальному анализу данных позволяют гораздо более полно использовать наборы данных для анализа генома. Это позволяет ответить на важные вопросы с использованием имеющихся данных и открывает двери для ученых, не имеющих доступа к ресурсам для создания крупномасштабных наборов данных, например, ученых из небольших колледжей или стран, не имеющих крупных организаций, предоставляющих гранты.
По мере того как данные о последовательностях ДНК продолжают поступать, исследования, подобные этому, указывают на способы убедиться, что мы не позволяем ценной информации проплыть мимо нас.
