Надежный метод анализа кишечных бактерий: лучший способ изучить генетический материал микробиоты

Бактерии, населяющие человеческий организм, занимают особое место для ученых в изучении метагеномики. Значение метагеномики нельзя недооценивать: по приблизительным подсчетам количество бактериальных клеток в нашем теле на порядок превышает количество наших, и большинство из них находится в кишечнике. Различные глобальные проекты, такие как «Проект микробиома человека», показали, что состав бактериального сообщества влияет на наш риск заболевания, выбор оптимальной диеты, настроение и даже творческие способности. Верно и обратное — состав этих микроорганизмов чувствителен к процессам, происходящим в организме.

Таким образом, сравнивая образец пациента с людьми со здоровым кишечным метагеномом, в долгосрочной перспективе можно будет оценить риск опасных заболеваний, таких как диабет или воспалительное заболевание кишечника.Традиционный подход к метагеномному анализу заключается в сравнении образцов на основе их таксономического состава: процентного содержания для каждого обнаруженного вида микробов. Чтобы определить состав образца, его генетические последовательности сравнивают с базой данных известных бактериальных геномов, называемой эталонным набором.

Однако у этого подхода есть несколько недостатков. Во-первых, эталонные геномы часто неточны, поскольку состав эталонного генома является сложной вычислительной и трудоемкой задачей, особенно для видов, которые трудно культивировать; а геномы видов, выделенных в лаборатории, могут нести набор генов, который значительно отличается от генов тех же видов, живущих в естественной среде. Во-вторых, не все организмы обычно собираются в эталонных геномах; примерами таких организмов являются вирусы.

Поэтому та часть последовательности пробы, которая не совпадает с эталонным образцом, просто не учитывается при анализе, несмотря на то, что она может быть довольно большой и значимой. Между тем, метод, основанный на сравнении частот k-мер, не требует обращения к контрольному образцу или наличия какой-либо информации об исследуемых организмах, и, следовательно, все последовательности в образце подвергаются анализу, что дает наилучшие результаты. полученные результаты.Метод основан на представлении геномной последовательности организма в виде набора со всеми экземплярами нуклеотидных «слов» заданной длины «k», называемых k-мерами. Поскольку геном представляет собой уникальную последовательность для каждого организма, наборы таких «слов» также различаются между отдельными организмами.

Таким образом, набор всех k-мер метагенома можно рассматривать как набор наборов, а именно составляющих его организмов. Это позволяет оценить различия в бактериальном составе при сравнении образцов.Чтобы проверить эффективность метода k-mer по сравнению с традиционными подходами, были использованы два набора метагеномных данных — набор реальных данных и набор искусственно сгенерированных данных. Искусственные данные (созданные из геномов с заранее известными пропорциями) удобно использовать при тестировании метода, так как мы точно знаем последовательность и можем оценить полученный результат, сравнив его с априори правильным значением.

В качестве реальных данных использовались кишечные метагеномы жителей США и Китая.Известно, что бактериальные кишечные сообщества значительно различаются между разными популяциями, и алгоритмы заявили, что позволяют нам находить именно те индикаторы, которые показывают разницу в составе.

Поэтому критерием оценки эффективности рассматриваемого метода была степень различимости метагеномов, то есть насколько китайские метагеномы в целом отличаются от американских.Метод показал лучшие результаты в обоих типах данных при сравнении k-мер, чем при использовании традиционного сопоставления с эталонным набором. Кроме того, при использовании реальных данных несоответствие между кишечными результатами для k-mer и традиционными подходами позволило нам обнаружить еще один важный компонент кишечного метагенома, а именно бактериальный фаг crAssphage, который ускользнул от внимания исследователей, использующих традиционный метод. . По словам автора статьи Дмитрия Алексеева: «Интересно, что гены можно рассматривать не только как сегменты ДНК с закодированными в них белками, но и как информацию в целом. Именно это информационное различие позволило нам выявить новые сегменты ДНК, не описанные в каталоге известных генов.

Интересно посмотреть, как этот подход будет использоваться другими исследовательскими группами ».Разработанная методика позволяет более эффективно и точно находить различия между метагеномами различных бактериальных сообществ, что может помочь в изучении, диагностике и лечении многих заболеваний человека.