Статья написана по материалам лекции, прочитанной доктором биологических наук, профессором Е.И.Рогаевым 25 марта 2009 года в Институте общей генетики РАН.
В 80—90-е годы ХХ века стало ясно, что из ископаемых объектов действительно можно извлекать ДНК. За последние двадцать лет было выполнено много исследований ДНК, полученной из палеонтологических и исторических образцов. Аналогичными методами экстракции и анализа ДНК стали пользоваться судмедэксперты. Однако насколько аутентична такая ДНК исходной?
Как не перепутать человека с динозавром
Исследования геномов мамонта и неандертальца вызывают постоянный интерес у общественности и СМИ. Как выяснилось, ДНК в костной ткани или шерсти мамонта неплохо сохраняется, особенно митохондриальная. (Митохондрии — клеточные органеллы, отвечающие за снабжение клетки энергией, — имеют собственный геном.) Во многих работах в первую очередь исследовали митохондриальную ДНК: она обычно меньше повреждена, чем ядерная. За выделением ДНК следует амплификация — многократное копирование фрагментов с помощью полимеразной цепной реакции (ПЦР), чтобы увеличить исходное малое количество ДНК. И наконец, делается прямой анализ — секвенирование, определение нуклеотидной последовательности. Для этого существуют различные методы, особенно активно используется «метод дробовика» — shotgun-sequencing. (ДНК расщепляется случайным образом на короткие фрагменты, которые читают с помощью метода Сенгера, а затем перекрывающиеся фрагменты состыковывает компьютерная программа.) Технология, которую мы сейчас развиваем, — секвенирование с использованием конкретных мишеней: вместо того чтобы определять всю последовательность, секвенируются только определенные участки, например тот или иной ген в ядерной ДНК. По существу, это секвенирование гена, который извлекается методом гибридизации.
Эффективность выделения зависит от ряда факторов, в первую очередь от условий работы в лаборатории. Минимум требований — наличие трех комнат: в одной проводится экстракция ДНК, в другой амплификация, в третьей секвенирование. Работать с ДНК современных биологических видов необходимо в отдельном здании или хотя бы в помещении с отдельной вентиляцией, иначе велика вероятность загрязнения. Ранее считалось, что повторение результатов независимой лабораторией — непременное условие публикации, сейчас это ограничение снято.
|
Чистый блок для работы с древней ДНК в Институте общей генетики им. Н.И.Вавилова РАН. Фото: А.П.Григоренко |
Конечно, многое зависит и от качества исходного материала. Даже по внешнему виду образца можно судить, удастся ли получить из него ДНК. Губчатая костная ткань менее перспективна, чем плотный материал, например черепа или внутренней части бедренной кости.
Затем следуют неизбежные технические проблемы. Во-первых, ограниченное количество материала, который, как правило, очень ценен. Поэтому нередко проводят предварительную амплификацию всей геномной ДНК, полученной из образца. Вторая проблема — деградация ДНК, третья — загрязнение, попадание в образец посторонней ДНК. Немало опубликованных в последнее время данных о ДНК «из древних останков» на самом деле представляют фрагменты ДНК современных организмов, в первую очередь человека. Яркий пример — последовательность ДНК динозавра возрастом несколько миллионов лет. Статья о ее расшифровке была опубликована в «Science», а потом выяснилось, что это была ДНК человека. Подобные случаи бывали и с другими палеонтологическими объектами, например с насекомыми из янтаря. Вообще, образцы, возраст которых исчисляется миллионами лет, обычно дают ошибочный результат.
Следующая проблема: древняя ДНК модифицируется, в ней происходят химические превращения, зависящие от влажности, кислотности и других факторов. Такую ДНК бывает трудно извлечь, особенно из растительных остатков: она связывается с белками, полисахаридами. Кроме того, в древней ДНК происходят постмортальные мутации — химические модификации нуклеотидов. Чаще всего цитозин заменяется на тимин и аденозин — на гуанин. Точнее, цитозин превращается в урацил — это азотистое основание входит в состав РНК вместо тимина у ДНК и, как и тимин, комплементарно аденину. Во время полимеразной реакции в этом месте происходит замещение на тимин, и возникает ошибка.
Еще одна проблема, которая ускользает от внимания многих исследователей, — так называемые митохондриальные псевдогены. В ядерный геном встроено множество копий генов митохондрий — всего более тысячи фрагментов разной длины. Как пойдет ПЦР, если они присутствуют в образце? Будут амплифицироваться короткие фрагменты ДНК, которые могут содержать как митохондриальные участки, так и похожие по последовательности ядерные псевдогены. В результате возможно копирование не только митохондриальной ДНК ископаемого животного, но и митохондриального псевдогена.
Кстати, именно это стало причиной ошибки с ДНК динозавра, о которой говорилось выше. Авторы пытались секвенировать митохондриальную ДНК, выделенную из кости динозавра. Получив последовательность, они проверили, нет ли сходства с митохондриальной ДНК человека. Сходства не нашли и решили публиковать данные, но позднее другие исследователи обнаруживали прямое совпадение с митохондриальным псевдогеном человека, который отличается от «истинных» митохондриальных генов. Поэтому в нашей базе данных имеются псевдомитохондриальные последовательности человека и других животных (особенно много таких генов у горилл), с которыми можно сравнивать новые экспериментальные данные. К счастью, в большинстве клеточных тканей человека копийность митохондриальных геномов достигает сотен и тысяч на клетку. Следовательно, в общем наборе молекул, которые секвенируются, преимущественно должны быть представлены настоящие митохондриальные последовательности.
Мамонт и слоны
В 2006 году мы полностью реконструировали митохондриальный геном шерстистого мамонта Mammuthus primigenius. Как это было сделано и для чего это было нужно?
Ранее не было определенного мнения о том, считать ли мамонта сестринской группой азиатскому и африканскому слону или относить к особой группе. Разделились они «всего» несколько миллионов лет назад, поэтому разобраться с их систематическим положением было непросто. Для этого проводили морфологические исследования, сравнивали бивни, строение хобота, однако разные авторы приходили к различным выводам. Затем появились методы ДНК-анализа, были определены короткие митохондриальные последовательности мамонта, но картина была та же самая: у одних исследователей мамонт оказывался ближе к африканскому слону, у других к индийскому.
Мы решили попытаться реконструировать весь митохондриальный геном. Нам удалось получить особенно хорошо сохранившийся образец с остатками плоти — фрагмент ноги мамонта, найденный на Чукотке в 1986 году и предоставленный Б.А.Малярчуком из Института биологических проблем Севера РАН. В ядрах клеток было столько ДНК, что ее можно было детектировать флуоресцентным красителем. Для столь древнего палеонтологического образца (животное погибло 30 тысяч лет назад) это было показано впервые.
Мы экстрагировали ДНК и с помощью электрофореза установили, что значительную ее часть составляет деградированная, однако удалось выделить и пригодную для анализа. Возможное присутствие микробной ДНК на данном этапе не исключалось. Мы сравнительно легко получили фрагменты митохондриальной ДНК, в том числе и необычайно крупные: до 1200—1700 нуклеотидов. Для всех образцов использовался негативный контроль, в котором мы проводили все те же процедуры, но не добавляли сам образец. Если бы в контроле появился продукт амплификации, это говорило бы о том, что имеет место загрязнение. Были приняты и другие меры предосторожности, позволяющие детектировать попадание в образец экзогенной ДНК.
В итоге из коротких фрагментов была сконструирована последовательность митохондриального генома (длиной 16842 нуклеотида). Хроматограмма секвенирования получилась такой же чистой, как и при анализе современных образцов. Впоследствии определили также полные митохондриальные последовательности геномов слонов. Образцы крови удалось взять у животных в зоопарке Торонто и парке Сафари в провинции Онтарио (Канада).
Мы ожидали, что в древней ДНК должны происходить постмортальные мутации. Загрязнение было маловероятно, так как мы никогда не работали со слонами или мамонтами. Сравнение с ДНК человека совпадений не обнаружило, а с ДНК африканского и индийского слона, напротив, показало наибольшее совпадение. Но в ПЦР-последовательностях, клонированных и затем амплифицированных для каждого клона отдельно, некоторые клоны содержали замены: в перекрывающихся концах фрагментов были отличия в один нуклеотид. Очевидно, причиной таких отличий и были постмортальные мутации. Окончательную последовательность мы составляли как консенсус множества фрагментов с учетом этого обстоятельства.
Наконец, мы попытались ответить на главный вопрос: к кому мамонт все-таки ближе, к африканскому слону или к индийскому? Оказалось, что по одним генам он ближе к азиатскому, по другим к африканскому — это и объясняет расхождение результатов в предыдущих работах. Но если взять полную последовательность, то по всем видам замен мамонт кластеризуется с индийским слоном, а не с африканским. Расчеты показали, что индийский слон и мамонт — более близкие, сестринские виды и у них был общий предок, который отошел от предка африканского слона.
Параллельно с нами митохондриальную ДНК мамонта секвенировала группа из Института эволюционной антропологии имени Макса Планка. У последовательности, которую опубликовали они, было несколько больше замен по сравнению со слонами. Это могло быть обусловлено либо ошибками, либо эволюционными причинами (они использовали останки мамонта, найденные в Якутии, а не на Чукотке). Мы разработали ряд подходов для детекции возможных ошибок, возникающих по техническим причинам при секвенировании или за счет постмортальных мутаций в древней ДНК. В результате было обнаружено, что у немецких авторов число мутаций необычайно высоко в пределах одного небольшого участка длиной 200—300 нуклеотидов. Между тем именно этот участок у других видов, в том числе и в последовательности ДНК мамонта, довольно консервативен, так что данный фрагмент ДНК в работе немецких коллег по тем или иным причинам содержал множество ошибок. Исключив эти ошибки, можно было сделать вывод, что расхождение ДНК-последовательностей у данных мамонтов, проживающих в Арктике, но географически и хронологически удаленных друг от друга, было весьма невелико.
Новое секвенирование
Исследования древней ДНК проводились с конца 90-х, затем на какое-то время затихли, отчасти потому, что эффективность существующих методов секвенирования в данном случае была недостаточно высока. С развитием новых методов это направление снова оживилось. В этих методах используются не те реакции, что в методе Сенгера. Но все они основаны на клональной амплификации фрагментов ДНК. Чтобы увеличить количество ДНК, как правило, необходима предварительная амплификация. Однако при ПЦР некоторые фрагменты амплифицируются менее активно, чем другие, и в результате теряются, мы их не видим на выходе. Чтобы избежать этого, был придуман метод так называемой эмульсионной ПЦР. Раствор ДНК вводят в смесь минеральных масел, с таким расчетом, чтобы каждая молекула оказалась в отдельном пузырьке — в собственном микрореакторе, вместе со всеми компонентами, необходимыми для амплификации. Тогда потеря материала получается минимальной, все фрагменты копируются как следует. Можно сделать так, чтобы исходная молекула ДНК была связана с субстратом, например с бусиной, покрытой праймерами (как в пиросеквенировании от компании «454 Life Sciences», которое часто называют просто 454-секвенированием — см. «Химию и жизнь», 2006, № 1). В итоге мы получим бусину, покрытую идентичными однонитевыми копиями исходного фрагмента ДНК. Дальше можно поместить эти бусины в ячейки-соты с люциферазой и люциферином и начать секвенирование методом синтеза второй нити: регистрировать вспышки в определенной ячейке при присоединении определенного нуклеотида.
Поскольку можно проделать это одновременно с миллионами молекул ДНК, это очень быстрый анализ. Например, 454-секвенирование в сто раз быстрее метода Сенгера и позволяет анализировать до 25 млн. нуклеотидов в одной реакции. Эта технология, вероятно, через год-другой дойдет и до судебной медицины, а пока ее активно используют при анализе ДНК из ископаемых образцов. Короткие фрагменты деградированной древней ДНК можно репарировать — нарастить им концы, с которыми будут взаимодействовать праймеры, либо клонировать в векторах и только затем амплифицировать.
Существуют и другие технологии секвенирования, в частности «Illumena», которая раньше называлась «Solexa» (по названию компании — разработчика метода, которую позднее приобрела компания «Иллюмена»). Этим методом удается секвенировать в одном анализе до миллиарда нуклеотидов. Но у него есть и недостаток: в одной реакции читается фрагмент не длиннее 30—40 нуклеотидов — впрочем, год назад было всего 25. По моему мнению, эта технология очень перспективна, за ней может быть будущее.
Чтобы показать, что эти методы применимы к древней ДНК, мы в сотрудничестве с директором Института генома Калифорнии Эдди Рубином попробовали выделить информативные последовательности ядерной ДНК из образца того же мамонта возрастом 30 тысяч лет. Оказалось, что при секвенировании всего генома (а не только митохондриальной ДНК) большая часть последовательности все-таки представлена фрагментами по 50—100 нуклеотидов. Это неплохая степень сохранности, и такая длина фрагментов как раз соответствует возможностям пиросеквенирования.
Как ни удивительно, оказалось, что большая часть полученной нами ДНК — это действительно ДНК мамонта. Ее удалось выделить очень чисто, ДНК микроорганизмов практически отсутствует (хотя обычно она составляет 99% всей ДНК, полученной из древних образцов). Следовательно, древние ДНК в некоторых случаях могут иметь чрезвычайно высокое качество.
Итак, если суммировать все, что мы знаем сейчас о древней ДНК, что представляется наиболее важным? Мы можем получить последовательности ядерной ДНК. Впервые это было показано для пещерных медведей, правда, 99% ДНК опять-таки составляла микробная. Тем не менее такие последовательности нельзя использовать для построения филогенетических деревьев, потому что каждая последовательность была прочитана только один раз, и никто не может сказать, насколько точно. В настоящее время группе исследователей из того же Института эволюционной антропологии имени Макса Планка удалось покрыть по крайней мере однократно значительную часть генома неандертальца. Но чтобы исключить ошибки, связанные с постмортальными мутациями, каждый участок необходимо прочитать множество раз. В некоторых случаях можно прицельно реконструировать определенные участки ДНК, в том числе полную митохондриальную последовательность, неоднократным перекрыванием фрагментов, и они действительно не будут содержать ошибок.
Гены рыжей женщины
Технология ДНК в судебной медицине основана главным образом на маркерах, которые используют тандемно повторяющиеся последовательности (short tandem repeats, или STR). Изучается индивидуальное разнообразие, обусловленное различным числом копий тандемных единиц. ДНК не секвенируют, а определяют размеры фрагментов методом электрофореза. Известные участки генома амплифицируют с помощью той же ПЦР, а затем смотрят, с какой скоростью движутся полученные фрагменты при капиллярном или гель-электрофорезе: маленькие фрагменты перемещаются быстрее, таким образом, по положению полоски можно определить ее длину. Обычно изучают повторяющиеся единицы длиной четыре нуклеотида: они дают наиболее отчетливый профиль, то есть набор характерных длин; раньше часто также употреблялся термин «фингерпринт» — отпечаток пальцев.
Чтобы «отпечаток» действительно был индивидуальным, недостаточно одной маркерной последовательности: одинаковое число повторов в одном участке может быть у многих людей. Поэтому приняты несколько маркеров, которые должны использоваться во всех лабораториях мира, занимающихся STR-анализом. Как правило, в наборах содержится 15—17 маркеров — их бывает достаточно для однозначного установлении отцовства, личности преступника или жертвы. Вероятность случайного совпадения сразу по всем маркерам очень низка.
Если нет возможности сравнить образец подозреваемого с образцом, найденным на месте преступления, то можно привлечь к анализу родственников. Для этого используют, в частности, профиль по мужской Y-хромосоме. Напомним, что значительная ее часть не рекомбинирует при образовании половых клеток, то есть не обменивается участками с парной хромосомой. (Парной хромосомы у нее, строго говоря, нет, поскольку у мужчин половые хромосомы — XY, а у женщин ХХ; у Х- и Y-хромосомы есть общий участок, но короткий.) Таким образом, даже у дальних родственников по мужской линии основная часть Y-хромосом будет идентичной. По материнской линии передается митохондриальная ДНК, которая также не рекомбинирует: ребенок наследует материнские митохондрии, содержащиеся в яйцеклетке. (Специалисты называют это «непересекающиеся женские и мужские линии».) В судебной медицине в первую очередь исследуют небольшие фрагменты митохондриальной ДНК, так называемые контрольные области (гипервариабельные районы I и II): в них больше всего индивидуальных вариаций.
Еще одно перспективное направление, которое получит развитие в ближайшем будущем, — определение по анализу ДНК внешних признаков человека, таких, как цвет волос, цвет глаз и т. п. Обычные фенотипические признаки относятся к полигенным, то есть определяются несколькими генами, поэтому их трудно предсказывать. Но существуют генетические варианты, которые довольно четко ассоциируют, например, с рыжим цветом волос и характерной для рыжих светлой кожей.
Одна из главных проблем при анализе деградированной ДНК человека — выпадение аллелей. Каждый ген человека представлен двумя копиями, в двух парных хромосомах. Но поскольку молекул в образце мало, не исключено, что будет амплифицирован только один из двух аллелей. А это может повлечь за собой серьезные ошибки. Например, чтобы определить принадлежит ли образец мужчине или женщине, проверяют, есть ли в нем последовательности, характерные для Y-хромосомы. Если они потеряются, может быть сделано ложное заключение о принадлежности образца женщине.
Сейчас для определения пола по ДНК обычно используется маркер гена амелогенина. Однако уже показано для многих популяций, что у мужчин в редких случаях встречаются делеции в гене амелогенина, локализованного на Y-хромосоме, и при обычном анализе такие мужчины будут ошибочно определяться как женщины. В таких случаях необходимы дополнительные анализы по другим генам. Чтобы избежать таких ошибок, мы разработали специальные подходы для анализа очень малых количеств деградированного материала, в частности подобрали дополнительные маркеры для определения пола (часть из них была запатентована).
Важный вопрос: какое минимальное количество ДНК необходимо для анализа? На уровне 20 пикограммов идентификация еще весьма успешна, а 20 пикограммов — это всего несколько геномов человека. Меньшие количества (5—6 пикограммов)— это уже один геном, и та же идентификация пола по амилогениновому гену не может считаться достоверной. На таком количестве нашим методом еще можно попытаться определить пол, но и в этом случае результат будет зависеть от везения. Таким образом, 20 пикограммов ДНК— это необходимый минимум, а лучше более 50—60, или более 10 геномов, — тогда можно быть уверенным в результате.