Шестнадцать процентов русского генома

Маркина Н.В.
(«ХиЖ», 2017, №5)

pic_2017_05_34.jpg

Успехи псевдонауки

Не так давно медиапространство было взбудоражено сенсационной новостью. Медико-генетическая компания «Генотек» представила «этнический портрет россиянина» и получила удивительные результаты: «среднестатистический россиянин лишь 16,2% своего генома унаследовал от жителей Центральной России, 19,2% — от украинцев и белорусов,13,1% от финнов, 6,3% от венгров» и т. д. Пошли заголовки вроде «Ученые: современные россияне являются "коренными" русскими лишь на 16%» (РИА Новости) или «В ДНК современных россиян только 16 процентов от генов коренных русских!» («Комсомольская правда», интервью генерального директора компании) и т. д. Генеральный директор «Генотека» Валерий Ильинский в своем интервью подтверждает эти цифры и делает вывод, что «Россия — это большой плавильный котел наций и в этом отношении похожа на Соединенные Штаты Америки». Пестрый «этнический портрет» появился в результате исследования, проведенного специалистами «Генотека» среди жителей Москвы, Санкт-Петербурга, Сочи, Краснодара, Ростова-на-Дону, Владивостока, Новосибирска, Симферополя и Киева. В выборку входило около 2000 человек, все они — клиенты компании, интересующиеся своим происхождением.

Сразу скажем, что в научной среде результаты, о которых сообщил «Генотек», получили резко отрицательную оценку. Попробуем разобраться почему.


Этносы и генофонды

Для людей естественно интересоваться своими предками — мало кто знает собственную родословную глубже, чем до прабабушек и прадедушек, но многие хотели бы узнать больше. Этим занимается прикладная наука генеалогия, причем к традиционной генеалогии, работающей с регистрационными книгами и другими историческим источниками, сегодня добавляются возможности генетики.

В последние несколько лет родилась генетическая генеалогия, которая изучает происхождение человека по генетическим маркерам. Эти маркеры — изменения в ДНК, мутации, они передаются из поколения в поколение и служат метками, позволяющими проследить цепочку наследования. Удобнее всего прослеживать эту цепочку по отцовской линии, для этого исследуют Y-хромосому, которая передается от отца к сыну. Большинство компаний по генетическому тестированию так и поступает. У человека определяют вариант Y-хромосомы — гаплогруппу (это называется генотипированием) и выдают «генетический паспорт» с описанием, когда и в каком регионе возникла данная Y-хромосомная веточка, когда и где появились предковые ветви, вплоть до тех, которые идут из Африки — прародины человечества. Из этого описания человек может узнать место происхождения своих предков по отцовской линии — более или менее отдаленных (см. «Химию и жизнь», 2015, 4).

pic_2017_05_35.jpg

«Генетические портреты» этнотерриториальных групп татар по Y-хромосоме. Цифрами и буквами обозначены разные гаплогруппы. Среди них нетрудно увидеть якобы «славянскую» R1a

Но можно ли по гаплогруппам определить этнос своих предков? Популяционные генетики не наклеивают на гаплогруппу ни этнических, ни лингвистических ярлыков. Зато это делает так называемая ДНК-генеалогия, основатель которой, химик Анатолий Клесов, именует гаплогруппу R1a «славянской», невзирая на то что она появилась около 20 тысяч лет назад, а славяне — около полутора тысяч лет назад. Да, те или иные варианты Y-хромосомы встречаются с разной частотой в разных популяциях, но — и генетики это постоянно подчеркивают — в любой из них есть разные варианты. Гаплогруппа — это лишь метка, она не исчерпывает всего генетического разнообразия популяции. Например, гаплогруппа R1a, действительно, с большой частотой встречается у восточных славян, а также у некоторых западных (поляков), составляя около половины Y-хромосомного разнообразия. Но не менее обычна она в некоторых этнических группах Индии, Ирана, Афганистана, у отдельных народов Средней Азии (киргизы), Сибири (алтайцы); около трети Y-хромосомного генофонда она составляет у балтийских народов и у татар. Как видим, ярлыков на нее не напасешься.

Популяционные генетики изучают не этносы, а генофонды и очень осторожно подходят к той грани, когда предмет их исследования соприкасается с этносами. Потому что этнос — понятие социальное и определяется самосознанием. Этнос неотделим от языка, а языки и гены передаются от поколения к поколению разными путями. По определению, которое дает археолог и филолог, профессор Лев Самуилович Клейн, этнос — «категория социальной психологии. То есть стихийное объединение людей по общности идей. В основе этой категории идея общности исторической судьбы, преимущественно — общности происхождения, не важно истинная или ложная, но подкрепляемая вполне реальными признаками, всякий раз разными» (Теоретический словарь археологии. Донецк, изд. Донецкого национального университета, 2014). Из этого явно следует, что генетикой поверять категорию этноса бессмысленно — для этнического самосознания не суть важно, каков будет результат.


Что такое коренной народ?

Генетики изучают генофонды коренных народов. Конечно, при этом они эти народы как-то называют и в статьях пишут о генофондах, например, северных русских, крымских татар, осетин, карелов, ульчей, эвенков. Но подчеркивают, что изучают именно генофонды, которые могут оказаться разными в различных группах одного и того же народа. Так, северные русские генетически отличаются от центральных и южных русских, а крымские татары — от поволжских или сибирских татар и т. д.

На вопрос, как определяют коренной народ, Валерий Ильинский отвечает более чем странно: «В современных генетических исследованиях коренным считается народ, который в третьем-четвертом поколении постоянно населял данный регион». Этот срок — около 100 лет — даже журналистке, берущей интервью, кажется странным, наверняка и читателям тоже. На самом-то деле «принцип трех поколений» (который, возможно, имеет в виду директор «Генотека») — это вовсе не критерий коренного народа, а тот критерий, по которому генетики отбирают участников для обследования популяции. А нужен он для того, чтобы отсечь влияние недавних миграций (см. «Химию и жизнь», 2016, 5). Весь изучаемый народ населяет данный регион гораздо дольше, но этот принцип гарантирует, что в исследование не попадут дети или внуки недавних переселенцев.

«Популяция, связываемая с этносом, должна пройти через множество поколений, для того, чтобы сформировать своеобразный генофонд, — объясняет доктор биологических наук Е.В.Балановская, заведующая лабораторией популяционной генетики человека ФГБНУ «Медико-генетический научный центр».— И популяционная генетика никогда не решает, какой народ где является коренным». Это сфера деятельности этнографов, только они изучают ареалы коренных народов.

Свои рассуждения Ильинский продолжает еще одним странным утверждением: «Если человек говорит, что все его прадедушки и прабабушки исторически жили на территории Центральной России, то мы считаем, что он типичный представитель коренного народа». «Какого? — комментирует Е.В.Балановская. — Например, по данным переписи 2002 года, в Центральной России проживает более 18 народов. А “Генотеком” обнаружен новый коренной народ — “центрально-российский”?»

По ее мнению, «если бы ученые из “Генотека” поставили иную задачу — создать не этнический, а генетический портрет “среднестатистического россиянина” — эта задача была бы странной, но все же научной». Так, может быть, дело только в словах, точности терминологии? Ну, назовем полученный результат не «этническим портретом», а «генетическим портретом» россиянина, окажется ли он при этом верным?

«Для этого необходимо было бы собрать выборку, репрезентативно представляющую генофонды не только всех народов России, но и их географические подразделения», — продолжает Е.В.Балановская. В нашей стране, по данным 2010 года, проживают 195 этнических групп, все они — россияне. В этой гипотетической выборке все они должны быть представлены. А кто представлен в выборке «Генотека» из 2000 человек? Клиенты компании из больших городов, те, кто заказал исследование своего генома. Перечислим эти города еще раз: Москва, Санкт-Петербург, Сочи, Краснодар, Ростов-на-Дону, Владивосток, Новосибирск, Симферополь, Киев. Странное представление у специалистов «Генотека» о среднестатистическом россиянине (особенно с учетом жителей Киева).


Отступление о методах

О методике своего исследования компания в популярных материалах не рассказывает, хотя Валерий Ильинский объясняет общую идею: «Все мы с точки зрения генетики являемся огромной смесью из совершенно разных фрагментов разных этнических групп», «среднестатистический житель России 16% генома унаследовал от коренных жителей Центральной России, а все остальные участки являются мозаикой, составленной из фрагментов геномов, характерных для обитателей других регионов». В этих утверждениях, во-первых, опять путаются гены и этносы — «фрагменты разных этнических групп» не могут быть частями генома. А во-вторых, создается впечатление, что геном — это действительно мозаика, на которую достаточно посмотреть и увидеть, что «красные» кусочки получены из Центральной России, «синие» — из Украины и Белоруссии, «зеленые» — из Финляндии и т. п. На самом деле все обстоит намного сложнее.

Популяционные генетики очень часто для изучения происхождения популяции используют метод под названием ADMIXTURE, что буквально означает «смешение». Поскольку практически все популяции исторически сложились в ходе смешения генетических потоков от предковых популяций, компоненты этой смеси можно определенным приемом распознать. Метод этот основан на многих допущениях, но в итоге дает полезные результаты. Если нужно сравнить по происхождению несколько популяций, исследователи задают условное число условных предковых популяций K. В модель закладывается генетическое разнообразие каждой популяции (по однонуклеотидным заменам — «снипам») и это самое число К. На выходе для каждой популяции получается спектр предковых вкладов, раскрашенный в разные цвета. Глядя на этот спектр, популяции можно сравнивать по предковым вкладам и делать вывод об их родстве. В процессе сравнения выясняется, что какую-то условную предковую популяцию можно привязать к определенному региону, и она из условной становится реальной. Так, например, выяснилось, что в генофонде современных европейцев в разные исторические эпохи смешались гены европейских охотников-собирателей, первых земледельцев с Ближнего Востока и кочевников из Причерноморско-Каспийских степей (что подтверждено методами палеогеномики, позволяющими напрямую изучать геномы древних людей).


Счетчики этнические, точнее популяционные

По такому же принципу работают модели, которыми пользуются не академические ученые, а деятели так называемой гражданской науки — генетические генеалоги и «геномные блогеры». Генетической генеалогией в Рунете интересуются тысячи человек, которые организуются вокруг тематических ресурсов. Рассказывает Владимир Гурьянов, создатель форума «Молген» (forum.molgen.org): «Чаще всего люди начинают проявлять интерес к генетической генеалогии через попытку интерпретации данных своего теста или теста своих родственников. Просыпается интерес к другим методам, которые позволяют найти родственников по косвенным признакам (однофамилец, место жительство предков, сословная принадлежность) или проверить те или иные гипотезы. Чаще всего их цели не выходят за пределы простого любопытства, но есть и любители, которые по широте кругозора и знанию отдельных вопросов близки к профессиональным ученым. В круг их интересов входит изучение отдельных популяций, реконструкции возможных сценариев исторических миграций, распространения отдельных гаплогрупп и субклад и увязка их с историческими данными».

Модели, которые используют генетические генеалоги, иногда называют «этнокалькуляторами», хотя, поскольку этнос нельзя вычислить генетически, правильнее называть их «популяционными калькуляторами». Генеалоги их разрабатывают и применяют для практических целей, вычисляя в геномах компоненты разного происхождения. Разобраться в том, как они работают, помог один из геномных блогеров, статьи которого мы не раз публиковали на междисциплинарном сайте «Генофонд.рф», — Сергей Козлов.

Автор задает какое-то число предковых компонентов, вводит геномные выборки из разных популяций, и программа создает файл частот аллелей (генетических вариантов) для каждого компонента. После этого можно ввести в программу данные по любому геному и получить пропорции предковых компонентов, то есть доли генетического вклада каждой из предковых популяций.

Как объясняет Сергей Козлов, есть основания предполагать, что «Генотек» использовал один из таких калькуляторов — Eurogenes K36, созданный в 2012—2013 годах геномным блогером Дэвидом Веселовским, известным под никами Davidski и Polako. Этот инструмент был разработан с целью вычисления в геноме не только вклада древних популяций, но и не столь далеких предков. При его создании выборки по европейским и прочим популяциям сгруппировали в 36 кластеров, и на их основе были заданы предковые компоненты. Именно из 36 «этнических компонентов» и состоит «этнический портрет» жителей России, который презентует «Генотек». Есть веские основания предполагать, что «Генотек» использовал именно этот инструмент, некогда выложенный его автором в открытый доступ. Но вот что интересно: названия компонентов не только переведены на русский язык, а изменены, иногда весьма существенно. Например, тот компонент, который в результатах «Генотека» назван «Центральной Россией» (и который в интерпретации СМИ превратился в «коренных русских»), исходно назывался Eastern Euro (Восточная Европа). Еще интереснее другое: на основе каких популяций этот компонент был исходно сформирован автором Eurogenes K36. Как установил Сергей Козлов, для этого были использованы 14 геномов популяций эрзя и мокша (Мордовия), 25 геномов русских из выборки на границе Архангельской и Вологодской областей и 3 генома других северных русских. И вот эти северные русские (генетически сильно отличающиеся от центральных русских), а с ними эрзя и мокша в итоге составили тот самый 16%-ный вклад коренных русских, представленный «Генотеком»!

Кстати говоря, сам автор Eurogenes K36 предупреждает, что результаты, полученные с помощью этого калькулятора, нельзя воспринимать буквально: «Если вы, допустим, англичанин и получили 12% компонента “Пиренейский полуостров”, это не означает, что у вас есть недавние предки из Испании или Португалии. На деле это лишь показывает, что 12% ваших аллелей схожи с образцами, использованными для выведения «иберийского» компонента. Предполагать влияние пиренейцев можно лишь в случае, если ваши значения явственно превышают результаты большинства остальных англичан». Но «Генотек» на это предупреждение внимания не обращает. А что получается при буквальном применении Eurogenes K36, Сергей Козлов продемонстрировал на примере самого Дэвида Веселовского. По результатам вычисления, поляк, живущий в Австралии, оказался «коренным русским» на 13,04%; 27,06% составили Белоруссия и Украина; 13,08% — Англия; 11,67% — Финляндия и т. д. «Как видно, Польша “оказалась плавильным котлом наций” не хуже России. То же самое можно отнести и к большинству других европейских стран. На деле же это попросту неверная интерпретация результатов», — подводит итог Козлов.


Различить далеких легче, чем близких

Можно ли в принципе сегодня решить такую задачу: «на сколько процентов одни народы генетически сходны с другими»?

Как объяснила автору этой статьи Анча Баранова, профессор Университета Джорджа Мейсона (США), не составляет труда посчитать проценты сходства с далекими популяциями, которые по большинству генетических маркеров отличаются сильно. Но различить близкие популяции, например русских, украинцев и белорусов, очень сложно.

Татьяна Татаринова, профессор Университет Южной Калифорнии, приводит такой пример: «Предположим, индивид Х похож по набору маркеров на украинцев на 90%, на русских на 90% и на белорусов на 90%. Если не учитывать, что все эти три народа родственные, и просто взвесить вклады, получится, что индивид на треть русский, на треть белорус и на треть украинец. А надо учесть, что (выражаясь математически) базис — неортогональный, иными словами, украинцы, русские и белорусы похожи между собой. В таком случае взвешивание процентов — некорректно».

Как минимум, для таких оценок надо иметь хорошие базы данных по популяциям (обязательно сельским), которые усилиями российских генетиков только-только набираются. В европейских базах Россия очень плохо представлена. Собственно, выше уже описано, какими выборками пользовался «Генотек» для оценки компонента «коренных русских» в геноме «среднестатистического россиянина». Очевидно, что польза от таких подсчетов для общества нулевая, а конкретные клиенты за свои деньги получают порцию лапши на ушах. Для науки же это явный вред, потому что оказывается дискредитированной популяционная генетика с ее строгими методами, которые не приводят к таким эффектным выводам. Ну а для коммерческой компании, безусловно, сплошная выгода от такой рекламы. Ведь все больше клиентов понесут свои денежки в «Генотек» в надежде узнать что-то интересное про своих предков. Правда это или нет, компанию волнует меньше всего.


Кому можно верить?

В заключение надо добавить, что достоверность генетических тестов на происхождение — не только российская проблема. Журналисты американской компании «Inside Edition» решили экспериментально проверить, насколько верные результаты предоставляют своим клиентам известные компании «23 and Me», «Family Tree DNA» и «Ancestry DNA». Способ проверки они выбрали очень простой — нашли однояйцевых близнецов (которые обладают идентичным геномом) и предложили им протестироваться. Сестры-тройняшки получили в компании «23 and Me» ответ, что на 99% имеют европейское происхождение, но более детальные результаты оказались различными. Для Николь вклад французов и немцев оценили в 11%, для Эрики — в 22,3%, для Жаклин — в 18%. Результаты сестер озадачили. Другая тройня сдала образцы ДНК в компанию «Family Tree DNA». По результатам доли популяций Британских островов в их геномах оказались похожими, хотя неодинаковыми: 59% для Эрин, 66% для Мэнди и 70% для Мелиссы. Кроме того, у Мэнди было выявлено 6% скандинавского происхождения, а у ее сестер — нет. Третьей тройне, сдававшей образцы ДНК в «Ancestry DNA», повезло больше: они получили одинаковые результаты — основной вклад в их происхождение заняли популяции Британских островов, 45—47% — Италия и 25% — Греция. Но это не означает, что «Ancestry DNA» делает эти тесты лучше, чем «23 and Me», потому что четверо близнецов, которые тестировались в «23 and Me», получили идентичные результаты (правда, они касались хорошо различимых популяций — 49% Европа и 46% Западная Африка).

Компании объясняют такие расхождения тем, что конкретный результат всегда получается с той или иной точностью, которая тем меньше, чем более локальный регион происхождения нас интересует, — то есть Европу и Африку в ваших предках можно различить гораздо достовернее, чем Германию и Францию. Коротко говоря, генетическая генеалогия хорошо работает на далеких расстояниях (может сказать, на каком континенте жили ваши предки) и на близких (успешно идентифицирует личность и семейное родство). А вот на средних, с точностью до региона Европы — пока есть сложности.

Впрочем, наука не стоит на месте, все больше популяций мира охвачено полным секвенированием геномов, а значит, постепенно набираются репрезентативные базы данных. Так что в недалеком будущем каждый, кто захочет, сможет получить свой более или менее точный генетический портрет. А тот, кому понадобится «этнический портрет», может просто сфотографироваться в национальном костюме, с томиком любимого поэта в руке.


Что можно узнать о человеке по его ДНК

pic_2017_05_37.jpgИнформация основана на личном опыте автора статьи. Тестирование своего генома Надежда Маркина проводила не в «Генотеке»

Здоровье: мутации, вызывающие моногенные заболевания (зависящие от одного гена); риски некоторых полигенных заболеваний (риск больше или меньше среднего); индивидуальную чувствительность к лекарствам; особенности обмена веществ, которые определяют оптимальный тип питания; непереносимость некоторых продуктов, реакцию на алкоголь, вероятность долгожительства и пр.

Спорт: генетические предпосылки выносливости, силы и скорости, эффекты от физических нагрузок.

А также множество других индивидуальных характеристик: темперамент, реакция на стресс, склонность к эмпатии, объем памяти, болевая чувствительность и даже генетическая предрасположенность к абсолютному слуху.

О внешности человека по его ДНК можно сказать, с какой вероятностью у него, например, голубые глаза, зеленые или карие; то же — про цвет и курчавость волос.

Наконец, гаплогруппы и происхождение. У меня была определена митохондриальная гаплогруппа Т2b, указан регион ее возникновения, описана ее история (у мужчин добавляется гаплогруппа Y-хромосомы). Мое происхождение европейское на 91%. А доля неандертальских включений в моем геноме — 1,4% (в среднем по Европе 2,6%). 

Разные разности

01.08.2017 23:27:00
...явление квантовой запутанности продемонстрировано для фотонных пар, разделенных расстоянием 1203 км на Земле, с ретрансляцией через спутник. Результаты показывают возможность будущей глобальной сети квантовой связи («Science», 2017, 356, 6343, 1140—1144, doi: 10.1126 / science.aan3211)...
>>
06.07.2017 10:00:00
...Казанский федеральный университет принял решение прекратить сотрудничество с итальянским хирургом-трансплантологом Паоло Маккиарини, ранее уличенным в этических нарушениях и фальсификации данных («Science», 2017, doi: 10.1126/science.aal1201)...
>>
31.05.2017 14:02:00
...космический аппарат «Кассини» в последний раз прошел мимо Титана, крупнейшего спутника Сатурна, и направляется в область между планетой и ее кольцами, через которую пройдет 22 раза, а затем, в сентябре 2017 года, нырнет в атмосферу Сатурна («Nature», 2017, 544, 7649, 149—150, doi:10.1038/544149a)...
>>
30.04.2017 10:57:00
...международная коллаборация биологов создала дрожжи с искусственными хромосомами — первый эукариотический организм с синтетическим геномом («Science», 2017, 355, 6329, 1040—1044, doi: 10.1126/science.aaf4557, и другие материалы этого номера)...
>>
30.03.2017 14:30:00
...на карликовой планете Церере в астероидном поясе есть органическое вещество, и оно, по-видимому, не занесено извне, а образовалось на месте («Science», 2017, 355, 6326, 719—722, doi: 10.1126/science.aaj2305)...
>>