Výskum


           

Česká Y-DNA: Haplogroupa R1a

Haploskupina R1a je nejpočetnější haploskupina z Databáze české Y-DNA, zahrnuje třetinu všech našich záznamů. V tomto roce počet našich profilů haploskupiny R1a překročil stovku a také počet profilů, které mají určeno 25 markerů se blíží padesátce. To nám dovoluje udělat studii vztahů mezi jednotlivými profily v závislosti na počtu použitých markerů v metodě Median Joining Network. Považujeme to za velmi důležité, protože většina českých záznamů je "krátká". Odhalení případných vztahů a zákonitostí, které platí pro dlouhé i krátké profily nám pomáhá odhalovat vnitřní strukturu haploskupiny a sdružování profilů do skupin stejných vlastností (a hlavně shodného původu) už při znalosti nižšího počtu markerů. Haploskupina R1a, resp. R1a1 nemá vlastně žádnou oficiální vnitřní strukturu, na rozdíl třeba od skupiny R1b, jež je pomocí dosud odhalených SNP mutací rozdělená do cca 20 podskupin.
Neznalost vnitřní struktury skupiny R1a je dána především tím, že je málo zastoupena ve světových databázích a oficiální výzkum není tedy vystaven takové poptávce jako třeba u zmíněné skupiny R1b. Rozšíření haploskupiny R1a v Evropě je nerovnoměrné, dominuje ve východoevropských státech, a proto je často spojována s tzv. slovanským etnikem a původem. To je ovšem přinejmenším pošetilý názor, neboť na nedávném příkladu haplotypu pocházejícím z pohřebiště v Eulau a starém 4600 let, jsme si ověřili, že aspoň jedna část evropské R1a se v regionu střední Evropy vyskytovala v době nejméně dvakrát starší než je odhadovaná doba vzniku slovanů. Také je dobře známo, že mezi obyvateli středoasijských zemí je R1a zastoupena ještě mnohem výrazněji než v zemích východní Evropy.

Na prvním obrázku (kliknutím se obrázek ukáže v plném rozlišení) vidíme české a slovenské profily haploskupiny R1a zobrazené v rozlišení 17 markerů.
Profily z Ysearch mají před svým ID předponu kódu země původu. Program Network ořezává ID na 6 znaků. Až na vyjímky je takto ořezané ID jednoznačné.

Světle zeleně jsou zobrazeny profily z našich databází, tmavozeleně profily z Ysearch, které by měly mít české předky, žlutě pak ostatní profily z Ysearch, které mají určeny stejné markery. Hnědě jsou označeny profily z archeologických výzkumů,
LC-R1a je profil zjištěný v Lichtensteinské jeskyni starý 3000 let,
profil z pohřebiště v Eulau je starý 4600 let.
Tyto dva prehistorické profily jsou doplněny modálními hodnotami chybějících markerů. Ostatní barvy budeme diskutovat níže.

Pro výpočet grafu byly (na Genebázi poprvé) použity váhy zohledňující rozdílné mutační rychlosti různých markerů. Určování mutačních rychlostí markerů se věnuje celá řada světových laboratoří. Pomalu mutujícím markerům se dávají vyšší váhy než rychle mutujícím. Grafy, kde různé markery mají stejnou váhu, bývají velmi nepřehledné, protože rychle mutující markery vnášejí šum a falešné vazby. Příklad ukazuje ta samá data zpracovaná při shodných mutačních rychlostech:


Graf je velmi přehledný, v řadě jeho částí vidíme dobře definovatelné dílčí větve.

V další části textu budeme sledovat, zda tyto skupiny jsou vidět i na grafech s vyšším rozlišením. Pokud ano, pokusíme se je blíže určit.

Graf byl upraven. Spojnice i uzly byly přesunuty tak, aby byly přehledné jednotlivé větve a názvy uzlů byly dobře čitelné.
Zpracováno 7.4.2009, 183 záznamů, haploskupina R1a, 17 markerů.
DYS19, DYS390, DYS391, DYS392, DYS393, DYS385a, DYS385b, DYS437, DYS438, DYS439, DYS389-1, DYS389-2, DYS456, DYS458, GATA-H4, DYS635 a DYS448.
V další části jsme se pokusili vytvořit stejné grafy pro vyšší počty markerů, pro 25: a pro 56 markerů: .
Oba grafy jsou opět upraveny tak, aby aby byly dobře viditelné jednotlivé skupiny.
Zpracováno 7.4.2009, 436 záznamů, haploskupina R1a, 25 markerů.
DYS19, DYS390, DYS391, DYS392, DYS393, DYS385a, DYS385b, DYS437, DYS438, DYS439, DYS389-1, DYS389-2, DYS456, DYS458, GATA-H4, DYS448, DYS446, DYS444, DYS388, DYS426, DYS481, DYS449, DYS447, DYS459a a DYS459b.
Zpracováno 7.4.2009, 396 záznamů, haploskupina R1a, 56 markerů.
DYS19, DYS390, DYS391, DYS392, DYS393, DYS385a, DYS385b, DYS437, DYS438, DYS439, DYS389-1, DYS389-2, DYS456, DYS458, GATA-H4, DYS448, DYS446, DYS444, DYS388, DYS426, DYS481, DYS449, DYS447, DYS459a, DYS459b, DYS454, DYS455, DYS460, YCAIIa, YCAIIb, DYS607, DYS576, DYS570, DYS442, DYS531, DYS578, DYS395A1a, DYS395A1b, DYS590, DYS537, DYS641, DYS472, DYS406S1, DYS511, DYS413a, DYS413b, DYS557, DYS594, DYS436, DYS490, DYS534, DYS450, DYS520, DYS617, DYS568, DYS487, DYS572, DYS640, DYS492 a DYS565.


V grafu pro 56 markerů je vyznačeno několik skupin profilů, u kterých je předpoklad, že by mohly byt lokalizovatelné i v grafech nižšího rozlišení. Až na vyjímky jsou předmětem zájmu profily z našich databází.

Červeně označený profil je teoretický modální profil všech R1a1 z Ysearch k roku 2007.

Skupinu V jsme se pokusili spojit s již dříve v cizině známou skupinou haplotypů, které se vyznačují tím, že mají marker DYS388=10. Další obrázek ukazuje detail této skupiny.

Na tomto detailu je vyznačeno místo definující skupinu profilů mající marker DYS388 rovný 10. Pokus vyznačit všechny tyto profily na grafech snižším počtem markerů skončil neúspěchem - profily nevytvářely žádné jasně viditelné skupiny. Jedinou vyjímkou jsou profily vyznačené právě zde. Zde definovaná skupina V je tedy jen částí skupiny profilů definované pomocí markeru DYS388.

Skupina N má pro nás velkou důležitost, zdá se totiž, že do ní patří třetina českých haplotypů R1a. Neznáme zatím žádné objektivní kritérium pro její určení, snad jen to, že spolu se skupinou P vytváří na grafech oblasti, které mají vyšší hodnoty markeru DYS481, a to 25 a vyšší.


Písmenem E není označena žádná skupina, jde jen o pokus vyznačit na grafech s vyšším počtem markerů pravděpodobnou polohu, kde by se mohl nacházet haplotyp z Eulau. Písmeno E zde označuje profil nejbližší profilům, které jsou opět nejbližší profilu z Eulau na grafu 17 markerů.
Skupina S je podobně jako V dobře známa z dřívějších výzkumů haploskupiny R1a. Jde o skupinu haplotypů, které mají hodnoty markeru YCAIIa,b rovny 19,21. Už řadu let se ví, že tyto haplotypy se vyskytují pouze v Británii a Norsku.
Skupina F by mohla odpovídat třetí nejpočetnější skupině českých a slovenských profilů z grafu 17 markerů.
Detaily skupin S a F:



Nyní se podíváme, jak jsou výše vyznačené skupiny vidět na grafech s nižším rozlišením.
Jak je napsáno v úvodu, odhalení nějakých pravidel či vlastností by pomohlo přiřazovat do skupin i profily, u kterých známe jen malý počet markerů.

Graf s rozlišením 25 markerů.
Skupiny N a P na tomto grafu vytvářejí velké jasně definované samostatné části. Je to opět tím, že na rozdíl od zbytku grafů mají hodnoty markeru DYS481 rovny 25 a výše.
Skupina F obsahuje už jen dva profily z grafu 56 markerů.
Detail:

Také skupina V je zde samostatná. Pokud bychom do ni zařadili i další profily, které mají hodnotu markeru DYS388=10, nacházely by se uprostřed grafu v málo přehledné oblasti.

Skupina S zaujímá na tomto grafu několik blízkých větví bez zřejmé vzájemné souvislosti. Je to tím, že pro tento graf nebyly použity markery, které tuto skupinu definují. Přesto je vidět, že (až na vyjímky) profily této skupiny se "drží u sebe".
Detail skupin V a S:


Nyní se podívejme na stav našich skupin na grafu 17 markerů.

I zde skupina N vytváří samostatnou větev naprosto jasně graficky oddělenou od zbytku grafu. Obsahuje ale už jen dva profily z grafu 56 markerů. V grafu jsou další tři profily této skupiny z grafu 56 markerů, ale ty už leží v naprosto jiných částech grafu.

Podobně skupina V obsahuje už jen dva profily viditelné i na grafu 56 markerů. I tato skupina je zde jasně graficky oddělena od ostatních částí.

Skupina P nemá přímé spojení s grafem 56 markerů. Obsahuje zde mnoho profilů, patřící do této skupiny i na grafu 25 markerů.

Skupina F také obsahuje dva profily viditelné i na grafu 56 markerů a i zde je jasně graficky definovatelná.

Zato skupina S zde má nejasné místo a nelze ji graficky vymezit. Lze z toho vyvodit, že zde chybějící markery, použité v grafu 25 markerů, mají nějakou souvislost s vymezením této skupiny.

Grafy s malým rozlišením neposkytují tedy žádnou jistotu co se týče přiřazení nějakého profilu do určité podskupiny.
Více jisti si můžeme být jen tehdy, kdy je studovaný profil blízko profilu, jehož polohu na grafu známe i pro vysoké rozlišení.
Stále platí, že se musíme snažit o určení vyššího počtu markerů. Také si musíme být vědomi toho, jak málo profilů bylo použito k tvorbě těchto grafů. Jak budou přibývat další profily, dojde jistě i k velkým změnám grafů. Příkladem mohou větve grafu viditelné v horní části obrázku. Zde profily z naší databáze začínající písmenem O jsou známé teprve několik málo měsíců nebo týdnů. Před tím v této části grafu žádné české nebo slovenské profily nebyly.

Z množství případů, kdy profil, který se v grafu s vyšším rozlišením nachází v nějaké skupině a v grafu z nižším rozlišením je úplně někde jinde, vyplývá, že už tyto grafy nesou v sobě informaci o další vnitřní struktuře těchto skupin. Jakékoliv závěry by však zatím byly jen unáhlené.
Dokud nebudou známé SNP mutace přesně rozdělující podskupiny R1a nezbývá než shromažďovat další profily a sledovat chování grafů.

Následující mapa znázorňuje země odkud pocházejí profily jednotlivých skupin.
Písmeno E neoznačuje skupinu, ale profily blízké profilu z Eulau, a to do genetické vzdálenosti 3 včetně.
Mapa se týká pouze profilů použitých v grafech této studie.



                  Ych files:   17.ych 25.ych 56.ych
© Genebáze

spät