Analyse de l’haplogroupe mitochondrial HV

Une étude récente des marqueurs génétiques uni-parentaux en Italie comprenant un millier d’individus a révélé que l’haplogroupe mitochondrial HV est celui qui possède les plus anciennes racines en Italie. Cette étude peut être rapprochée d’une autre qui a étudié l’ADN mitochondrial d’un squelette Mésolithique de Sicile vieux de 14.000 ans d’haplogroupe HV1. Ainsi cet haplogroupe semble être une composante cruciale des premières dispersions humaines en Eurasie. Il a cependant été peu étudié jusqu’ici mis à part ses sous-clades H, V et HV4.

L’haplogroupe HV est une sous-clade majeure de l’haplogroupe R0, caractérisée par la mutation 14766 et comprenant au moins 18 sous-clades connues. La plus connue de ces sous-clades est l’haplogroupe H. L’haplogroupe V est lui contenu dans la sous-clade HV0. L’haplogroupe HV a probablement émergé entre l’Asie Centrale et l’Asie de l’Ouest. L’haplogroupe HV(xH,V) qui exclu les sous-clades H et V, n’est pas très commun en Europe avec des fréquences qui varient de 0 à 10%.

Certains scientifiques associent des lignages avec la diffusion des hommes au Paléolithique, notamment avec le repeuplement de l’Europe à partir des refuges après le dernier maximum glaciaire. Les refuges principaux sont la région Franco-Cantabrique, les Balkans, le Caucase et le sud de l’Italie. L’haplogroupe HV4 a été étudié précédemment comme un exemple de ces reconstruction phylogéographiques. Un fort signal d’expansion d’une de ses sous-clades a été détecté à la frontière entre l’Espagne et la France et associé à la repopulation de la région à partir du refuge Franco-Cantabrique. Cette étude a estimé l’âge de l’haplogroupe HV4 autour de 14.200 ans et suggéré que sa sous-clade HV4a1a a subi une forte expansion à partir de la région Basque durant le Dryas récent.

Sara De Fanti vient de publier un papier intitulé: Fine Dissection of Human Mitochondrial DNA Haplogroup HV Lineages Reveals Paleolithic Signatures from European Glacial Refugia. Elle a étudié la séquence mitochondriale complète de 55 individus Italiens appartenant à l’haplgroupe HV(xH,V). Ces séquences ont été ensuite ajoutées à 261 autres séquences du même haplogroupe préalablement publiées pour former un ensemble total de 316 séquences mitochondriales complètes réparties en Eurasie.

Les clades principales obtenues sont HV0, HV1, HV2 (en dessous de la mutation 73) et HV4. Les clades HV6, HV7, HV8, HV9, HV10, HV11, HV15, HV15, HV16 et HV17 se regroupent ensemble sous la mutation 16311 anciennement appelée HV3:
2015_DeFanti_Figure1A.jpg

L’arbe phylogénétique complet obtenu est accessible ici.

Une analyse a ensuite été réalisée avec le logiciel BEAST qui permet de reconstituer un arbre phylogénétique et d’estimer les âges des différentes branches de cet arbre. Le taux de mutation de Soares a été utilisé. Ainsi le temps de coalescence de HV est estimé autour de 28.000 ans, HV-73 (au-dessus de HV2) autour de 38.000 ans, HV0 autour de 17.000 ans, HV1 autour de 24.000 ans, HV4 autour de 20.000 ans et le bloc HV-16311 autour de 14.000 ans:
2015_DeFanti_Figure1B.jpg

La figure ci-dessous localise la distribution géographique des principales sous-clades de HV(xH,V) en Italie:
2015_DeFanti_Figure2.jpg

Ainsi HV0 apparait à hautes fréquences en Italie du Nord, mais également en Sicile, HV4, HV* et HV-73 sont plus fréquents en Italie du Sud.

De plus une analyse en correspondance a permi de situer les sous-clades de HV en Eurasie:
2015_DeFanti_FigureS4.jpg

Ainsi HV0 et HV-16311 sont plus fréquents en Europe de l’Ouest et du Nord et en Italie du Nord, HV4 est plus fréquent en Europe du Sud (zone Franco-Cantabrique et Italie), HV* en Italie du Sud et Europe de l’Est, HV-73 et HV1 au Proche-Orient, dans le Caucase et en Afrique du Nord et de l’Est.

L’haplogroupe HV4 est défini par la mutation 7094. Des séquences qui ont divergé très tôt sont observées en Italie du Centre et du Sud notamment entre les sous-clades HV4b et HV4c:
2015_DeFanti_Figure3.jpg

Une nouvelle sous-clade HV4d a été identifiée. Elle est constituée exclusivement de séquences Italiennes. HV4b et HV4c sont datées autour de 15.000 ans et incluent des séquences Italiennes mais aussi du Proche-Orient, du Caucase et d’Europe de l’Est. HV4a est également daté de 15.000 ans. Sa sous-clade HV4a2 inclu également des séquences Italiennes et des régions de l’Est. HV4a1a est une sous-clade majeure datée de 13.000 ans et qui montre un signal clair d’expansion à partir de la région Franco-Cantabrique.

Une analyse Bayesian Skyline Plot a été réalisée avec le logicile BEAST à partir des séquences complètes (en rouge) ou seulement de la région codante (en bleu):
2015_DeFanti_Figure4.jpg

Le signal d’expansion apparait entre 15.000 et 12.000 ans en Eurasie et correspond clairement à une date pré-Néolithique, même si certaines sous-clades se sont sûrement diffusées plus tard pendant le Néolithique dans certaines régions.