漢族的主要基因構成如何?

一、Y染色體構成

Y染色體單倍群是根據Y染色體上的突變(SNP)的全世界男性的譜系樹,對於追溯人類遷移、人群分化極為重要。

Y染色體最新譜系樹、單倍群名稱及位點請參照最新的ISOGG樹(https://isogg.org/tree/index.html)

說明一下,這個樹目前是不斷細化的,23魔方的“Y染色體全序“產品也參與這個樹的細化,未來的目標是細化到1000年以內。

漢族的主要基因構成如何?

所謂漢族的主要基因,即與漢族的匹配度較好,在漢族中最集中。

從Y染色體看,最具漢族(當代漢族)特色的單倍群如下:

1、O2a1-L127。該支系年齡(共祖時間)1.6萬年左右,主要包括F1876、002611兩大支。目前看,無論F1876還是002611,分佈區域都集中在華北和華東,個別分支集中於湖南及周邊。可能(至少其中若干支系)與古代東夷人有關。

2、O2a2b1-M134*。此處主要指的是F444,該支系年齡1.4萬年左右,其下游的支系F46的年齡只有8000年左右,且在漢族男性中佔了11%,在江蘇山東等省可達15%,無愧為超級祖先。該支系在漢族以外分佈較少,且集中於華北華東,推測早期擴散地點就是黃河中下游。

3、O2a2b1a2-M117。此處主要指的是年齡7000年左右的F5,該支系在漢族中佔15%左右,而且可能是原始漢藏成分、漢語族的奠基者。但是與漢族的匹配度卻不及前二支,原因在於,該支系的下游分支CTS1642在藏緬語族人群(藏族、彝族、納西族、緬族等)極為高頻,在緬甸的緬族中可達40%左右。如此看,緬甸倒成了M117的代表國家。

不過,由於藏緬語族主要是CST1642這個支系,其他幾個主幹分支與漢族的匹配度依然比較好,所以仍是漢族代表單倍群之一。另:廣東的20%+的M117以Y7080、CTS5063、F2188三個晚近的蔟為主,目前看前兩個支系不像是歷史時期的北方移民,可能來自廣西和湖北。

4、O1b1*-F2320*。此處主要指的是Page59這個支系。該支系又以F1759佔大頭。F1759集中於華北華東等地,總體上與漢族匹配度很好,應該是漢族早期來源之一

5、C2c-F1067。即俗稱的C2南支。該支系絕大多數都是C2c1-F2613這個1.1萬年的支系,極少數為C2c2(集中於兩廣)。F2613下面又分3個主要分支:CTS2657、 F1319、F845,三個支系偏北程度為CTS2657>F1319>F845。其中,F1319可能是殷商所屬的支系。F2613與漢族的匹配度較好,但在東南亞、西南少數民族、東北一些民族也高頻,其中有的分支如CTS2657可能來自歷史時期的北方民族。

6、Q-M120。該支系預計年齡不超過1萬年,在漢族中佔2.3%左右,北方大約3%,南方大約1.8%。該支系雖然北方偏多但南方亦達北方的60%水平,推測早期分佈在寧夏、河套地區等長城沿線,但在2000年前已經絕大多數融入漢族裡了。

7、N1-M2183。該支系年齡1.8萬年左右,分為N1a和N1b兩大支。N1b與漢族匹配度較高,在漢族中佔4%左右,但亞洲東部其他民族也有不少,例如泰國北部也有7%左右,彝族中也很多。N1a下面又有很多支系,其中北亞和東北歐主要是M178、P43等支,漢族則主要是M128、F4063等支。

8、O2a2*-P201*。此處主要包含了M188(除M7)和AM01822兩支。AM01822總體上集中於華北和華東,與漢族匹配度較好。南島人(如菲律賓人)雖然也有很多AM01822,主要是下游的個別分支,一般認為南島人是7000年前從中國東南部下海的。M188( 除M7)是個近2萬年高齡的支系,有些下游分支與漢族匹配度較好,有些不是。

9、其他支系。O1a-M119僅與南方漢族匹配度較好,目前看其幾乎所有分支都集中於南方。PK4可能起源於湘贛一帶,但目前是壯侗語系、南亞語系人群的主流支系。C1a1-M8和D1b都是日本特有類型,其中D1b在阿依努人中佔70%以上,該支系與西藏的D1a分開近5萬年了。O1b2-P49是朝鮮半島特色單倍群。O2a2a1a2-M7集中於苗瑤語系人群。R、J等幾乎都是歷史時期的西域來客。

最後補一張O單倍群在全球的分佈

(注意:O的年齡有3.1萬年之久,O2(舊名O3)也有2.9萬年,都只能代表亞洲東部主要父系類型。而漢族從漢朝開始算只有2000多年,因此無法與3萬年的支系掛鉤。)

漢族的主要基因構成如何?

二、常染色體分析

目前關於常染色體群體差異分析很多,但具體到基因功能的很少。比如,漢族和日本韓國人長相到底有哪些區別,這個可能通過圖像分析可以得出,但決定長相的基因目前研究得很少。

下圖是23魔方祖源生信團隊根據不同人群的70萬基因位點(SNPS)檢測結果進行統計分析後繪製的PCA散點圖。

漢族的主要基因構成如何?

可以看出,漢族內部雖然有差異,但由於地理上的連片、數年前的融合,內部差異還是要小於和其他民族的差異。

南方漢族(CHS)、北方漢族(CHB)、藏緬(ZM)整體上比較接近,日本人(JPT)、維吾爾(Uygur)、外蒙古人(Mongolian)與漢族最為疏遠。韓國人(KPGP)相對而言比日本人更接近北方漢族,這與Y染色體是一致的。

再看東亞人與印歐人的差異

【1】。在這個跨大洲的尺度下,東亞人內部的差異幾乎可以忽略不計了,日本人和北方漢族完全聚成一團,與非洲人(YRI)、歐洲人(CEU)差異極其顯著。所以說,種群差異是相對的。

漢族的主要基因構成如何?

除了常染色體全局性的比較外,也有一些功能研究比較細的具體的基因。

EDAR370A就是目前發現的一個與東亞人鏟形門齒、汗腺發達等有關的基因【2】。 該基因目前主要分佈在東亞、東北亞、美洲(印第安人)等地,大體上是蒙古利亞人種的代表基因之一,所以並不侷限於漢族。

漢族的主要基因構成如何?

至於網傳的漢族小腳趾分瓣(學名:跰趾)等,有研究表明北方整體偏高,超過70%,但在浙北漢族中亦達60%多【3】,所以與傳說的“山西大槐樹移民”、”匈奴人特徵基因“等都沒什麼關係。目前尚未發現決定此性狀的基因。

單眼皮、蒙古褶算是東亞和北亞人群的代表形狀,所以也不侷限於漢族,目前也未發現與這些性狀有關的基因

關於膚色和眼色。

所謂的膚色實際上本身就是漸變的,色素的深淺並非跳躍值,且與個人生活環境有很大關係。

目前所知的幾種淺膚色突變有SCL24A5 - rs1426654、OCA2 A481T - rs74653330, OCA2 H615R -rs1800414等,其中rs1426654主要存在於高加索人種內,目前被認為是對高加索人種膚色變淺貢獻最大的突變,該突變產生的年代大約是5000-12000年前,因此,1萬年以前世界上可能是不存在白種人的

而rs74653330、rs1800414則基本只存在於東亞人群中。因此導致東西方人膚色變淺的基因突變是不同的,且並非單基因控制,

現代人類無論皮膚的色素值還是膚色成因都不能簡單歸為三類。


分享到:


相關文章: