2019年8月7日,《國家科學評論》(National Science Review)在線發(fā)表了中國科學院上海營養(yǎng)與健康研究所——馬普計算生物學研究所徐書華團隊的研究成果“Prioritizing natural selection signals from the deep-sequencing genomic data suggests multi-variant adaptation in Tibetan highlanders”。該研究通過分析深度基因組測序數(shù)據(jù)和藏族表型數(shù)據(jù),構(gòu)建了藏族人群全基因組水平的適應性遺傳變異圖譜,首次系統(tǒng)地將藏族人群基因組中與適應性進化相關的功能性變異呈現(xiàn)出來。
經(jīng)過國內(nèi)外近十年的密集研究,人們對藏族高原適應的遺傳學基礎有了一些初步的認識;其中EPAS1是目前領域里普遍認為是藏族適應高原的關鍵基因,特別是由于在其他高原物種中也發(fā)現(xiàn)EPAS1的適應性進化的跡象,因而備受關注。但是迄今未能確定EPAS1基因中與藏族高原適應的功能性變異。這為理解人類在青藏高原上的適應性進化機制留下未解難題。由此也引發(fā)一些更根本性的關鍵問題:(1)有多少基因和遺傳變異驅(qū)動了人類適應青藏高原的演化?(2)EPAS1在人類高原適應性中發(fā)揮作用的關鍵因素是否并不在EPAS1本身而是否另有出處?(3)是否還有其他基因比EPAS1對人類適應高原起到更關鍵的作用?
帶著這些問題,徐書華團隊與中科院昆明動物研究所、 溫州醫(yī)科大學、復旦大學、西藏民族大學等多家單位的研究人員合作,在全基因組水平對藏族人群的高原適應性變異進行了系統(tǒng)性梳理,充分利用深度基因組測序數(shù)據(jù)的優(yōu)勢,構(gòu)建了藏族人群全基因組尺度上的適應性遺傳變異圖譜,鑒定了有相對明確功能的關鍵遺傳變異,包括63個錯義突變、7個失活性變異、1298個進化保守性變異,以及509個基因表達數(shù)量性狀變異;這些分布在基因組范圍的功能性變異不一定都與藏族人群的高原適應直接相關,但是大多數(shù)都與藏族人群的適應性演化密切相關。高原適應涉及到一系列復雜性狀——涉及到的基因可能比醫(yī)學中研究的一些復雜疾病更為錯綜繁雜。研究團隊進一步發(fā)展了一個新統(tǒng)計量(FIS)對鑒定出的適應性遺傳變異的相對重要性進行加權排序,發(fā)現(xiàn)排在首位的并不是通常認為的EPAS1,而是位于EPAS1下游的一個跨膜蛋白編碼基因TMEM247;尤其是發(fā)現(xiàn)藏族人群基因組中的TMEM247存在一個高頻關鍵錯義變異(rs116983452),可能對藏族人群高原適應具有重要貢獻和意義。論文新發(fā)現(xiàn)的TMEM247基因關鍵突變(rs116983452)導致平原人群中高頻存在的丙氨酸(Ala)(野生型)與青藏高原人群特有的纈氨酸(Val)(突變型)之間的顯著分化,其中94%的藏族人都攜帶突變型,而在世界其他現(xiàn)代人群體中的頻率非常低或者完全缺失,是迄今為止在青藏高原人群基因組中發(fā)現(xiàn)的最高頻的錯義突變。有趣的是,在西伯利亞丹尼索瓦洞穴中發(fā)現(xiàn)的距今約5萬年的一個古人基因組也攜帶了這個變異,并且為純合狀態(tài)。該研究通過計算推斷藏族人群中攜帶TMEM247-rs116983452適應性變異的序列可追溯至距今約6萬年前,這意味著這個藏族特異的高頻突變可能繼承自早期進入高原的具有古人類血統(tǒng)的祖先并傳承至今。
事實上,人類征服青藏高原的歷程悠久而曲折。徐書華團隊之前的研究表明,青藏高原人群的遺傳起源可追溯至距今4-6萬年前的舊石器時代中晚期,早期進入青藏高原的人類族群間發(fā)生廣泛的基因交流,并與后期進入青藏高原的族群發(fā)生進一步遺傳混合,最終形成了一個包含現(xiàn)代智人和早期智人多個譜系(包括考古學已經(jīng)發(fā)現(xiàn)的阿爾泰尼安德特人和丹尼索瓦人等,以及其他未知古人類)的遺傳構(gòu)成極其復雜的混合人群。這個過程中,一些曾經(jīng)幫助人類適應高原環(huán)境的古人類基因片段得以保留下來,在因高原極端環(huán)境的自然選擇作用,在現(xiàn)今高原人群中積累到較高的頻率。TMEM247-rs116983452-T就是一個典型的例子。
分析表明,TMEM247-rs116983452-T的頻率與人群居住地海拔呈顯著正相關,提示與人類在青藏高原的適應可能有密切關系。進一步結(jié)合基因表達與多項生理生化表型及體質(zhì)人類學特征,對高原藏族人群的適應性遺傳變異進行了系統(tǒng)性評估;發(fā)現(xiàn)TMEM247-rs116983452-T與TMEM247及EPAS1的表達水平都有密切相關,并可能對藏族人群低氧環(huán)境下的血紅蛋白和紅細胞水平等高原適應性性狀產(chǎn)生重要的調(diào)控。對于平原人群而言,長期暴露于低氧環(huán)境中將誘發(fā)紅細胞增生以提高血液攜氧能力,但最終可能過度增生而導致“紅細胞增多癥”。相比之下,高原世居藏族人群的紅細胞和血紅蛋白水平保持在相對較低的水平,TMEM247基因的功能突變可能就是產(chǎn)生這種保護性機制的重要遺傳因素之一。通過統(tǒng)計模型分析,研究團隊發(fā)現(xiàn)TMEM247-rs116983452對藏族高原適應性表型的解釋度高于EPAS1的變異位點,但二者之間可能存在一定的相互作用,體現(xiàn)了高原適應的復雜性和多基因相互作用效應 。該研究提供的這張基因組適應性變異圖譜為后續(xù)進一步全面深入研究藏族適應高原的遺傳基礎和分子機制鎖定了目標、為揭開人類征服高原極端環(huán)境的演化之謎開拓了新的視野。
該工作由中科院營養(yǎng)與健康研究所、馬普計算生物學所鄧戀、張超、苑鍇,以及博士研究生高揚(上??萍即髮W)、潘雨聞等在徐書華研究員的指導下,與中科院昆明動物研究所、 溫州醫(yī)科大學、復旦大學、西藏民族大學等多家單位的研究人員合作完成,得到了中科院先導專項、國家自然科學基金委、上海市科委和國家重點研發(fā)計劃等多項基金的資助。(科技處)
原文鏈接:https://academic.oup.com/nsr/advance-article/doi/10.1093/nsr/nwz108/5544718

圖:藏族人群適應性變異TMEM247-rs116983452-T的群體遺傳解析和功能統(tǒng)計學分析