遺傳變異圖譜是研究群體進(jìn)化史、醫(yī)學(xué)遺傳學(xué)和基因型-表型相關(guān)性的基礎(chǔ)。此前,大多數(shù)全基因組測(cè)序相關(guān)研究都集中在歐洲血統(tǒng)的人身上。先前的研究表明,罕見(jiàn)和低頻變異通常具有人群或樣本特異性,尤其是與疾病相關(guān)的變異。中國(guó)人群缺乏全基因組測(cè)序資源和單倍型參考面板,阻礙了世界上最大人群的遺傳學(xué)和精準(zhǔn)醫(yī)學(xué)研究。
使用權(quán):
阿里云11.11云嘉年華活動(dòng)廳
為此,中國(guó)科學(xué)院院士、中國(guó)科學(xué)院生物物理研究所研究員徐濤團(tuán)隊(duì)與何順民研究員團(tuán)隊(duì)在Cell Reports在線發(fā)表文章,介紹了該團(tuán)隊(duì)的研究成果致力于“NyuWa”(NyuWa)中國(guó)人群基因組資源庫(kù),為中國(guó)人群提供遺傳變異圖譜和參考面板基因型推導(dǎo)服務(wù),旨在推動(dòng)中國(guó)人群的遺傳學(xué)和醫(yī)學(xué)研究。
研究團(tuán)隊(duì)分析了2999名以“女媧”命名的中國(guó)人的全基因組深度測(cè)序數(shù)據(jù)(26.2X)。
NyuWa 全基因組測(cè)序資源中的變異數(shù)量
該研究基于NyuWa數(shù)據(jù)資源,構(gòu)建了包含7106萬(wàn)個(gè)SNP和819萬(wàn)個(gè)InDels的中國(guó)人群遺傳變異圖譜,并對(duì)其進(jìn)行了充分注釋。與其他人群隊(duì)列相比,NyuWa數(shù)據(jù)集包含2501萬(wàn)個(gè)新變異,其中包括149,000個(gè)非同義變異、101,000個(gè)有害變異、11,493個(gè)編碼和非編碼基因的功能喪失變異以及636個(gè)癌癥相關(guān)基因的蛋白質(zhì)截?cái)唷M蛔儭?
大量的新變異表明,在以往的遺傳學(xué)研究中,中國(guó)人群的變異代表性不足,而NyuWa基因組資源填補(bǔ)了這一空白。
此外,基于臨床相關(guān)數(shù)據(jù)庫(kù)的注釋,研究發(fā)現(xiàn)NyuWa中有1140個(gè)致病變異,以及中國(guó)人群與世界其他人群在藥物基因組學(xué)相關(guān)位點(diǎn)和癌癥風(fēng)險(xiǎn)位點(diǎn)的變異頻率存在差異。這些發(fā)現(xiàn)有助于中國(guó)人群的精準(zhǔn)醫(yī)學(xué)研究,并可能促進(jìn)新的遺傳學(xué)和醫(yī)學(xué)進(jìn)步。
與其他參考組相比,NyuWa 參考組將漢族人群中基因型推算的錯(cuò)誤率降低了30%-51%,并且在大多數(shù)其他東亞和東北亞人群中也表現(xiàn)良好。