2025-07-30
文章信息
英文題目:Evolutionary origin of genomic structural variations in domestic yaks
中文題目:家(jia)牦牛基因(yin)組結構變異的進化(hua)起源
發表期刊: nature communications
影響因子:15.7/Q1
發表時間:2023.09.19
涉及組學:基因組組裝(zhuang)、泛基因組構(gou)建、SV結構(gou)變(bian)異、選擇性清除分析、SNP&SV-GWAS。
技術路線
摘 要
牦(mao)牛(niu)(niu)(niu)在進化過(guo)(guo)程(cheng)中經歷了(le)自然選擇(ze)、人(ren)類馴化和(he)種(zhong)間基(ji)因(yin)(yin)滲(shen)入。然而,這些過(guo)(guo)程(cheng)各(ge)自青(qing)睞的(de)(de)(de)(de)遺傳變異此前尚未被(bei)明(ming)(ming)確區分(fen)。研(yan)(yan)(yan)究(jiu)(jiu)(jiu)人(ren)員構建(jian)了(le)7種(zhong)可雜交牛(niu)(niu)(niu)科物(wu)種(zhong)的(de)(de)(de)(de)47個(ge)基(ji)因(yin)(yin)組圖(tu)譜(pu),通過(guo)(guo)386個(ge)個(ge)體(ti)的(de)(de)(de)(de)基(ji)因(yin)(yin)分(fen)型,成功(gong)檢測到57,432個(ge)高分(fen)辨率(lv)結(jie)構變異(SVs)在物(wu)種(zhong)內部(bu)和(he)跨物(wu)種(zhong)間的(de)(de)(de)(de)分(fen)布(bu)。通過(guo)(guo)系統發育分(fen)析,研(yan)(yan)(yan)究(jiu)(jiu)(jiu)人(ren)員明(ming)(ming)確了(le)家(jia)養(yang)牦(mao)牛(niu)(niu)(niu)中各(ge)類SVs的(de)(de)(de)(de)進化起源(yuan)(yuan)。進一步(bu)發現(xian)334個(ge)與家(jia)養(yang)牦(mao)牛(niu)(niu)(niu)SVs重疊的(de)(de)(de)(de)基(ji)因(yin)(yin)可能(neng)攜帶來自野生牦(mao)牛(niu)(niu)(niu)的(de)(de)(de)(de)選擇(ze)信號,另有686個(ge)基(ji)因(yin)(yin)存在牛(niu)(niu)(niu)源(yuan)(yuan)滲(shen)入。近(jin)90%的(de)(de)(de)(de)家(jia)養(yang)牦(mao)牛(niu)(niu)(niu)存在牛(niu)(niu)(niu)源(yuan)(yuan)滲(shen)入現(xian)象。跨越KIT基(ji)因(yin)(yin)的(de)(de)(de)(de)SV滲(shen)入觸發了(le)白色家(jia)養(yang)牦(mao)牛(niu)(niu)(niu)的(de)(de)(de)(de)培(pei)育。研(yan)(yan)(yan)究(jiu)(jiu)(jiu)人(ren)員驗(yan)證了(le)篩(shai)選出的(de)(de)(de)(de)分(fen)層SVs與基(ji)因(yin)(yin)表(biao)達存在顯著(zhu)關聯(lian),這有助(zhu)于解釋表(biao)型變異。研(yan)(yan)(yan)究(jiu)(jiu)(jiu)結(jie)果(guo)表(biao)明(ming)(ming),不同(tong)來源(yuan)(yuan)的(de)(de)(de)(de)SVs共(gong)同(tong)促(cu)進了(le)家(jia)養(yang)牦(mao)牛(niu)(niu)(niu)的(de)(de)(de)(de)表(biao)型多樣性。
前 言
牦(mao)牛(niu)是牛(niu)科動物,包括野生(sheng)(sheng)種(Bos mutus,約1.5萬頭(tou))和家養種(Bos grunniens,約1800萬頭(tou))。野生(sheng)(sheng)牦(mao)牛(niu)在500萬年前(qian)就適應了(le)青藏高(gao)原4000-6000米的(de)(de)高(gao)海拔極(ji)端環境(jing),而家牦(mao)牛(niu)主要生(sheng)(sheng)活在3000-5000米區域,為人類(lei)提供資(zi)源。家牦(mao)牛(niu)在進(jin)化中經歷了(le)自然選擇、人工馴化以及與牛(niu)類(lei)的(de)(de)基因滲入,成為研(yan)究遺傳進(jin)化的(de)(de)理想模型。
研究(jiu)發現,基(ji)因(yin)組結構變(bian)異(yi)(SVs)在牦(mao)(mao)牛的(de)高(gao)海拔適應和馴(xun)化中(zhong)起(qi)關(guan)鍵作用。通(tong)過構建泛基(ji)因(yin)組和超級(ji)泛基(ji)因(yin)組,研究(jiu)人員分(fen)析了28個新組裝的(de)牦(mao)(mao)牛和亞(ya)洲牛基(ji)因(yin)組,以及(ji)19個已(yi)發表的(de)近(jin)緣(yuan)物種(zhong)基(ji)因(yin)組,并在386個個體中(zhong)鑒定出SVs。這些變(bian)異(yi)影響基(ji)因(yin)表達,促進缺氧適應、馴(xun)化及(ji)種(zhong)間基(ji)因(yin)滲入,深化了對(dui)牦(mao)(mao)牛基(ji)因(yin)組多樣(yang)性(xing)和適應性(xing)遺傳機制(zhi)的(de)理解。
研究內容
1.野生牦牛和家養牦牛的系統發育關系和泛基因組
為(wei)(wei)解析野(ye)(ye)生(sheng)牦(mao)牛(niu)(niu)(niu)與家養(yang)牦(mao)牛(niu)(niu)(niu)的(de)(de)基因(yin)組(zu)多樣性,研究人(ren)(ren)員(yuan)構建了6頭(tou)(tou)(tou)(tou)野(ye)(ye)生(sheng)牦(mao)牛(niu)(niu)(niu)、15頭(tou)(tou)(tou)(tou)家養(yang)牦(mao)牛(niu)(niu)(niu)(覆蓋其完整(zheng)分(fen)布范圍)、2頭(tou)(tou)(tou)(tou)低(di)海拔亞洲水牛(niu)(niu)(niu)、4頭(tou)(tou)(tou)(tou)高(gao)(gao)海拔塔烏牛(niu)(niu)(niu),以(yi)及1頭(tou)(tou)(tou)(tou)高(gao)(gao)海拔塔烏-水牛(niu)(niu)(niu)-牦(mao)牛(niu)(niu)(niu)雜交種(張(zhang)牧牛(niu)(niu)(niu),ZMC)的(de)(de)從頭(tou)(tou)(tou)(tou)全基因(yin)組(zu)測序(xu)數(shu)(shu)(shu)據(ju)(ju)(ju)(表1)。這些數(shu)(shu)(shu)據(ju)(ju)(ju)與已(yi)報道的(de)(de)1頭(tou)(tou)(tou)(tou)野(ye)(ye)生(sheng)牦(mao)牛(niu)(niu)(niu)、14頭(tou)(tou)(tou)(tou)牛(niu)(niu)(niu)、2頭(tou)(tou)(tou)(tou)野(ye)(ye)牛(niu)(niu)(niu)、1頭(tou)(tou)(tou)(tou)歐洲野(ye)(ye)牛(niu)(niu)(niu)和(he)1頭(tou)(tou)(tou)(tou)印度野(ye)(ye)牛(niu)(niu)(niu)基因(yin)組(zu)數(shu)(shu)(shu)據(ju)(ju)(ju)整(zheng)合(he)后,形成(cheng)了牛(niu)(niu)(niu)科動物基因(yin)組(zu)數(shu)(shu)(shu)據(ju)(ju)(ju)集(表1)。為(wei)(wei)確(que)保分(fen)析一(yi)(yi)致性,研究人(ren)(ren)員(yuan)采用(yong)統一(yi)(yi)標(biao)準流程對這47個(ge)牛(niu)(niu)(niu)科基因(yin)組(zu)進(jin)行(xing)注(zhu)(zhu)釋(表1)。每個(ge)組(zu)裝平均(jun)鑒定出24,368個(ge)蛋(dan)白質(zhi)編(bian)碼基因(yin)(表1),通(tong)過(guo)BUSCO評(ping)估顯示(shi)平均(jun)97. 4%的(de)(de)蛋(dan)白質(zhi)編(bian)碼注(zhu)(zhu)釋完成(cheng)度,表明基因(yin)注(zhu)(zhu)釋高(gao)(gao)度完整(zheng)。
在(zai)這(zhe)些(xie)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)組(zu)(zu)(zu)(zu)(zu)裝中檢測到1,048,639個(ge)(ge)(ge)(ge)(ge)(ge)(ge)高置信度SNP,并以水牛(niu)(niu)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)為(wei)外(wai)群進行系統(tong)發育(yu)分(fen)析(圖(tu)(tu)1a)。研究人員基(ji)(ji)(ji)于(yu)每(mei)個(ge)(ge)(ge)(ge)(ge)(ge)(ge)物種選取一個(ge)(ge)(ge)(ge)(ge)(ge)(ge)代表(biao)性個(ge)(ge)(ge)(ge)(ge)(ge)(ge)體,通過8,428個(ge)(ge)(ge)(ge)(ge)(ge)(ge)單(dan)拷貝核心基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)構(gou)(gou)建(jian)了物種樹(圖(tu)(tu)1b)。兩(liang)棵系統(tong)發育(yu)樹與(yu)既往研究結果高度吻合3,4,但(dan)家(jia)養牦(mao)牛(niu)(niu)未(wei)形(xing)成單(dan)系聚(ju)類(圖(tu)(tu)1a)。研究人員構(gou)(gou)建(jian)了牦(mao)牛(niu)(niu)和(he)(he)牛(niu)(niu)的(de)(de)(de)(de)(de)泛基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu),并為(wei)7個(ge)(ge)(ge)(ge)(ge)(ge)(ge)牛(niu)(niu)科物種構(gou)(gou)建(jian)了超級泛基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)(圖(tu)(tu)1c)。牦(mao)牛(niu)(niu)泛基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)在(zai)n = 20時總基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)集接近飽和(he)(he)(圖(tu)(tu)1c)。核心基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)家(jia)族(zu)(存(cun)在(zai)于(yu)全部22個(ge)(ge)(ge)(ge)(ge)(ge)(ge)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu))、近核心基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)家(jia)族(zu)(存(cun)在(zai)于(yu)20-21個(ge)(ge)(ge)(ge)(ge)(ge)(ge)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu))和(he)(he)可(ke)變基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)家(jia)族(zu)(存(cun)在(zai)于(yu)1-19個(ge)(ge)(ge)(ge)(ge)(ge)(ge)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu))的(de)(de)(de)(de)(de)占(zhan)比分(fen)別為(wei)50.18%、10.91%和(he)(he)38.91%(圖(tu)(tu)1d),其中核心與(yu)近核心基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)表(biao)現出更高的(de)(de)(de)(de)(de)平(ping)(ping)均表(biao)達水平(ping)(ping)和(he)(he)更低的(de)(de)(de)(de)(de)Ka/Ks比值(圖(tu)(tu)1e,f)。牛(niu)(niu)的(de)(de)(de)(de)(de)泛基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)及7個(ge)(ge)(ge)(ge)(ge)(ge)(ge)牛(niu)(niu)科物種47個(ge)(ge)(ge)(ge)(ge)(ge)(ge)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)的(de)(de)(de)(de)(de)超級泛基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)也(ye)呈(cheng)現類似趨勢。平(ping)(ping)均而言,家(jia)養牦(mao)牛(niu)(niu)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)包(bao)含(han)119個(ge)(ge)(ge)(ge)(ge)(ge)(ge)野生牦(mao)牛(niu)(niu)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)中缺失(shi)的(de)(de)(de)(de)(de)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin),其中56個(ge)(ge)(ge)(ge)(ge)(ge)(ge)通過基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)滲入源自牛(niu)(niu)(圖(tu)(tu)1g),這(zhe)些(xie)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)在(zai)疾(ji)病防(fang)御(yu)、發育(yu)和(he)(he)繁殖功(gong)能方面(mian)具有(you)顯著(zhu)富(fu)集特征。在(zai)構(gou)(gou)建(jian)泛基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)的(de)(de)(de)(de)(de)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)對比較中,每(mei)個(ge)(ge)(ge)(ge)(ge)(ge)(ge)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)均包(bao)含(han)123至2113個(ge)(ge)(ge)(ge)(ge)(ge)(ge)其他基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)組(zu)(zu)(zu)(zu)(zu)缺失(shi)的(de)(de)(de)(de)(de)基(ji)(ji)(ji)因(yin)(yin)(yin)(yin)(yin)(圖(tu)(tu)1h)。
圖|牛(niu)科動物系統發育及野生與家(jia)養牦牛(niu)泛基(ji)因組
2.牛圖形基因組和7個物種中386個個體的結構變異(SV)的特征
為(wei)識(shi)別結構(gou)變異(SVs),研究人員基(ji)(ji)于(yu)47個基(ji)(ji)因組構(gou)建了(le)多組裝圖譜基(ji)(ji)因組,包含(han)3.14 Gb序(xu)列,分布在5,449,222個節點(dian)和4,889,530條連接邊上,其中(zhong)非參考節點(dian)覆蓋387.0 Mb(圖2a、b)。節點(dian)分為(wei)核心(所(suo)有基(ji)(ji)因組共有,占(zhan)60.8%)、近(jin)核(存(cun)在于(yu)45-46個基(ji)(ji)因組,占(zhan)17.0%)和可變(存(cun)在于(yu)≤44個基(ji)(ji)因組,占(zhan)22.2%)。使用gfatools檢測到(dao)293,712個可基(ji)(ji)因分型(xing)的(de)(de)SVs(81.7% <500 bp,99.76% <10 kb),其中(zhong)40.8%為(wei)多等位型(xing)(覆蓋76 Mb),在重復(fu)DNA區域富集。33.1%的(de)(de)SVs位于(yu)潛在表達調控區或編碼序(xu)列(98.2%在調控區,1.8%在CDS),12.97%的(de)(de)多等位型(xing)SVs影響了(le)54.4%的(de)(de)參考基(ji)(ji)因。對386個樣本(覆蓋深度>6×)進行分型(xing),獲(huo)得(de)57,432個高質量SVs(召(zhao)回率0.96)。遺傳分析顯示,多數(shu)SVs呈物種特異性(xing)分布,但(dan)牦牛與(yu)肉(rou)牛存(cun)在單倍型(xing)交換。30.6%的(de)(de)SVs與(yu)鄰近(jin)SNP存(cun)在強連鎖(suo)不平(ping)衡(heng)(LD R2≥0.45)。
圖2|47個新生牛基(ji)因(yin)組(zu)的圖譜基(ji)因(yin)組(zu)特征及(ji)其結構變異(SVs)在(zai)這(zhe)些基(ji)因(yin)組(zu)和(he)386個個體中的分布
3.野生牦牛特有的sv與高海拔適應有關
研究人員(yuan)通過計算野(ye)(ye)牦(mao)(mao)(mao)牛與低(di)海拔牛科動(dong)物(野(ye)(ye)牛、歐洲野(ye)(ye)牛和歐洲水(shui)牛)的固定(ding)指(zhi)數(FST),識(shi)別(bie)出(chu)4830個可(ke)能經歷選擇性(xing)清除的結構變(bian)異,涉及1051個基因,這(zhe)些(xie)基因在(zai)(zai)缺(que)氧反應、血管生(sheng)成等HIF-1信(xin)號通路中(zhong)顯著富集(圖(tu)3a、b)。其中(zhong),EPAS1基因內含子(zi)的254 bp插(cha)入片段(與LINE1元(yuan)件重疊)在(zai)(zai)野(ye)(ye)生(sheng)牦(mao)(mao)(mao)牛中(zhong)普遍存在(zai)(zai),但(dan)家養牦(mao)(mao)(mao)牛頻率較低(di)(圖(tu)3c、g)。該變(bian)異降低(di)了啟動(dong)子(zi)活性(xing),導致野(ye)(ye)生(sheng)牦(mao)(mao)(mao)牛EPAS1表達水(shui)平低(di)于(yu)牛類(圖(tu)3e)。此外,MB基因的155 bp缺(que)失(MB-hap-1)增強了增強子(zi)活性(xing)(圖(tu)3d、f、h),可(ke)能與牦(mao)(mao)(mao)牛缺(que)氧適(shi)應相(xiang)關。其他候選基因(如PPARA、BCL2、EGFR、IGF1R和IL6RA)也發現重要變(bian)異,其功能有待(dai)進一(yi)步研究。
圖3 | SVs促進了牦牛的高海拔(ba)適應(ying)和馴化。
4.家牦牛中SVs的來源及白牦牛的來源
為(wei)解析家(jia)牦(mao)牛(niu)(niu)(niu)結構變異(SVs)的(de)起源(yuan),研(yan)究人員對30頭家(jia)牦(mao)牛(niu)(niu)(niu)和青藏高(gao)原牛(niu)(niu)(niu)(QTP牛(niu)(niu)(niu))進行系統發育分析,發現26,591個(ge)參與種間基因(yin)交流的(de)SVs(占總SV的(de)46.3%)。其(qi)中91.5%與轉(zhuan)座子(zi)元件重疊,且牛(niu)(niu)(niu)源(yuan)SV滲(shen)入呈現自東向(xiang)西遞減(jian)趨勢。值(zhi)得注意的(de)是,11.6%的(de)牦(mao)牛(niu)(niu)(niu)(主要分布(bu)在青藏高(gao)原北部)未攜帶牛(niu)(niu)(niu)源(yuan)SV單倍(bei)型。
基因滲入分析顯示:
11,486個SV(20.0%)與1151個牦(mao)牛向QTP牛滲(shen)入的高(gao)海拔適(shi)應基因重(zhong)疊;
8,557個SV(14.9%)參與(yu)牛(niu)向牦牛(niu)的基因(yin)滲入,涉及抗病性和發育相關基因(yin);
6,547個(ge)SV(11.4%)呈現雙向滲入模(mo)式,如EPAS1基因在高低海拔種(zhong)群間的互滲。
毛色性狀研究發現:
KIT基(ji)因的串聯易位等位基(ji)因(Cs6和(he)Cs29)從彩色(se)側牛滲入牦牛,導致(zhi)白色(se)毛色(se)表型;
Hi-C分析(xi)揭示白牦牛(niu)的(de)KIT基(ji)因區(qu)(qu)呈(cheng)現抑(yi)制性染色質狀(zhuang)態(tai)(B區(qu)(qu)室),而黑牦牛(niu)為活性態(tai)(A區(qu)(qu)室);
轉錄組和免疫組化證實(shi)白牦(mao)牛KIT表達顯(xian)著降低(di),與(yu)其(qi)黑色素缺失(shi)表型一致。
這些發(fa)現揭示了SVs通過改變染色質(zhi)結構和基因表(biao)達,在牦牛適應性進化和表(biao)型變異中的關鍵作用(yong)。
圖(tu)4|帶有從牛體內導入的(de)KIT基因的(de)串聯易(yi)位SV歸功于牦(mao)牛的(de)白色毛發(fa)顏色。
總 結
研究(jiu)人(ren)員(yuan)整合28個新(xin)測(ce)(ce)序(xu)基(ji)因(yin)(yin)組和(he)已發(fa)表數(shu)據,構建了(le)牦牛(niu)(niu)-牛(niu)(niu)泛基(ji)因(yin)(yin)組及(ji)7種牛(niu)(niu)科動(dong)物的(de)(de)超級泛基(ji)因(yin)(yin)組。基(ji)于386個樣本的(de)(de)分析揭(jie)示(shi)了(le)重要(yao)進化(hua)變異,數(shu)據可通過(guo)牛(niu)(niu)科泛基(ji)因(yin)(yin)組數(shu)據庫(//bovpan.lzu.edu.cn)獲取。需注意的(de)(de)是,數(shu)據主要(yao)來自(zi)青藏(zang)高原牦牛(niu)(niu)和(he)中國牛(niu)(niu)群(qun),不同測(ce)(ce)序(xu)技術(如ONT和(he)PacBio HiFi)導致重復區(qu)(qu)域覆蓋度存在差異。盡管如此(ci)(ci),研究(jiu)仍鑒定出多個與高海(hai)拔適應相關的(de)(de)SV,區(qu)(qu)分了(le)家(jia)養特征和(he)牛(niu)(niu)類(lei)基(ji)因(yin)(yin)滲入(ru)。例如,發(fa)現(xian)(xian)EPAS1、MB等新(xin)候(hou)選基(ji)因(yin)(yin),其中EPAS1存在雙(shuang)向滲入(ru)現(xian)(xian)象。此(ci)(ci)外,證實KIT基(ji)因(yin)(yin)易位(wei)SV導致牦牛(niu)(niu)毛色變異,且近90%家(jia)牦牛(niu)(niu)攜(xie)帶牛(niu)(niu)源雜交成分。這些發(fa)現(xian)(xian)對指導家(jia)牦牛(niu)(niu)育(yu)種具有(you)重要(yao)意義。
參(can)考文(wen)獻:Liu, X., Liu, W., Lenstra, J.A. et al. Evolutionary origin of genomic structural variations in domestic yaks. Nat Commun 14, 5617 (2023). //doi.org/10.1038/s41467-023-41220-x