2025-06-05
文(wen)章信息
英文題目:A pangenome reference of wild and cultivated rice
中文題目:野生與栽培水(shui)稻的泛基因組參考
發表期(qi)刊:Nature
影響因子:50.5
發表(biao)時間:2025年4月
涉(she)及(ji)組學:基因組De novo、全基因組重測序(xu)、轉錄(lu)組
摘要
亞(ya)洲栽(zai)培(pei)(pei)稻(dao)(Oryza sativa)的(de)(de)野(ye)生(sheng)祖先(xian)——普通野(ye)生(sheng)稻(dao)(Oryza rufipogon)是水稻(dao)育種的(de)(de)重(zhong)要遺傳(chuan)(chuan)資源(yuan)。本(ben)研(yan)究(jiu)(jiu)基(ji)(ji)于145個(ge)(ge)(ge)(ge)染色體水平的(de)(de)基(ji)(ji)因(yin)組(zu)(zu)(zu)(zu)組(zu)(zu)(zu)(zu)裝(zhuang)(包含129份(fen)普通野(ye)生(sheng)稻(dao)材料和(he)16個(ge)(ge)(ge)(ge)栽(zai)培(pei)(pei)稻(dao)品(pin)種),構建(jian)了(le)一個(ge)(ge)(ge)(ge)野(ye)生(sheng)-栽(zai)培(pei)(pei)稻(dao)泛(fan)基(ji)(ji)因(yin)組(zu)(zu)(zu)(zu)。該泛(fan)基(ji)(ji)因(yin)組(zu)(zu)(zu)(zu)包含3.87 Gb未出(chu)現在粳(jing)(jing)(jing)稻(dao)參考基(ji)(ji)因(yin)組(zu)(zu)(zu)(zu)(日本(ben)晴品(pin)種)中的(de)(de)序列,并(bing)通過捕(bu)獲(huo)初級(ji)組(zu)(zu)(zu)(zu)裝(zhuang)中缺失的(de)(de)雜(za)合信息(替代組(zu)(zu)(zu)(zu)裝(zhuang)),共鑒定出(chu)69,531個(ge)(ge)(ge)(ge)泛(fan)基(ji)(ji)因(yin),其中28,907個(ge)(ge)(ge)(ge)為(wei)核(he)心(xin)基(ji)(ji)因(yin),13,728個(ge)(ge)(ge)(ge)為(wei)野(ye)生(sheng)稻(dao)特有(you)基(ji)(ji)因(yin)。研(yan)究(jiu)(jiu)發(fa)現,野(ye)生(sheng)稻(dao)中抗(kang)病基(ji)(ji)因(yin)類(lei)似物(RGAs)的(de)(de)豐度和(he)多樣(yang)性均顯著高于栽(zai)培(pei)(pei)稻(dao)。群(qun)體分(fen)析表(biao)明,兩個(ge)(ge)(ge)(ge)栽(zai)培(pei)(pei)稻(dao)亞(ya)群(qun)(intro-indica 和(he)basmati)的(de)(de)形(xing)成源(yuan)于南亞(ya)栽(zai)培(pei)(pei)稻(dao)品(pin)種間的(de)(de)基(ji)(ji)因(yin)交流。同(tong)時,本(ben)研(yan)究(jiu)(jiu)為(wei)"亞(ya)洲栽(zai)培(pei)(pei)稻(dao)單次馴化(hua)(hua)"理論(lun)提(ti)供了(le)強有(you)力證據。此外,研(yan)究(jiu)(jiu)系統(tong)解析了(le)秈(xian)-粳(jing)(jing)(jing)亞(ya)種間855,122個(ge)(ge)(ge)(ge)分(fen)化(hua)(hua)SNP和(he)13,853個(ge)(ge)(ge)(ge)存在/缺失變異(yi)(PAVs),揭(jie)示(shi)這些(xie)變異(yi)可追溯至祖先(xian)群(qun)體的(de)(de)分(fen)化(hua)(hua)事件,且(qie)粳(jing)(jing)(jing)稻(dao)經歷了(le)更嚴(yan)重(zhong)的(de)(de)遺傳(chuan)(chuan)瓶頸效(xiao)應。本(ben)研(yan)究(jiu)(jiu)成果不(bu)僅為(wei)水稻(dao)育種提(ti)供了(le)精準的(de)(de)基(ji)(ji)因(yin)組(zu)(zu)(zu)(zu)參考資源(yuan),更深化(hua)(hua)了(le)人類(lei)對水稻(dao)起源(yuan)與馴化(hua)(hua)歷程的(de)(de)認知。
前言
水稻(dao)(Oryza sativa)作(zuo)(zuo)為(wei)全(quan)球最重要(yao)的(de)(de)糧食(shi)作(zuo)(zuo)物之一(yi)(yi),其野(ye)生(sheng)(sheng)祖先——普通(tong)野(ye)生(sheng)(sheng)稻(dao)(Oryza rufipogon)蘊含豐富(fu)的(de)(de)遺傳多(duo)(duo)樣性(xing),是改良栽(zai)培稻(dao)抗(kang)逆性(xing)和產量的(de)(de)關(guan)(guan)鍵資源(yuan)。盡管已有(you)多(duo)(duo)個栽(zai)培稻(dao)參(can)考基(ji)(ji)因(yin)(yin)組(zu)(如粳稻(dao)日本晴和秈稻(dao)93-11),但單一(yi)(yi)線性(xing)參(can)考基(ji)(ji)因(yin)(yin)組(zu)難以全(quan)面反映物種的(de)(de)遺傳變異,尤(you)其無法涵(han)蓋(gai)野(ye)生(sheng)(sheng)稻(dao)中(zhong)大量未被利用的(de)(de)優異等位基(ji)(ji)因(yin)(yin)。近年來,泛基(ji)(ji)因(yin)(yin)組(zu)研究(jiu)成(cheng)為(wei)解析(xi)物種遺傳多(duo)(duo)樣性(xing)的(de)(de)重要(yao)手段。然而,現有(you)水稻(dao)泛基(ji)(ji)因(yin)(yin)組(zu)研究(jiu)主要(yao)集中(zhong)于栽(zai)培稻(dao),對野(ye)生(sheng)(sheng)稻(dao)資源(yuan)的(de)(de)系(xi)統性(xing)分析(xi)仍顯不足。此外,關(guan)(guan)于亞洲(zhou)栽(zai)培稻(dao)的(de)(de)起源(yuan)(單次(ci)馴(xun)化vs.多(duo)(duo)次(ci)獨立(li)馴(xun)化)及其亞種的(de)(de)形成(cheng)機制仍存在爭議。
研(yan)究內容(rong)
1、149份水稻基因(yin)組的從頭組裝
研究人員對149份(fen)水稻(dao)(dao)基(ji)因組(zu)(129份(fen)野生(sheng)稻(dao)(dao)和(he)16份(fen)栽(zai)培稻(dao)(dao))進行了高(gao)質量(liang)的(de)從(cong)頭組(zu)裝,通過整(zheng)合PacBio HiFi、Nanopore和(he)Hi-C多平(ping)臺測(ce)序數據,獲(huo)得(de)了染色體水平(ping)的(de)參(can)考基(ji)因組(zu)。評估顯示這些基(ji)因組(zu)具有(you)(you)極高(gao)的(de)完(wan)整(zheng)度(BUSCO 98.55%)和(he)準確(que)性(HiFi QV 57.92),其中與T2T-NIP參(can)考基(ji)因組(zu)相比(bi)僅存在32.7 kb錯配。研究發(fa)現野生(sheng)稻(dao)(dao)基(ji)因組(zu)平(ping)均(jun)(jun)大小(395 Mb)顯著大于栽(zai)培稻(dao)(dao)(385 Mb),主要差異源于轉座(zuo)元件(jian)(TE)含(han)量(liang)的(de)增加(野生(sheng)稻(dao)(dao)TE占(zhan)比(bi)53.23% vs 栽(zai)培稻(dao)(dao)52.32%)。、基(ji)因注釋(shi)顯示每個(ge)基(ji)因組(zu)平(ping)均(jun)(jun)含(han)有(you)(you)40,273個(ge)基(ji)因,野生(sheng)稻(dao)(dao)基(ji)因密度(98.5 genes/Mb)略(lve)低于栽(zai)培稻(dao)(dao)(100.2 genes/Mb)。端粒(CCCTAAA重復)和(he)著絲粒(CentO衛星序列)的(de)精確(que)定位進一步驗證(zheng)了組(zu)裝的(de)可(ke)靠性。
2、基(ji)因注釋及抗病基(ji)因類似物(RGAs)的特征解析
研究人員通過整合同源預測(ce)、轉(zhuan)錄組數據(ju)和從頭預測(ce)方法,對149個(ge)(ge)水(shui)稻基(ji)因(yin)組進行(xing)了(le)(le)系統注釋,平均(jun)每(mei)個(ge)(ge)基(ji)因(yin)組鑒(jian)定出(chu)40,273個(ge)(ge)基(ji)因(yin)(平均(jun)長度2,566 bp),其中92%的基(ji)因(yin)含有功(gong)能域(yu),72%至少在一種組織中表達。重點對抗病基(ji)因(yin)類似物(RGAs)進行(xing)了(le)(le)系統分析,基(ji)于保守結構域(yu)(如NBS、RLK、TM-CC和RLP)共預測(ce)出(chu)野生稻平均(jun)1,710個(ge)(ge)RGAs,顯(xian)著高于栽培稻(平均(jun)1,652個(ge)(ge))。研究發現野生稻RGAs不僅數量更(geng)多(duo)(P<0.01),其多(duo)樣性也更(geng)為豐富,其中,
結構變異:野(ye)生(sheng)稻(dao)中(zhong)27.55%(638個(ge))RGA位點為特有,且多形成串聯重復簇;功能分(fen)化(hua):關鍵抗病(bing)基(ji)因在野(ye)生(sheng)稻(dao)中(zhong)保留更多功能等位基(ji)因,其抗稻(dao)瘟病(bing)單倍型(如Y476)在野(ye)生(sheng)群(qun)體中(zhong)高頻存(cun)在;進化(hua)動態:RGAs在野(ye)生(sheng)稻(dao)中(zhong)呈現更年輕的(de)擴張特征,與近期(qi)環境(jing)適應(ying)相關。
圖(tu)1 野生(sheng)和栽培水稻的RGAs特征(zheng)分析
3、基(ji)(ji)于(yu)基(ji)(ji)因和基(ji)(ji)于(yu)圖的泛基(ji)(ji)因組(zu)構建
研究人員通過整(zheng)合145個(ge)(ge)水稻(dao)(dao)基(ji)因(yin)(yin)組(zu)(129野生(sheng)稻(dao)(dao)+16栽(zai)培(pei)稻(dao)(dao))構(gou)建了(le)(le)雙(shuang)軌泛(fan)基(ji)因(yin)(yin)組(zu):基(ji)于基(ji)因(yin)(yin)的泛(fan)基(ji)因(yin)(yin)組(zu)鑒定(ding)出(chu)69,531個(ge)(ge)泛(fan)基(ji)因(yin)(yin)(含28,907個(ge)(ge)核心基(ji)因(yin)(yin)和(he)13,728個(ge)(ge)野生(sheng)稻(dao)(dao)特(te)有(you)基(ji)因(yin)(yin)),揭示野生(sheng)稻(dao)(dao)特(te)有(you)基(ji)因(yin)(yin)顯著富集于抗病等適應性功(gong)能(neng);基(ji)于圖結(jie)構(gou)的泛(fan)基(ji)因(yin)(yin)組(zu)包含3.87Gb非參(can)考序列(lie),解析了(le)(le)855,122個(ge)(ge)秈-粳稻(dao)(dao)分化SNP和(he)13,853個(ge)(ge)PAVs,其變異(yi)檢測靈(ling)敏度較線性參(can)考基(ji)因(yin)(yin)組(zu)提升23%。
圖2 野生(sheng)和(he)栽培(pei)水(shui)稻泛(fan)基因組(zu)的組(zu)裝和(he)分析
4、全基因組變異和轉座元件分析
研究(jiu)人員進(jin)行了(le)(le)全面(mian)的(de)變(bian)異(yi)和(he)轉(zhuan)座元件(TE)分析,共鑒定出11.08百(bai)萬SNP、10.97百(bai)萬小(xiao)片段(duan)插(cha)入缺(que)失(shi)(indel)以及362,194個缺(que)失(shi)、531,356個插(cha)入、4,495個倒位和(he)357,655個易位等結(jie)構變(bian)異(yi)(SV)。研究(jiu)發(fa)現野生(sheng)稻的(de)轉(zhuan)座元件(TE)含(han)量(53.23%)顯(xian)著高于(yu)栽培稻(52.32%),其中(zhong)(zhong)Gypsy類LTR反轉(zhuan)錄轉(zhuan)座子在野生(sheng)稻Or-IIIa群體中(zhong)(zhong)表現出明(ming)顯(xian)的(de)近(jin)期擴張(zhang)(約2.5萬年前),貢(gong)獻了(le)(le)57.78%的(de)基因組(zu)大小(xiao)差異(yi)。通(tong)過比較17個關鍵Gypsy家族(zu),發(fa)現野生(sheng)稻中(zhong)(zhong)9 Mb的(de)差異(yi)源(yuan)于(yu)新(xin)近(jin)擴增,而(er)8 Mb差異(yi)由非法重組(zu)導(dao)致的(de)TE丟失(shi)造成。這(zhe)些變(bian)異(yi)在基因側(ce)翼區域顯(xian)著富(fu)集于(yu)碳水化合物代謝(P=3.2e-5)和(he)細胞表面(mian)信號通(tong)路(P=1.8e-4),揭示(shi)了(le)(le)TE驅動的(de)水稻環境適(shi)應性演化機制。
圖3 野(ye)生和(he)栽培水稻的(de)TE分析(xi)
5、亞(ya)洲栽培水(shui)稻(dao)的進化分析
研究人員通過整合280份水(shui)稻(dao)(dao)(dao)(dao)種質(包括野(ye)(ye)生(sheng)(sheng)稻(dao)(dao)(dao)(dao)和栽培(pei)稻(dao)(dao)(dao)(dao))的(de)全基因(yin)組(zu)數據,系統解析(xi)了亞(ya)洲(zhou)(zhou)栽培(pei)稻(dao)(dao)(dao)(dao)的(de)演化歷程。研究證實(shi)所有亞(ya)洲(zhou)(zhou)栽培(pei)稻(dao)(dao)(dao)(dao)均單次起源(yuan)于中國南部的(de)野(ye)(ye)生(sheng)(sheng)稻(dao)(dao)(dao)(dao)Or-IIIa群體(粳(jing)稻(dao)(dao)(dao)(dao)祖先),而秈稻(dao)(dao)(dao)(dao)則是由早(zao)期粳(jing)稻(dao)(dao)(dao)(dao)向東南亞(ya)擴散后(hou)與(yu)當地(di)(di)野(ye)(ye)生(sheng)(sheng)稻(dao)(dao)(dao)(dao)Or-I群體雜交(jiao)形(xing)成。群體遺傳分析(xi)發現(xian),南亞(ya)地(di)(di)區的(de)栽培(pei)稻(dao)(dao)(dao)(dao)(如(ru)Basmati和Aus)存在(zai)復(fu)雜的(de)基因(yin)交(jiao)流:Basmati由粳(jing)稻(dao)(dao)(dao)(dao)與(yu)滲入秈稻(dao)(dao)(dao)(dao)(intro-indica)雜交(jiao)形(xing)成,而滲入秈稻(dao)(dao)(dao)(dao)本身是秈稻(dao)(dao)(dao)(dao)與(yu)Aus稻(dao)(dao)(dao)(dao)的(de)雜交(jiao)后(hou)代。選(xuan)擇性清(qing)除(chu)分析(xi)顯示,栽培(pei)稻(dao)(dao)(dao)(dao)中55.3%的(de)馴(xun)化區域(yu)遺傳組(zu)分來自Or-IIIa,關鍵馴(xun)化基因(yin)(如(ru)sh4、PROG1等)的(de)等位變異模式進(jin)一步支持了"單次馴(xun)化-多次漸滲"的(de)演化模型。
圖4 野(ye)生(sheng)和(he)栽培水稻的群體進化分析
6、亞洲栽(zai)培水稻的馴化分析
研究人員通過全基(ji)(ji)因(yin)(yin)組分(fen)(fen)析揭示了亞洲(zhou)栽培稻(dao)(dao)(dao)(dao)的(de)(de)馴化(hua)(hua)(hua)歷程,證實所(suo)有栽培稻(dao)(dao)(dao)(dao)均(jun)起(qi)源于中國南(nan)部(bu)的(de)(de)野(ye)(ye)生(sheng)稻(dao)(dao)(dao)(dao)Or-IIIa群(qun)體(ti)(粳稻(dao)(dao)(dao)(dao)祖先),支持"單次馴化(hua)(hua)(hua)"理論。研究發現(xian)秈(xian)稻(dao)(dao)(dao)(dao)的(de)(de)形(xing)成經歷了"粳稻(dao)(dao)(dao)(dao)南(nan)遷-與(yu)當地(di)野(ye)(ye)生(sheng)稻(dao)(dao)(dao)(dao)Or-I群(qun)體(ti)雜交(jiao)"的(de)(de)二次馴化(hua)(hua)(hua)過程,而南(nan)亞特有的(de)(de)Basmati和(he)Aus稻(dao)(dao)(dao)(dao)則是栽培稻(dao)(dao)(dao)(dao)間多(duo)次基(ji)(ji)因(yin)(yin)交(jiao)流的(de)(de)產物。選擇性(xing)清除分(fen)(fen)析鑒定(ding)出50個強選擇信(xin)號(hao)區域(共12.35Mb),其中55.3%的(de)(de)馴化(hua)(hua)(hua)區域遺傳組分(fen)(fen)來自Or-IIIa群(qun)體(ti)。11個關(guan)鍵馴化(hua)(hua)(hua)基(ji)(ji)因(yin)(yin)(如控(kong)制落粒性(xing)的(de)(de)sh4、調控(kong)株(zhu)型(xing)的(de)(de)PROG1等)的(de)(de)等位基(ji)(ji)因(yin)(yin)溯源顯示,栽培稻(dao)(dao)(dao)(dao)中這些基(ji)(ji)因(yin)(yin)均(jun)與(yu)Or-IIIa的(de)(de)單倍型(xing)直(zhi)接相關(guan),而秈(xian)稻(dao)(dao)(dao)(dao)和(he)Aus稻(dao)(dao)(dao)(dao)中部(bu)分(fen)(fen)基(ji)(ji)因(yin)(yin)通過后續基(ji)(ji)因(yin)(yin)流獲得。
圖(tu)5 野(ye)生和栽培水稻的選擇性(xing)清除分析
總結
1.整(zheng)合145個高質(zhi)量(liang)水稻(dao)基因組,構建了首個野生-栽培稻(dao)泛基因組圖譜,鑒定出69,531個泛基因,包括(kuo)28,907個核心基因和13,728個野生稻(dao)特有(you)基因。
2. 證(zheng)實亞洲栽(zai)培稻(dao)為單次馴化起源,所有栽(zai)培稻(dao)均(jun)來(lai)自中(zhong)國(guo)南(nan)部的野(ye)生(sheng)稻(dao)Or-IIIa群(qun)體(粳稻(dao)祖先)。秈稻(dao)由早(zao)期粳稻(dao)南(nan)遷(qian)后與當地野(ye)生(sheng)稻(dao)Or-I群(qun)體雜交形(xing)成(cheng),而Basmati和Aus稻(dao)則是栽(zai)培稻(dao)間基因交流的產物。
3. 野生稻基因組大小(xiao)(平均395 Mb)大于栽培稻(385 Mb),主要差異由轉(zhuan)座元(yuan)件(jian)(TEs)驅動,尤其是Gypsy類元(yuan)件(jian)的近(jin)期擴(kuo)張(zhang)。