文章(zhang)亮點
構(gou)建了一個包(bao)含29個葡萄(tao)基因(yin)組全基因(yin)組圖譜,這(zhe)是目前(qian)最大(da)的葡萄(tao)基因(yin)組數據(ju)集之一;
通過GWAS分(fen)析發現了(le)許多與果實品質相關的基(ji)因,這有助于改善(shan)葡萄的品種選育和提高(gao)產量;
研究者還提出了一些新的策略(lve),例如針對(dui)SV的遺傳分析(xi)和(he)多目標育(yu)種(zhong)等,這(zhe)些策略(lve)有(you)望進一步提高葡萄(tao)育(yu)種(zhong)的效(xiao)率和(he)質量。
文章(zhang)信息
英(ying)文題目:Grapevine pangenome facilitates trait genetics and genomic breeding中文題目:葡萄泛(fan)基因組助力(li)性狀遺傳學與基因組育種研究
發表期刊(kan): nature genetics
影響因子:29.0/Q1
發表時(shi)間:2024年(nian)10月1日
涉及組學:泛基因組、GWAS、GS。
技術(shu)路(lu)線
摘 要(yao)
本(ben)研(yan)(yan)(yan)究旨在通過構建葡萄(tao)基(ji)(ji)因組(zu)參考(kao)圖譜(pu)(Grapepan v.1.0)和(he)對466個(ge)葡萄(tao)品種(zhong)進行重測序數據的(de)(de)分析,探索(suo)復雜(za)農藝性狀(zhuang)(zhuang)(zhuang)的(de)(de)遺傳(chuan)基(ji)(ji)礎,并(bing)為育(yu)種(zhong)提(ti)供(gong)支持(chi)。研(yan)(yan)(yan)究人員使用SNP和(he)結構變異(SVs)建立了(le)(le)一個(ge)變異地圖,并(bing)將SVs整合到全基(ji)(ji)因組(zu)關(guan)(guan)聯研(yan)(yan)(yan)究中,共發(fa)現(xian)了(le)(le)29個(ge)農藝性狀(zhuang)(zhuang)(zhuang)的(de)(de)148個(ge)數量性狀(zhuang)(zhuang)(zhuang)位(wei)點,其中12個(ge)性狀(zhuang)(zhuang)(zhuang)顯(xian)著受SVs影(ying)響(xiang)。此(ci)外,還(huan)發(fa)現(xian)了(le)(le)一些代(dai)謝和(he)果實(shi)發(fa)育(yu)等不同類型(xing)的(de)(de)性狀(zhuang)(zhuang)(zhuang)之間的(de)(de)遺傳(chuan)相關(guan)(guan)性。研(yan)(yan)(yan)究結果表明,包(bao)括SVs在內的(de)(de)全基(ji)(ji)因組(zu)關(guan)(guan)聯研(yan)(yan)(yan)究可以提(ti)高遺傳(chuan)可解釋性的(de)(de)平均值,并(bing)且在多(duo)性狀(zhuang)(zhuang)(zhuang)選擇模型(xing)下,可以通過基(ji)(ji)因組(zu)預(yu)測方法來實(shi)現(xian)多(duo)個(ge)性狀(zhuang)(zhuang)(zhuang)的(de)(de)育(yu)種(zhong)。這項研(yan)(yan)(yan)究為葡萄(tao)藤的(de)(de)育(yu)種(zhong)提(ti)供(gong)了(le)(le)新的(de)(de)思路和(he)工具。
前(qian) 言
葡(pu)萄基(ji)(ji)因(yin)(yin)(yin)組具有(you)高度(du)(du)(du)的(de)(de)(de)雜(za)合(he)性,部分原(yuan)因(yin)(yin)(yin)是(shi)由于克隆繁殖過程中遺傳變(bian)(bian)異(yi)(yi)的(de)(de)(de)積累。這種(zhong)繁殖方(fang)式已(yi)持續數千年。例(li)如,二倍(bei)體(ti)霞多(duo)麗(Chardonnay)和(he)赤(chi)霞珠(Cabernet Sauvignon)的(de)(de)(de)基(ji)(ji)因(yin)(yin)(yin)組中包(bao)(bao)含超過10%的(de)(de)(de)雜(za)合(he)位(wei)點,包(bao)(bao)括單核苷酸多(duo)態性(SNPs)、插入(ru)缺(que)失(shi)(shi)(InDels)和(he)結構(gou)變(bian)(bian)異(yi)(yi)(SVs)10,24,25。盡(jin)管常用(yong)的(de)(de)(de)參考基(ji)(ji)因(yin)(yin)(yin)組PN40024經過9代(dai)自交后已(yi)高度(du)(du)(du)純合(he),但與雜(za)合(he)品(pin)種(zhong)相比(bi),它(ta)仍缺(que)失(shi)(shi)了(le)超過10%的(de)(de)(de)基(ji)(ji)因(yin)(yin)(yin)。在不同品(pin)種(zhong)之間,只有(you)約7%的(de)(de)(de)基(ji)(ji)因(yin)(yin)(yin)是(shi)共享的(de)(de)(de),而每個(ge)品(pin)種(zhong)特有(you)的(de)(de)(de)基(ji)(ji)因(yin)(yin)(yin)則占(zhan)約8%。葡(pu)萄基(ji)(ji)因(yin)(yin)(yin)組的(de)(de)(de)高度(du)(du)(du)變(bian)(bian)異(yi)(yi)性表明,有(you)必要構(gou)建一個(ge)泛基(ji)(ji)因(yin)(yin)(yin)組參考,以納(na)入(ru)存在-缺(que)失(shi)(shi)變(bian)(bian)異(yi)(yi),提(ti)高對(dui)基(ji)(ji)因(yin)(yin)(yin)組變(bian)(bian)異(yi)(yi)(包(bao)(bao)括結構(gou)變(bian)(bian)異(yi)(yi))的(de)(de)(de)檢測能力,并減(jian)少參考偏差。
研究內容(rong)
1.構建首(shou)個馴化葡萄(tao)圖(tu)形(xing)泛參考基因組(zu)(Grapepan v.1.0)
研究人員對9個(ge)具(ju)有(you)代表性(xing)(xing)的(de)(de)(de)二倍(bei)(bei)體樣(yang)品(pin)進行了HiFi測序(xu)、Hi-C測序(xu)和超長納米孔測序(xu),其中(zhong)包括(kuo)1個(ge)亞(ya)洲(zhou)特有(you)野生(sheng)種Vitis retordii的(de)(de)(de)品(pin)系以及8個(ge)葡(pu)(pu)萄(tao)栽培品(pin)種(7個(ge)鮮食葡(pu)(pu)萄(tao)和1個(ge)釀酒葡(pu)(pu)萄(tao))。這(zhe)9個(ge)樣(yang)品(pin)產生(sheng)了18個(ge)單(dan)(dan)(dan)倍(bei)(bei)型,經過填補缺口后達到了T2T水(shui)平(ping)的(de)(de)(de)組(zu)(zu)裝(zhuang)。基因(yin)(yin)組(zu)(zu)大(da)小(xiao)范(fan)(fan)圍為479.15至539.30 Mb。通過高連續性(xing)(xing)(>99.9%)、最小(xiao)切換(huan)錯誤率(<0.05%)和低Hamming錯誤率(<2.83%)(圖(tu)1a,b),證(zheng)實了單(dan)(dan)(dan)倍(bei)(bei)型組(zu)(zu)裝(zhuang)的(de)(de)(de)質量。使(shi)(shi)用通用單(dan)(dan)(dan)拷貝同源基因(yin)(yin)評估基準(zhun)測試表明,這(zhe)些單(dan)(dan)(dan)倍(bei)(bei)型的(de)(de)(de)平(ping)均完整性(xing)(xing)為98.4%。我們使(shi)(shi)用相同的(de)(de)(de)流程對所(suo)有(you)單(dan)(dan)(dan)倍(bei)(bei)型進行注(zhu)釋,以確保(bao)結果(guo)(guo)的(de)(de)(de)一致(zhi)性(xing)(xing)。在(zai)18個(ge)單(dan)(dan)(dan)倍(bei)(bei)型中(zhong),編碼(ma)蛋(dan)白基因(yin)(yin)的(de)(de)(de)數量范(fan)(fan)圍為34,536至38,526,每(mei)個(ge)單(dan)(dan)(dan)倍(bei)(bei)型的(de)(de)(de)TE序(xu)列(lie)長度范(fan)(fan)圍為263.86 Mb(54.68%)至312.10 Mb(59.03%)。此外,我們在(zai)所(suo)有(you)組(zu)(zu)裝(zhuang)結果(guo)(guo)中(zhong)鑒定(ding)了著絲(si)粒和端粒序(xu)列(lie)(圖(tu)1c)。與之前的(de)(de)(de)研究結果(guo)(guo)一致(zhi)27,著絲(si)粒的(de)(de)(de)主要重復單(dan)(dan)(dan)元長度為107 bp。總體而言,這(zhe)18個(ge)組(zu)(zu)裝(zhuang)的(de)(de)(de)單(dan)(dan)(dan)倍(bei)(bei)型及其注(zhu)釋代表了迄今為止所(suo)生(sheng)成的(de)(de)(de)高質量葡(pu)(pu)萄(tao)基因(yin)(yin)組(zu)(zu)數據(ju)集之一。
圖|T2T基因(yin)組組裝(zhuang)及Grapepan v.1.0的構建
2.復(fu)雜農藝性(xing)狀的(de)GWAS及SV的(de)重要性(xing)
為了(le)研(yan)(yan)究結構(gou)變(bian)異對(dui)數量性(xing)(xing)(xing)(xing)狀(zhuang)的(de)(de)(de)貢獻,我們對(dui)324個(ge)(ge)(ge)新測序的(de)(de)(de)葡萄(tao)(tao)品種進行了(le)為期兩(liang)年(2016年和(he)2017年)的(de)(de)(de)表(biao)型(xing)調查,共涉及29個(ge)(ge)(ge)性(xing)(xing)(xing)(xing)狀(zhuang)(圖2a)。這(zhe)324個(ge)(ge)(ge)栽培品種包括(kuo)(kuo)106個(ge)(ge)(ge)釀酒葡萄(tao)(tao)、108個(ge)(ge)(ge)鮮(xian)食(shi)I類葡萄(tao)(tao)和(he)110個(ge)(ge)(ge)鮮(xian)食(shi)II類葡萄(tao)(tao)。這(zhe)29個(ge)(ge)(ge)性(xing)(xing)(xing)(xing)狀(zhuang)包括(kuo)(kuo)五(wu)個(ge)(ge)(ge)表(biao)型(xing)類別(bie):果(guo)(guo)(guo)(guo)穗(6個(ge)(ge)(ge))、內(nei)(nei)容(rong)物(8個(ge)(ge)(ge))、漿(jiang)果(guo)(guo)(guo)(guo)性(xing)(xing)(xing)(xing)狀(zhuang)(8個(ge)(ge)(ge))、果(guo)(guo)(guo)(guo)實(shi)大小(4個(ge)(ge)(ge))和(he)果(guo)(guo)(guo)(guo)皮(3個(ge)(ge)(ge))(圖2a)。以往的(de)(de)(de)研(yan)(yan)究已利用約6,000個(ge)(ge)(ge)SNP位點對(dui)與果(guo)(guo)(guo)(guo)實(shi)組(zu)成(cheng)和(he)尺寸相(xiang)關(guan)的(de)(de)(de)表(biao)型(xing)性(xing)(xing)(xing)(xing)狀(zhuang)進行過GWAS分(fen)(fen)(fen)析36。本研(yan)(yan)究更大的(de)(de)(de)樣(yang)本量和(he)全基(ji)(ji)因(yin)組(zu)范圍內(nei)(nei)的(de)(de)(de)變(bian)異數據,有(you)助于同時(shi)對(dui)多個(ge)(ge)(ge)性(xing)(xing)(xing)(xing)狀(zhuang)進行基(ji)(ji)因(yin)組(zu)選(xuan)擇。首先,研(yan)(yan)究人員(yuan)分(fen)(fen)(fen)析了(le)兩(liang)年間(jian)(jian)數量性(xing)(xing)(xing)(xing)狀(zhuang)之間(jian)(jian)的(de)(de)(de)相(xiang)關(guan)性(xing)(xing)(xing)(xing),并采用主成(cheng)分(fen)(fen)(fen)分(fen)(fen)(fen)析(PCA)對(dui)表(biao)型(xing)進行映射(圖2b)。在(zai)漿(jiang)果(guo)(guo)(guo)(guo)內(nei)(nei)容(rong)物類別(bie)中,果(guo)(guo)(guo)(guo)糖(Fru)、葡萄(tao)(tao)糖(Glu)和(he)可(ke)溶性(xing)(xing)(xing)(xing)固形物含量(SSC)等性(xing)(xing)(xing)(xing)狀(zhuang)兩(liang)兩(liang)之間(jian)(jian)存在(zai)顯著(zhu)(zhu)的(de)(de)(de)正(zheng)相(xiang)關(guan)關(guan)系(P<<0.001)。此(ci)外,不同類別(bie)之間(jian)(jian)的(de)(de)(de)性(xing)(xing)(xing)(xing)狀(zhuang)也存在(zai)相(xiang)關(guan)性(xing)(xing)(xing)(xing)。例如,內(nei)(nei)容(rong)物類別(bie)的(de)(de)(de)可(ke)滴定酸(suan)(TAC)與果(guo)(guo)(guo)(guo)實(shi)大小的(de)(de)(de)四個(ge)(ge)(ge)測量指標之間(jian)(jian)存在(zai)顯著(zhu)(zhu)的(de)(de)(de)負相(xiang)關(guan)關(guan)系:漿(jiang)果(guo)(guo)(guo)(guo)重量(BeWe)、漿(jiang)果(guo)(guo)(guo)(guo)體(ti)積(BV)、漿(jiang)果(guo)(guo)(guo)(guo)長度(du)(du)(BL)和(he)漿(jiang)果(guo)(guo)(guo)(guo)寬度(du)(du)(BeWi)。這(zhe)些(xie)相(xiang)關(guan)性(xing)(xing)(xing)(xing)可(ke)能(neng)源于這(zhe)樣(yang)一個(ge)(ge)(ge)事實(shi):在(zai)果(guo)(guo)(guo)(guo)實(shi)轉色期(veraison)時(shi),酸(suan)的(de)(de)(de)合成(cheng)通常會停(ting)(ting)止,而這(zhe)種停(ting)(ting)止會導致(zhi)果(guo)(guo)(guo)(guo)實(shi)繼續成(cheng)熟和(he)膨大過程中酸(suan)濃度(du)(du)的(de)(de)(de)稀釋。表(biao)型(xing)之間(jian)(jian)的(de)(de)(de)這(zhe)些(xie)相(xiang)關(guan)性(xing)(xing)(xing)(xing)可(ke)能(neng)導致(zhi)一些(xie)候選(xuan)的(de)(de)(de)GWAS位點重疊,并對(dui)具有(you)多種理想性(xing)(xing)(xing)(xing)狀(zhuang)的(de)(de)(de)優(you)質葡萄(tao)(tao)品種的(de)(de)(de)基(ji)(ji)因(yin)組(zu)選(xuan)擇產生潛在(zai)影響。
圖2 | 不同(tong)葡萄群體間29項農藝性狀(zhuang)的相關性分(fen)析。
以(yi)(yi)往GWAS研(yan)究難以(yi)(yi)同時處理大量品(pin)種、多性狀及高分辨率(lv)數(shu)據(ju),且(qie)葡(pu)萄研(yan)究中從未(wei)納入結(jie)構(gou)變異(SVs)。我(wo)們利(li)用Grapepan v.1.0平臺(tai)對SNP和SVs進(jin)行GWAS分析(xi),發現148個基(ji)(ji)(ji)(ji)因(yin)(yin)座(zuo)(zuo)與農藝性狀相關(guan)(136個由SNP檢(jian)測,12個由SVs捕(bu)獲),覆(fu)蓋(gai)27.61 Mb基(ji)(ji)(ji)(ji)因(yin)(yin)組(zu)區域(~5.58%)。其中26個位(wei)(wei)點(dian)(~17.57%)與已知功能(neng)位(wei)(wei)點(dian)重疊。例如,18號染色(se)體(ti)上AGL11基(ji)(ji)(ji)(ji)因(yin)(yin)(調控種子(zi)發育)與無籽性狀相關(guan);BL1位(wei)(wei)點(dian)95bp缺失(PVE 6.31%)與果實長(chang)度相關(guan);SN6基(ji)(ji)(ji)(ji)因(yin)(yin)座(zuo)(zuo)1.1 kb缺失(PVE 6.08%)與光(guang)裂合酶基(ji)(ji)(ji)(ji)因(yin)(yin)相關(guan);Suc1基(ji)(ji)(ji)(ji)因(yin)(yin)座(zuo)(zuo)139 bp插(cha)入(PVE 6.60%)影響蔗糖含量。PNT2T參考(kao)基(ji)(ji)(ji)(ji)因(yin)(yin)組(zu)分析(xi)顯示,91.18%的位(wei)(wei)點(dian)與泛基(ji)(ji)(ji)(ji)因(yin)(yin)組(zu)SNP結(jie)果一致。
此外,SSC7和(he)BeWi9位點的顯(xian)著(zhu)SNP(P值6.05%/5.91%)與漿(jiang)果寬(kuan)度(du)相關(guan)。局(ju)部系統(tong)發育樹顯(xian)示栽培葡萄存在(zai)選擇(ze)性清除。SNP 17_6489512和(he)17_6484258分別影響可溶性固形物和(he)漿(jiang)果寬(kuan)度(du)。該區域(yu)注釋出NEPS和(he)NRT1基因家族(zu),其中Vitvi031750和(he)Vitvi031760高表達(da),Vitvi031756在(zai)釀酒葡萄中表達(da)更高。
圖3|與(yu)農藝性狀相關的候選基因座及其(qi)人工選擇的基因組足跡
4.葡萄農藝性狀的分歧選擇
通過(guo)XP-EHH分(fen)(fen)(fen)(fen)析發現,鮮食葡萄組間(jian)21.45 Mb(4.4%)基因組區域(yu)存在(zai)顯(xian)著分(fen)(fen)(fen)(fen)化(hua)(P?<?0.05),FST分(fen)(fen)(fen)(fen)析前5%異常值呈現相似模式。GSEA顯(xian)示(shi)分(fen)(fen)(fen)(fen)化(hua)區域(yu)富集于(yu)激素和脅迫(po)響應相關通路(lu)。六個GWAS候選位(wei)(wei)點(dian)(BC4、SA1、BeS2、BuW5、FF6、Tar4)位(wei)(wei)于(yu)分(fen)(fen)(fen)(fen)化(hua)區域(yu),分(fen)(fen)(fen)(fen)別調控果實顏(yan)色、澀(se)味(wei)、形狀、穗重、硬(ying)(ying)度和酒石(shi)酸含量。其中,BC4位(wei)(wei)點(dian)含MYB基因簇,FF6位(wei)(wei)點(dian)(PVE 7.35%)使鮮食組果肉硬(ying)(ying)度顯(xian)著提升11.7%(P?<?0.01)。
釀酒與鮮(xian)食葡萄比(bi)較發現(xian)21.35 Mb分(fen)化區域(P?<?0.05),GSEA提示(shi)糖胺(an)、谷(gu)胱甘(gan)肽代(dai)(dai)謝及毒素分(fen)解通路富集。45個(ge)GWAS位點與果實大(da)小相(xiang)關,32個(ge)位點關聯風(feng)味(wei)代(dai)(dai)謝物(如總酸(suan)、單寧(ning)、糖類)。分(fen)化選擇顯著影響BV12、BeWe6等果實大(da)小位點及TAC3、SSC7等代(dai)(dai)謝位點,表明農藝性狀分(fen)化與育種目標(biao)密切相(xiang)關。
圖4|亞群(qun)間農藝性狀的差異(yi)選(xuan)擇
5.SVs提高(gao)了葡萄(tao)性狀的遺傳力(li)估計
本研(yan)究發現,大多(duo)(duo)數結構變(bian)異(SV)與單核苷(gan)酸多(duo)(duo)態(tai)性(xing)(xing)(xing)(xing)(SNP)無(wu)連鎖(suo),且部(bu)分GWAS信號區域僅由SV驅動,表明SV對遺(yi)傳(chuan)(chuan)力(li)缺(que)失具有獨特貢獻。通過(guo)LDAK模型分析(xi)顯(xian)示,SV對性(xing)(xing)(xing)(xing)狀(zhuang)遺(yi)傳(chuan)(chuan)力(li)的(de)貢獻(0.5%-86.1%)顯(xian)著高于SNP(0.01%-52.3%),其中定(ding)(ding)量(liang)性(xing)(xing)(xing)(xing)狀(zhuang)主要(yao)受SNP多(duo)(duo)基因(yin)效(xiao)應調控,而定(ding)(ding)性(xing)(xing)(xing)(xing)性(xing)(xing)(xing)(xing)狀(zhuang)更依賴SV大效(xiao)應。典型案(an)例如BeWi表型(SV解釋74.6% vs SNP 0.5%)、SSC性(xing)(xing)(xing)(xing)狀(zhuang)(SV 35.8% vs SNP 0.6%)以及BL性(xing)(xing)(xing)(xing)狀(zhuang)(SV引入使遺(yi)傳(chuan)(chuan)力(li)從20.9%提升至64.9%)。特別值得(de)注(zhu)意的(de)是,Chr7上(shang)5.6 kb缺(que)失(SSC2)通過(guo)調控異淀(dian)粉(fen)酶基因(yin)Vitvi011368顯(xian)著影響SSC表型。在(zai)育種應用方面,整合(he)SV與SNP的(de)多(duo)(duo)性(xing)(xing)(xing)(xing)狀(zhuang)分析(xi)顯(xian)示20.7%的(de)性(xing)(xing)(xing)(xing)狀(zhuang)存在(zai)顯(xian)著遺(yi)傳(chuan)(chuan)相關(rG=0.41-0.97),基于多(duo)(duo)基因(yin)評(ping)分(PGS)的(de)預(yu)測準(zhun)確率平均(jun)超過(guo)50%,較傳(chuan)(chuan)統(tong)方法提升16%以上(shang),其中BL性(xing)(xing)(xing)(xing)狀(zhuang)預(yu)測準(zhun)確率高達79.53%。這些發現為葡萄分子設(she)計育種提供了新的(de)理論依據(ju)和技術支撐。
圖5|缺失的遺傳力、遺傳相關性(xing)和農藝性(xing)狀的基因組(zu)預測
總 結
研究人(ren)員成(cheng)功(gong)(gong)地(di)構建了(le)(le)一個包含29個完整(zheng)基(ji)因(yin)(yin)家族的(de)葡(pu)(pu)萄(tao)基(ji)因(yin)(yin)組學全(quan)基(ji)因(yin)(yin)組圖(tu)譜,并發(fa)現其中(zhong)許多基(ji)因(yin)(yin)與果(guo)實品質(zhi)相關。通過對這些(xie)基(ji)因(yin)(yin)進行進一步的(de)功(gong)(gong)能(neng)分析,研究人(ren)員得出了(le)(le)一些(xie)關于葡(pu)(pu)萄(tao)生長發(fa)育的(de)重要結論(lun),這對未來(lai)的(de)葡(pu)(pu)萄(tao)育種和(he)生產具(ju)有重要的(de)指導意義。同時,該(gai)研究也證(zheng)明了(le)(le)全(quan)基(ji)因(yin)(yin)組測序技(ji)術(shu)和(he)高(gao)精(jing)度組裝技(ji)術(shu)在植物基(ji)因(yin)(yin)組學研究中(zhong)的(de)重要性和(he)應用前景。
參考文獻:Liu Z, Wang N, Su Y, et al. Grapevine pangenome facilitates trait genetics and genomic breeding. Nat Genet. 2024 Dec;56(12):2804-2814. doi: 10.1038/s41588-024-01967-5. Epub 2024 Nov 4.