2025-06-12
文章信息
英(ying)文題目:Graph-based pangenome provides insights into structural variations and genetic basis of metabolic traits in potato
中文(wen)題(ti)目:泛(fan)基因組和mGWAS解析馬鈴薯結(jie)構變異及代(dai)謝性狀的遺傳基礎
發表期刊(kan):Molecular Plant
影響因(yin)子:17.1/Q1
發表時間(jian):2025年4月
涉及(ji)組學:基因(yin)組De novo、泛基因(yin)組構(gou)建(jian)、基因(yin)組變(bian)異(yi)檢(jian)測、代謝組、mGWAS關聯分(fen)析。
摘(zhai) 要
馬(ma)(ma)(ma)鈴(ling)(ling)薯(shu)(shu)是世界上(shang)最(zui)重要的(de)非谷(gu)物(wu)作(zuo)物(wu)。在(zai)這(zhe)項(xiang)研(yan)究中,為(wei)(wei)了(le)(le)評估馬(ma)(ma)(ma)鈴(ling)(ling)薯(shu)(shu)部分內的(de)遺傳多樣性(xing),對29個(ge)(ge)野(ye)生種及(ji)地方品(pin)種的(de)基(ji)(ji)(ji)因組(zu)(zu)(zu)(zu)(zu)進(jin)行了(le)(le)高質量的(de)組(zu)(zu)(zu)(zu)(zu)裝工作(zuo),并且(qie)有248個(ge)(ge)(野(ye)生馬(ma)(ma)(ma)鈴(ling)(ling)薯(shu)(shu),地方品(pin)種,現代(dai)(dai)栽培品(pin)種)進(jin)行了(le)(le)>253X重測序(xu)。以DM8.1為(wei)(wei)骨架構建了(le)(le)一個(ge)(ge)基(ji)(ji)(ji)于(yu)圖的(de)泛基(ji)(ji)(ji)因組(zu)(zu)(zu)(zu)(zu),整合(he)了(le)(le)194,330個(ge)(ge)非冗余(yu)結構變體。為(wei)(wei)了(le)(le)描述(shu)塊莖(jing)的(de)代(dai)(dai)謝(xie)組(zu)(zu)(zu)(zu)(zu)和(he)闡明(ming)代(dai)(dai)謝(xie)性(xing)狀(zhuang)的(de)基(ji)(ji)(ji)因組(zu)(zu)(zu)(zu)(zu)基(ji)(ji)(ji)礎,采用lc-ms/MS技術獲(huo)得了(le)(le)157個(ge)(ge)種質的(de)代(dai)(dai)謝(xie)組(zu)(zu)(zu)(zu)(zu)和(he)9,321個(ge)(ge)結構變異 (SVs)。通過基(ji)(ji)(ji)于(yu)存在(zai)和(he)缺失變化(hua)的(de)代(dai)(dai)謝(xie)組(zu)(zu)(zu)(zu)(zu)學-GWAS分析,檢(jian)測到與1,258種不同的(de)代(dai)(dai)謝(xie)物(wu)顯著相關,包括黃酮(tong)類代(dai)(dai)謝(xie)物(wu),酚(fen)酸和(he)磷脂。為(wei)(wei)了(le)(le)促(cu)進(jin)泛組(zu)(zu)(zu)(zu)(zu)資源的(de)利用,開發了(le)(le)一個(ge)(ge)綜合(he)平(ping)臺 -- 馬(ma)(ma)(ma)鈴(ling)(ling)薯(shu)(shu)泛組(zu)(zu)(zu)(zu)(zu)數據庫 (PPDB)。本研(yan)究為(wei)(wei)解剖馬(ma)(ma)(ma)鈴(ling)(ling)薯(shu)(shu)農學和(he)代(dai)(dai)謝(xie)性(xing)狀(zhuang)的(de)基(ji)(ji)(ji)因組(zu)(zu)(zu)(zu)(zu)基(ji)(ji)(ji)礎提供了(le)(le)全面(mian)的(de)基(ji)(ji)(ji)因組(zu)(zu)(zu)(zu)(zu)資源,這(zhe)將加速馬(ma)(ma)(ma)鈴(ling)(ling)薯(shu)(shu)功能基(ji)(ji)(ji)因組(zu)(zu)(zu)(zu)(zu)學研(yan)究和(he)遺傳改良(liang)。
前 言
野生馬鈴(ling)薯分布廣泛,有超過100個物種(zhong),形態多變性(xing)高,為應對(dui)環境變化和人類需求提供了大(da)量的(de)(de)遺傳資源。然(ran)而(er),在馬鈴(ling)薯育(yu)種(zhong)過程中(zhong)(zhong)由(you)于遺傳馴(xun)化而(er)造成(cheng)了大(da)量遺傳多樣性(xing)的(de)(de)損失。馬鈴(ling)薯育(yu)種(zhong)家試圖將野生物種(zhong)的(de)(de)特(te)定基因(yin)(yin)引入現有的(de)(de)主要(yao)栽培品種(zhong)。然(ran)而(er),由(you)于基因(yin)(yin)組的(de)(de)復雜性(xing)與(yu)馬鈴(ling)薯近交(jiao)(jiao)衰(shuai)退和自交(jiao)(jiao)不(bu)親和有關,利(li)用野生物種(zhong)進行品種(zhong)改良仍(reng)然(ran)具有挑戰(zhan)性(xing)。此外(wai),野生物種(zhong)的(de)(de)利(li)用可能會重新引入繁殖過程中(zhong)(zhong)已經消除(chu)的(de)(de)不(bu)希望的(de)(de)特(te)征。
最近的(de)(de)許多研究強調,基(ji)(ji)(ji)于SV的(de)(de)全基(ji)(ji)(ji)因組(zu)關(guan)聯研究 (GWAS) 分析是鑒定復雜農藝性(xing)狀相關(guan)基(ji)(ji)(ji)因的(de)(de)有效(xiao)策(ce)略(lve)。因此,很(hen)大一(yi)(yi)部分SVs可能(neng)由(you)于單(dan)一(yi)(yi)線(xian)性(xing)參(can)考基(ji)(ji)(ji)因組(zu)的(de)(de)限制而無法識別。為了獲得(de)一(yi)(yi)個(ge)群(qun)體內的(de)(de)整個(ge)基(ji)(ji)(ji)因組(zu)變(bian)異,有必要(yao)構建一(yi)(yi)個(ge)基(ji)(ji)(ji)于圖形的(de)(de)泛基(ji)(ji)(ji)因組(zu),存(cun)儲參(can)考和(he)替代等位基(ji)(ji)(ji)因序列,以(yi)擴(kuo)展線(xian)性(xing)參(can)考基(ji)(ji)(ji)因組(zu)的(de)(de)坐標系(xi)。
研(yan)究內容
1.泛(fan)基因組構建(jian)
本研究從頭組(zu)(zu)裝28個(ge)基(ji)(ji)(ji)(ji)因(yin)組(zu)(zu)和22個(ge)已(yi)發(fa)表的(de)(de)基(ji)(ji)(ji)(ji)因(yin)組(zu)(zu),被用于(yu)(yu)泛基(ji)(ji)(ji)(ji)因(yin)組(zu)(zu)構(gou)建(jian)。隨著基(ji)(ji)(ji)(ji)因(yin)組(zu)(zu)數目的(de)(de)增(zeng)加,pangenes的(de)(de)數量增(zeng)加,而核心基(ji)(ji)(ji)(ji)因(yin)的(de)(de)數量減少,并在(zai)(zai)(zai)50個(ge)基(ji)(ji)(ji)(ji)因(yin)組(zu)(zu)時達到最大(da)值(zhi)。這(zhe)表明這(zhe)50個(ge)基(ji)(ji)(ji)(ji)因(yin)組(zu)(zu)是多(duo)樣(yang)化的(de)(de),單一參(can)考基(ji)(ji)(ji)(ji)因(yin)組(zu)(zu)無法捕捉到馬鈴薯的(de)(de)全部遺傳多(duo)樣(yang)性(xing) (圖1A)。核心組(zu)(zu)由7485個(ge)基(ji)(ji)(ji)(ji)因(yin)家族 (536,166個(ge)基(ji)(ji)(ji)(ji)因(yin)) 組(zu)(zu)成,存在(zai)(zai)(zai)于(yu)(yu)所有(you)(you)50個(ge)資源中(zhong)(zhong),軟核心組(zu)(zu)由8798個(ge)基(ji)(ji)(ji)(ji)因(yin)家族 (585,598個(ge)基(ji)(ji)(ji)(ji)因(yin)) 組(zu)(zu)成,存在(zai)(zai)(zai)于(yu)(yu)45-49個(ge)資源中(zhong)(zhong)。可有(you)(you)可無的(de)(de)一組(zu)(zu)由24,869個(ge)基(ji)(ji)(ji)(ji)因(yin)家族 (488,514個(ge)基(ji)(ji)(ji)(ji)因(yin)) 組(zu)(zu)成,存在(zai)(zai)(zai)于(yu)(yu)2-44個(ge)品種(zhong)中(zhong)(zhong),而私有(you)(you)的(de)(de)一組(zu)(zu)則由1,254個(ge)基(ji)(ji)(ji)(ji)因(yin)家族組(zu)(zu)成 (圖1B)。
圖1.50個馬鈴薯樣本的泛(fan)基(ji)因組和核心基(ji)因組分析。
2.基(ji)因(yin)組遺傳變異
為了(le)(le)(le)檢測(ce)結構變異(SVs),研(yan)究者使用了(le)(le)(le)DM8.1的無(wu)缺(que)口(kou)基(ji)(ji)因(yin)組(zu)作為參考基(ji)(ji)因(yin)組(zu)。每個(ge)(ge)樣本(ben)中的SV數量從2,686到(dao)31,949不(bu)等,平均(jun)影響了(le)(le)(le)128.36(58.59–223.41)Mb的基(ji)(ji)因(yin)組(zu)序列(lie)(lie),總計導致了(le)(le)(le)6.29 Gb的基(ji)(ji)因(yin)組(zu)序列(lie)(lie)變異(圖2)。研(yan)究共鑒定出194,330個(ge)(ge)非(fei)冗余(yu)SVs,其中包(bao)括(kuo)149,344個(ge)(ge)PAVs(指(zhi)超(chao)過50 bp的插(cha)入缺(que)失)、26,305個(ge)(ge)重復序列(lie)(lie)(DUPs)、16,918個(ge)(ge)易(yi)位(wei)(TRANSs)和1763個(ge)(ge)倒位(wei)(INVs)。
圖2.馬鈴薯(shu)基因組(zu)的遺傳變異。
3.SV影響與農藝性狀相(xiang)關的基因表達
研究SVs對基(ji)(ji)因(yin)表(biao)達的影響(xiang)(xiang),使(shi)用至(zhi)少(shao)在(zai)(zai)五個(ge)(ge)訪問中存(cun)在(zai)(zai)SV而在(zai)(zai)至(zhi)少(shao)五個(ge)(ge)其(qi)他資(zi)源(yuan)中不存(cun)在(zai)(zai)的SVs基(ji)(ji)因(yin)對來分(fen)析SV相關基(ji)(ji)因(yin)的表(biao)達影響(xiang)(xiang)。總共評估了(le)20,945個(ge)(ge)SV,發現4,249個(ge)(ge)SVs在(zai)(zai)28個(ge)(ge)種質的6個(ge)(ge)組織中顯(xian)(xian)著影響(xiang)(xiang)基(ji)(ji)因(yin)表(biao)達 (p< 0.05,曼-惠特尼檢驗)。有更大(da)比(bi)例的SVs(23%,4103個(ge)(ge)SV基(ji)(ji)因(yin)對中的950個(ge)(ge)) 影響(xiang)(xiang)編(bian)碼序列(lie) (外顯(xian)(xian)子、trans和DUPs的indels) 與影響(xiang)(xiang)調控區的SVs相比(bi) (19.6%,16,842sv基(ji)(ji)因(yin)對中的3299對),與表(biao)達差異(yi)顯(xian)(xian)著相關 (圖3)。
圖3.基因相關SV影響其(qi)表達。
4.基于圖(tu)的(de)泛基因組和基于PAV的(de)mGWAS在馬鈴薯(shu)塊莖(jing)中的(de)構建
研(yan)究人員對一(yi)個包含(han)248個樣本(ben)(ben)的(de)馬(ma)鈴薯種(zhong)(zhong)(zhong)群進行(xing)(xing)了(le)SVs的(de)基因分(fen)型(xing),這(zhe)些(xie)樣本(ben)(ben)包括117個野生(sheng)種(zhong)(zhong)(zhong)、40個地方品(pin)種(zhong)(zhong)(zhong)和91個栽培品(pin)種(zhong)(zhong)(zhong),測(ce)序深度超過(guo)253,生(sheng)成了(le)25,969個PAVs。為了(le)研(yan)究馬(ma)鈴薯的(de)代謝(xie)組,研(yan)究人員對117個野生(sheng)馬(ma)鈴薯和40個地方品(pin)種(zhong)(zhong)(zhong)的(de)成熟塊莖(jing)進行(xing)(xing)了(le)LC-MS/MS代謝(xie)組量化分(fen)析(xi)。利用該群體中檢測(ce)到的(de)25,969個PAVs,對1,258個代謝(xie)物進行(xing)(xing)了(le)mGWAS分(fen)析(xi),共(gong)檢測(ce)到9,321個顯(xian)著關(guan)聯(lian)位點,對應1,226個代謝(xie)物(圖4)。研(yan)究人員發現,97. 46%的(de)代謝(xie)物至少(shao)有(you)一(yi)個顯(xian)著關(guan)聯(lian)位點,其中93.6%的(de)代謝(xie)物與多(duo)個位點相(xiang)關(guan),且不同(tong)的(de)代謝(xie)物可能與同(tong)一(yi)位點相(xiang)關(guan)。
圖4.代(dai)謝物變異的遺傳結構。
總 結
本文(wen)通過(guo)構建高質量的(de)圖形泛基(ji)(ji)(ji)因(yin)組,深入分析了(le)馬鈴薯種(zhong)(zhong)群中的(de)遺(yi)傳多樣(yang)(yang)性和基(ji)(ji)(ji)因(yin)變(bian)異(yi)(yi)(yi)對(dui)性狀(zhuang)的(de)影(ying)響。研究團隊利(li)用最新的(de)單(dan)分子測(ce)序技術對(dui)29個(ge)代(dai)(dai)表樣(yang)(yang)本進行了(le)全基(ji)(ji)(ji)因(yin)組組裝,并重(zhong)新測(ce)序了(le)248份包括野生(sheng)種(zhong)(zhong)、地方品(pin)(pin)種(zhong)(zhong)和現代(dai)(dai)栽(zai)培品(pin)(pin)種(zhong)(zhong)在(zai)內的(de)樣(yang)(yang)本,發現了(le)194,330個(ge)非重(zhong)復的(de)結(jie)構變(bian)異(yi)(yi)(yi)(SV)。這些(xie)變(bian)異(yi)(yi)(yi)與(yu)1,258種(zhong)(zhong)不同的(de)代(dai)(dai)謝(xie)物顯著相關(guan),從而通過(guo)基(ji)(ji)(ji)于(yu)PAV(存在(zai)與(yu)缺失變(bian)異(yi)(yi)(yi))的(de)代(dai)(dai)謝(xie)組學-GWAS分析揭(jie)示(shi)了(le)基(ji)(ji)(ji)因(yin)變(bian)異(yi)(yi)(yi)對(dui)土(tu)豆(dou)代(dai)(dai)謝(xie)特性的(de)基(ji)(ji)(ji)礎影(ying)響。此外,文(wen)中還開發了(le)一個(ge)綜合數(shu)據庫——馬鈴薯共(gong)濟體數(shu)據庫(PPDB),旨在(zai)促進科研人(ren)員(yuan)共(gong)享和利(li)用這些(xie)寶貴的(de)遺(yi)傳資源(yuan),加速土(tu)豆(dou)功能基(ji)(ji)(ji)因(yin)組學研究和品(pin)(pin)種(zhong)(zhong)改良進程。
參(can)考文獻:Zhu X, Yang R, Liang Q, et al. Graph-based pangenome provides insights into structural variations and genetic basis of metabolic traits in potato. Mol Plant. 2025 Apr 7;18(4):590-602. doi: 10.1016/j.molp.2025.01.017.