2025-06-09
Highlights
1.從傳統的GWAS到XGWAS/XWAS,整合多組學數據,突破單一基因組分析的局限,全方位挖掘性狀相關機制。
2.一網打盡XGWAS/XWAS開展策略,根據不同關注層面合理選擇測序深度和相關組學,確保數據關聯準確。
3.派森諾提供多種模型和系統分析流程,涵蓋群體遺傳結構、全基因組關聯分析及高級選擇性清除分析,深度解析復雜性狀的遺傳基礎。
全基因組關聯分析(GWAS)是一(yi)種用于識別遺(yi)傳區(qu)域和性(xing)狀(zhuang)之間(jian)關聯的(de)(de)(de)方法,它通(tong)過檢測多(duo)(duo)個(ge)個(ge)體在全基(ji)因(yin)(yin)組(zu)范圍內(nei)(nei)的(de)(de)(de)遺(yi)傳變異多(duo)(duo)態(tai)性(xing),并與(yu)可(ke)觀測的(de)(de)(de)性(xing)狀(zhuang)(表型(xing))進行群體水(shui)平的(de)(de)(de)統(tong)計學分析(xi),以篩(shai)選出可(ke)能(neng)影響該性(xing)狀(zhuang)的(de)(de)(de)遺(yi)傳變異。如(ru)今,科研領域的(de)(de)(de)內(nei)(nei)卷那是越(yue)(yue)來(lai)越(yue)(yue)嚴重,可(ke)以發(fa)現越(yue)(yue)來(lai)越(yue)(yue)多(duo)(duo)的(de)(de)(de)高分文章里面開始頻繁出現其(qi)他類型(xing)的(de)(de)(de)關聯分析(xi),而(er)不是僅(jin)僅(jin)局限于GWAS。我(wo)們(men)可(ke)以通(tong)過整合轉錄組(zu)/蛋白質組(zu)關聯研究(Transcriptome/Proteome association studies, 簡(jian)稱(cheng)T/PWAS,統(tong)稱(cheng)為XWAS)能(neng)夠(gou)將表型(xing)與(yu)特(te)定基(ji)因(yin)(yin)的(de)(de)(de)影響聯系(xi)起來(lai)。當(dang)然,另一(yi)種較為簡(jian)單(dan)的(de)(de)(de)理解或(huo)分析(xi)方法可(ke)以直(zhi)接將基(ji)因(yin)(yin)/蛋白表達、某類代謝(xie)物甚至微生物作為表型(xing),而(er)可(ke)以進一(yi)步稱(cheng)為XGWAS。
一、常用XGWAS/XWAS關聯分析簡介
● Genome-Wide Association Study (GWAS)
GWAS通過對眾(zhong)多(duo)遺傳標記(通常是單核(he)苷酸多(duo)態性,SNP)進(jin)行挖掘,尋找與(yu)特(te)定性狀或(huo)表型(xing)(xing)相(xiang)關(guan)的(de)(de)遺傳變異(yi)。當某些遺傳變異(yi)在(zai)具有特(te)定表型(xing)(xing)的(de)(de)群體中的(de)(de)頻率顯著高于另一人群時,這些變異(yi)就被(bei)認為與(yu)該表型(xing)(xing)可(ke)能存在(zai)關(guan)聯。其(qi)目(mu)的(de)(de)是識別出影(ying)響復雜性狀的(de)(de)基因位點,幫(bang)助揭(jie)示其(qi)遺傳基礎。目(mu)前(qian),更(geng)多(duo)變異(yi)類(lei)型(xing)(xing)加入其(qi)中,如(ru)Indel/SV-GWAS更(geng)多(duo)關(guan)注小片段變異(yi)/結(jie)構性變異(yi)與(yu)表型(xing)(xing)的(de)(de)關(guan)聯。
● Transcriptome-Wide Association Study (TWAS)
全轉錄組關(guan)(guan)聯(lian)研(yan)究(TWAS)將(jiang)(jiang)基因(yin)(yin)組信(xin)息整合成與(yu)功能(neng)相關(guan)(guan)的(de)單位,對應(ying)于(yu)基因(yin)(yin)及(ji)其表(biao)達(da)。GWAS已經成功鑒定了數(shu)千(qian)個(ge)與(yu)多(duo)種(zhong)復雜性(xing)狀(zhuang)相關(guan)(guan)的(de)遺傳變異。然而,對于(yu)許(xu)多(duo)性(xing)狀(zhuang)往往由多(duo)個(ge)微效(xiao)基因(yin)(yin)控制。而TWAS是研(yan)究這(zhe)些潛(qian)在變異-性(xing)狀(zhuang)關(guan)(guan)聯(lian)機(ji)制的(de)寶貴(gui)工具(ju)。TWAS能(neng)夠將(jiang)(jiang)GWAS與(yu)表(biao)達(da)圖(tu)譜研(yan)究結合起來,從而識別基因(yin)(yin)-性(xing)狀(zhuang)關(guan)(guan)聯(lian)(GTAs)。
● Proteome-Wide Association Study (PWAS)
全蛋(dan)白(bai)質組關聯研究(Proteome-Wide Association Study,PWAS),用于檢測(ce)由蛋(dan)白(bai)質功能改變(bian)(bian)介(jie)導(dao)的基(ji)因(yin)-表(biao)型關聯。PWAS匯(hui)總(zong)了共(gong)同影響(xiang)蛋(dan)白(bai)編碼基(ji)因(yin)的所有變(bian)(bian)異信(xin)號,并利用機器學習(xi)及概率模(mo)型評估它們(men)對蛋(dan)白(bai)質功能的整體(ti)影響(xiang)。隨后,它檢測(ce)該基(ji)因(yin)是否在個體(ti)間(jian)展現出與目的表(biao)型相關的功能性(xing)變(bian)(bian)異。PWAS能夠捕捉包(bao)括隱(yin)性(xing)遺傳在內的復雜遺傳模(mo)式(shi)。
● metabolome Genome-Wide Association Study (mGWAS)
mGWAS是將代(dai)謝(xie)(xie)組(zu)學數(shu)據(ju)(ju)(ju)作為表型,與基(ji)(ji)因組(zu)數(shu)據(ju)(ju)(ju)進行關聯分析(xi)(xi)的一種領先方法。由于代(dai)謝(xie)(xie)組(zu)數(shu)據(ju)(ju)(ju)對表型鑒(jian)定更(geng)為精(jing)細,因此關聯分析(xi)(xi)的精(jing)度比傳統GWAS分析(xi)(xi)更(geng)高,通過(guo)代(dai)謝(xie)(xie)組(zu)與基(ji)(ji)因組(zu)整合的mGWAS分析(xi)(xi),可以得到更(geng)精(jing)準的代(dai)謝(xie)(xie)物的調控基(ji)(ji)因信息。
● Microbial Genome-Wide Association Study (MGWAS)
MGWAS是一種用于研究(jiu)(jiu)微生物(wu)與宿(su)主遺傳變異之間關(guan)聯的方法(fa),尤其在探究(jiu)(jiu)植物(wu)-微生物(wu)互作(zuo)領域已逐漸成為一種新興的分析(xi)手段,用于探索宿(su)主遺傳變異如(ru)何(he)影響微生物(wu)群落(luo)的定(ding)植和功能。
二、如何開展 XGWAS/XWAS?
● 材料選擇
● 測序策略
1)全基因組重測序。針對(dui)有參考基因組,基于關注目標變異類型不同(tong)選擇合適的測序(xu)深入(ru),如SNP和Indel建(jian)議測序(xu)深度10X以(yi)上,SV則建(jian)議測序(xu)深度20X以(yi)上。
2)多組學測定。根據關(guan)注(zhu)層面不同進而選(xuan)擇轉錄組(zu)/蛋白(bai)組(zu)/代(dai)謝(xie)組(zu)/微生(sheng)物組(zu),注(zhu)意:測定個體需與重測序樣本一(yi)一(yi)對應。
● 模型選擇
線性(xing)模(mo)(mo)型(xing)(xing)(xing)(xing)(GLM)和混合線性(xing)模(mo)(mo)型(xing)(xing)(xing)(xing)(MLM)是進(jin)行GWAS時常用(yong)且經典的(de)兩種(zhong)模(mo)(mo)型(xing)(xing)(xing)(xing)。PS:派森諾除(chu)了標準交付的(de)結果,針對關鍵性(xing)狀(n<10),可采用(yong)4種(zhong)模(mo)(mo)型(xing)(xing)(xing)(xing)進(jin)行定位(壓縮混合線性(xing)模(mo)(mo)型(xing)(xing)(xing)(xing)(CMLM)和固定和隨機模(mo)(mo)型(xing)(xing)(xing)(xing)交替概率統一模(mo)(mo)型(xing)(xing)(xing)(xing)(FarmCPU)等)!
● 分析流程
GWAS分析流程
XGWAS分析流程
三、XGWAS/XWAS部分核心內容展示
● 群體遺傳結構相關分析
系統進化樹(shu)重構及群體PCA分析(xi)
群(qun)體遺(yi)傳(chuan)結構圖及(ji)親緣(yuan)關(guan)系分析
● 全基因組關聯分析分析
全基因組關聯分析
LDBlock聯(lian)合(he)分(fen)析及候選基因關(guan)聯(lian)分(fen)析
● 選擇性清除分析(高級分析)
選擇性清除分析
精選案例
文章題目:Genome- and transcriptome-wide association studies provide insights into the genetic basis of natural variation of seed oil content in Brassica napus
研究材料:505 份甘藍型(xing)(xing)油菜自然品種,包(bao)括半冬(dong)季型(xing)(xing)和春(chun)季型(xing)(xing)
測序方案:自然群體重測(ce)(ce)序(平(ping)均(jun)測(ce)(ce)序深(shen)度~9X)、轉錄組測(ce)(ce)序
科學問題:培育高含油量甘藍(lan)型(xing)油菜品種具有重要的(de)經(jing)濟意義,本研究擬(ni)通過基(ji)因組和轉錄(lu)組關聯研究揭示甘藍(lan)型(xing)油菜種子(zi)油分自然變異的(de)遺傳基(ji)礎。
研究思路:
核心內容展示:
甘(gan)藍型油菜自(zi)然群(qun)體種子(zi)含油量(liang)GWAS分(fen)析
甘藍(lan)型油菜自(zi)然群體種子含油量TWAS分析
參(can)考文(wen)獻:Tang S, Zhao H, Lu S, et al. Genome- and transcriptome-wide association studies provide insights into the genetic basis of natural variation of seed oil content in Brassica napus. Mol Plant. 2021, 14: 470-487.