2021-09-28
所謂選擇性(xing)清除(chu):當一個有利突變(bian)發生后,這(zhe)個突變(bian)基因的(de)適合度越高,就(jiu)越容易被選擇固(gu)定。當這(zhe)個基因被快(kuai)速固(gu)定之后,與此基因座連鎖的(de)染色(se)體(ti)區(qu)域(yu),由(you)于(yu)(yu)搭車效(xiao)應也被固(gu)定下來,大片緊密連鎖的(de)染色(se)體(ti)區(qu)域(yu)因此失去(qu)多(duo)態性(xing),這(zhe)種(zhong)由(you)于(yu)(yu)搭車效(xiao)應引(yin)起多(duo)態性(xing)下降的(de)現(xian)象,遺傳上稱為選擇清除(chu)。
下圖可以形象的展示受選擇后的結果。
圈子不同,別(bie)瞎湊(cou)合。
二、來看看都有哪些形式的選擇(ze)清除結(jie)果展示
1、FST挖掘人工馴化過程中(zhong)受選(xuan)擇(ze)的基(ji)因(yin)--74份中(zhong)國(guo)(guo)(guo)李核心(xin)種(zhong)質(zhi)可聚類為南、北(bei)、東(dong)北(bei)及國(guo)(guo)(guo)外品種(zhong)群,南方品種(zhong)群較為原始(shi),遺(yi)傳多樣性豐富,且與(yu)其他品種(zhong)群間(jian)存(cun)在基(ji)因(yin)交流,推測中(zhong)國(guo)(guo)(guo)李起(qi)源于我國(guo)(guo)(guo)南方長江流域。不同品種(zhong)群間(jian)進行選(xuan)擇(ze)壓分析,共鑒定到35個受選(xuan)擇(ze)位點,其中(zhong),開花調控、抗(kang)病抗(kang)逆及類黃酮(tong)代(dai)謝等重(zhong)要途徑(jing)關鍵基(ji)因(yin)顯著(zhu)富集,初步揭示(shi)了(le)中(zhong)國(guo)(guo)(guo)李重(zhong)要性狀(zhuang)馴化的分子基(ji)礎。
縱坐標如Fst(F_S),表示該結(jie)果是F群(qun)體與S群(qun)體間的(de)分化指數(shu)(shu),這里對FST做了(le)一個Z變換,所(suo)以(yi)數(shu)(shu)值(zhi)范圍不是[0~1],但(dan)值(zhi)越大也是分化越顯著區域(yu)。圖上可直觀看到分化指數(shu)(shu)較高的(de)位(wei)置。
2、挖掘物種適應性進化中受選擇(ze)(ze)的(de)(de)基因--野外收(shou)集到的(de)(de)各(ge)亞種間在(zai)(zai)遺傳物質上有何差異,不(bu)妨來(lai)看(kan)看(kan)借助(zhu)選擇(ze)(ze)性清除探(tan)究(jiu)“只有長江(jiang)江(jiang)豚(tun)可以在(zai)(zai)淡(dan)水(shui)中生活的(de)(de)奧秘”?
采用Sweep Finder2軟(ruan)件基(ji)于(yu)CLR(復合(he)似然比(bi)),來(lai)探測群體內的(de)選擇信(xin)號,鑒(jian)定(ding)出39 個(ge)(ge)(ge)具有(you)強選擇性(xing)掃(sao)描信(xin)號的(de) CLR 峰,寬、窄脊江(jiang)豚分別鑒(jian)定(ding)出218 個(ge)(ge)(ge)和 144 個(ge)(ge)(ge)候選基(ji)因。
為什(shen)么本(ben)文選(xuan)擇CLR來進行,原因在(zai)于(yu)常用(yong)于(yu)選(xuan)擇性清(qing)除的分析如FST適合物種內,不適合物種間、而Ka/Ks整合難度大,故(gu)本(ben)文采用(yong)了(le)優(you)化后的SFS原理(li)。如果您的樣本(ben)于(yu)此類似,不妨參考參考。
3、揭示(shi)芥(jie)菜百變形態(tai)之源--選擇性(xing)清除分析+GWAS
利用選(xuan)(xuan)擇(ze)(ze)消除分(fen)析(xi)(xi)對不同(tong)(tong)類群的(de)(de)(de)基因(yin)(yin)組(zu)選(xuan)(xuan)擇(ze)(ze)區域進(jin)行了(le)鑒定(ding),同(tong)(tong)時開展(zhan)全基因(yin)(yin)組(zu)關聯(lian)分(fen)析(xi)(xi),發(fa)現(xian)了(le)12個(ge)共同(tong)(tong)的(de)(de)(de)控制開花(hua)期(qi)(qi)候(hou)選(xuan)(xuan)基因(yin)(yin),對其中2個(ge)候(hou)選(xuan)(xuan)基因(yin)(yin)VIN3和(he)SRR1進(jin)行單倍型(xing)分(fen)析(xi)(xi),發(fa)現(xian)它們在芥(jie)菜的(de)(de)(de)傳播和(he)馴化(hua)過程中共同(tong)(tong)進(jin)化(hua),揭(jie)示了(le)芥(jie)菜在開花(hua)期(qi)(qi)上(shang)對環(huan)境的(de)(de)(de)適(shi)應。對籽用、莖用和(he)根(gen)用芥(jie)菜形態(tai)變(bian)(bian)異(yi)的(de)(de)(de)基因(yin)(yin)組(zu)選(xuan)(xuan)擇(ze)(ze)區域和(he)候(hou)選(xuan)(xuan)基因(yin)(yin)進(jin)行分(fen)析(xi)(xi),發(fa)現(xian)芥(jie)菜中適(shi)應了(le)當地光周期(qi)(qi)的(de)(de)(de)基因(yin)(yin)導致了(le)種子大小的(de)(de)(de)改變(bian)(bian),生長素信號傳導、糖轉運、細胞分(fen)裂和(he)細胞擴張等方面的(de)(de)(de)基因(yin)(yin)決定(ding)根(gen)、莖膨大。
4、XP-CLR、π、Tajima’s D多種參數(shu)結(jie)(jie)合的選擇(ze)性分析結(jie)(jie)果
栽培蘋果具有人工馴化(hua)的(de)(de)很多痕跡(ji),特別是其(qi)中的(de)(de)果實重量、硬度(du)、甜度(du)、酸度(du)等。通過(guo)XP-CLR、π、Tajima’s D相結合的(de)(de)方法定位到(dao)6號染色體上的(de)(de)包含9個(ge)基(ji)因的(de)(de)區域內。
上圖a中灰色背景點表示起源于其他野(ye)生(sheng)祖先而(er)不是來自比較的(de)基因(yin)組,綠色的(de)線為XP-CLR前1%的(de)分位數(shu)。
三、常見名詞
A、Ka/Ks
The ratio of the number of nonsynonymous substitutions per nonsynonymous site (Ka) to the number of synonymous substitutions per synonymous site (Ks)。其中:
Ks = 同義突變SNP數/同義位點數, 即同義突變率
Ka = 非同(tong)義(yi)突(tu)變SNP數/非同(tong)義(yi)位(wei)點數, 即(ji)非同(tong)義(yi)突(tu)變率
Ka/Ks >> 1,基因受正選擇(positive selection)
Ka/Ks =1,基因中性進化(neutral evolution)
Ka/Ks << 1,基因受純化(hua)選擇(purify selection)
用(yong)于(yu)計(ji)算Ka/Ks的軟件(jian):KaKs_Calculator、PAML、Hyphy、MEGA等。
B、FST
FST:遺傳分化指數,取值范圍是[0,1],最大值為1表明兩個群體完全分化,最小值為0表明群體間無分化。
在實際的研究中Fst值為0--0.05時說(shuo)明群體間遺傳分化(hua)很(hen)小,可以不做(zuo)考慮(lv);
為0.25以上的(de)時候群體(ti)間就存在很大(da)的(de)遺傳分化了(le).
C、π:表(biao)示核苷(gan)酸(suan)多態性,受選擇程度(du)越高(gao),多態性越低(di)。
D、Tajima’D:在標準中性進化(hua)模(mo)型(xing)下(xia),Tajima's D的理論值為(wei)零(ling)。
如果Tajima's D>0,表(biao)明存在大量的(de)中等頻率的(de)等位基因,這可能是由于群體(ti)瓶頸效應,群體(ti)結構,或(huo)者平衡選(xuan)擇引(yin)起(qi)的(de)。
如果Tajima's D< 0,表(biao)(biao)明存在大量的低頻等位基因位點。Tajima's D分析表(biao)(biao)示中性進化,越偏離0,受(shou)選擇程度越高。
E、XP-CLR :全稱是(shi)(shi) the cross-population composite likelihood ratio test(跨群體復(fu)合似(si)然(ran)比(bi)檢(jian)驗),是(shi)(shi)一種是(shi)(shi)基于選(xuan)擇(ze)(ze)清除(selective sweep)的似(si)然(ran)方法。XP-CLR 利用了兩(liang)個群體之間的多基因座等位基因頻率(lv)差異(multilocus allele frequency differentiation)建立模型,使用布朗(lang)運動來模擬(ni)中性(xing)(xing)下的遺傳漂移,并(bing)使用確定性(xing)(xing)模型來近似(si)地對(dui)附近的單核苷酸(suan)多態性(xing)(xing)(SNPs)進行選(xuan)擇(ze)(ze)性(xing)(xing)掃描。
四、總結
春花秋月、滄海桑(sang)田,我們(men)(men)身(shen)邊豐富的(de)(de)物(wu)種都經歷了從野生祖先種到地方種的(de)(de)馴(xun)(xun)化過(guo)(guo)程,再經過(guo)(guo)近(jin)代育種家的(de)(de)不(bu)斷改良,提高其產量,改良其食味、品質和(he)株(zhu)型或者物(wu)種為(wei)生存,適應環境,不(bu)斷自我修煉;相(xiang)比于(yu)漫長的(de)(de)馴(xun)(xun)化過(guo)(guo)程,作物(wu)改良在短(duan)短(duan)幾十年間取得的(de)(de)成(cheng)就(jiu)大(da)大(da)超越以前的(de)(de)積累,這是(shi)一個(ge)奇妙的(de)(de)過(guo)(guo)程。而(er)通過(guo)(guo)選擇(ze)性清(qing)除分析揭示這個(ge)過(guo)(guo)程中(zhong)物(wu)種經歷的(de)(de)變化是(shi)科(ke)學家們(men)(men)感(gan)興趣的(de)(de)科(ke)學問題。
更多(duo)技術資訊,請關注派(pai)森諾(nuo)官網(wang)