国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

BSA問答——進階篇

2020-11-10

Q1:BSA項(xiang)目有(you)哪些主要的分析(xi)方法?

A1:現(xian)在運用(yong)的最主要的三(san)種分析方法如(ru)下:

1、ED值,適(shi)用(yong)于親本(ben)數據遺失,僅(jin)有兩個極(ji)端(duan)混(hun)池的BSA項目(mu),也(ye)可以用(yong)于高(gao)雜合度林(lin)木(mu)類F1代極(ji)端(duan)混(hun)池的BSA項目(mu);

2、snp-index法,該(gai)分析的使用必(bi)須有親本的數據,適用于2個(ge)(ge)親本和(he)2個(ge)(ge)極端混池的項目;

3、GPS法(fa),該方(fang)法(fa)主要針對(dui)的是(shi)多個混池(chi)的項目(mu)(一般2~4個混池(chi)),有無親(qin)本(ben)的數據均(jun)可。


Q2:BSA項目的閾值如何(he)設定?

A2:先匯總下BSA主要(yao)的(de)閾值選擇標準:

1、通過10000(或者(zhe)1000)次(ci)的模擬后(hou)選擇90%,95%和99%的置信區間的SNP-index值;

2、99%或者95%的分位(wei)數,或者所(suo)有SNP位(wei)點SNP-index 的平均值+3標準差;

3、根據分(fen)離(li)群體的(de)遺(yi)傳分(fen)離(li)比確(que)定閾(yu)值(zhi)(zhi)(如F2代(dai)種群分(fen)離(li)比為(wei)3:1,一般閾(yu)值(zhi)(zhi)線設(she)定為(wei)0.67);

4、ED算法中的閾值(zhi)(ED算法閾值(zhi)眾多(duo):有(you)平(ping)均值(zhi)+3X標準差,有(you)ED4>0.1,也有(you)ED5 的99%分位數等)。


Q3: 測序數據與參考基因(yin)組比對率低,可能是什么原因(yin)導(dao)致的?

A3:1、參考序列(lie)質(zhi)量(liang):參考基因(yin)組組裝質(zhi)量(liang)差,錯誤率(lv)高,比對率(lv)就會(hui)低。

2、所測物(wu)種與參考(kao)基(ji)因(yin)組的親緣(yuan)關系(xi)較遠,基(ji)因(yin)組差(cha)異(yi)較大。這時(shi)可將未比對到參考(kao)基(ji)因(yin)組的reads進(jin)行局(ju)部組裝(zhuang)后(hou)獲得新的參考(kao)基(ji)因(yin)組,再在兩個(ge)池間比對鑒定變(bian)異(yi),進(jin)行相關性分析。

3、樣品的雜合度(du)高,重復序列多:基因組復雜度(du)較高,比對分析受到的影響也越大。

4、存在外源(yuan)污染(ran):如個別(bie)微小昆蟲提取的(de)(de)DNA中,很可能包含植物(wu)、共生菌(jun)、病原體等的(de)(de)基(ji)因組(zu),導致比對(dui)率較低。


Q4:某區域測序深度過(guo)高(gao)會對后(hou)續分析產(chan)生(sheng)什么影響?

A4:某(mou)區(qu)域(yu)(yu)測(ce)(ce)序(xu)深度(du)過高,可能是存在(zai)多拷貝的重復序(xu)列,這種情況下檢(jian)(jian)測(ce)(ce)出的SNP是不可靠的。測(ce)(ce)序(xu)深度(du)提高,覆蓋度(du)也會(hui)上(shang)升,當(dang)測(ce)(ce)序(xu)深度(du)達(da)到15X,覆蓋度(du)基本上(shang)飽(bao)和,測(ce)(ce)序(xu)深度(du)達(da)到30X,SNP檢(jian)(jian)測(ce)(ce)檢(jian)(jian)出率(lv)達(da)到飽(bao)和。個別區(qu)域(yu)(yu)測(ce)(ce)序(xu)深度(du)過高,會(hui)導致SNP檢(jian)(jian)測(ce)(ce)錯誤率(lv)增加,分析過程中將(jiang)會(hui)刪除此類(lei)SNP。


Q5: 結果(guo)中0/0、1/1、0/1及./.分別代表什么(me)含(han)義(yi)?

A5: 這幾種(zhong)均為樣(yang)(yang)品的(de)基(ji)(ji)因(yin)型(genotype)。兩(liang)個(ge)數(shu)字中(zhong)(zhong)間用“/”分開,這兩(liang)個(ge)數(shu)字表示(shi)雙(shuang)倍體的(de)sample的(de)基(ji)(ji)因(yin)型。0 表示(shi)樣(yang)(yang)品中(zhong)(zhong)有ref的(de)allele;1 表示(shi)樣(yang)(yang)品中(zhong)(zhong)variant的(de)allele。因(yin)此:0/0 表示(shi)sample中(zhong)(zhong)該(gai)位點(dian)為純(chun)合的(de),和(he)ref一致;0/1 表示(shi)sample中(zhong)(zhong)該(gai)位點(dian)為雜合的(de),有ref和(he)variant兩(liang)個(ge)基(ji)(ji)因(yin)型;1/1 表示(shi)sample中(zhong)(zhong)該(gai)位點(dian)為純(chun)合的(de),和(he)variant一致。


Q6:定位(wei)效果不理想可能是(shi)什(shen)么(me)原因導(dao)致(zhi)的?

A6:導致(zhi)定(ding)位不理想的因素很多,主要有(you)以下幾點:

1、親本間遺傳(chuan)背景差異(yi)(yi)大(da),除了目(mu)標性(xing)狀外,還有(you)很多其他差異(yi)(yi),這樣對分析產生的干擾很大(da),難以定(ding)位;

2、性(xing)(xing)狀統計復雜,目標性(xing)(xing)狀可(ke)能是由多個簡單性(xing)(xing)狀構成,可(ke)以拆分性(xing)(xing)狀,重新定(ding)位(wei),另外數量性(xing)(xing)狀本(ben)身也定(ding)位(wei)難度(du)較(jiao)高,有一定(ding)不可(ke)控性(xing)(xing);

3、測序數據(ju)有污(wu)染,可以(yi)通過抽(chou)取部分測序數據(ju)在nr庫里做blast比對(dui),檢(jian)查(cha)比對(dui)結果;

4、 分(fen)析方法(fa)不適用,可以分(fen)別用ED法(fa)和snp-index法(fa)進行定位,比較定位結果。


Q7:準確(que)的性(xing)狀顯隱(yin)性(xing)判定,性(xing)狀分離比(bi),混池(chi)樣本數目對分析有什(shen)么影響?

A7:群體構建后(hou),一般先統計群體的性(xing)狀分(fen)離比(bi),主要作用(yong)是(shi)判斷該(gai)性(xing)狀是(shi)否(fou)滿足(zu)孟德(de)爾遺(yi)傳定律,是(shi)否(fou)適(shi)用(yong)于(yu)分(fen)析模型并對位(wei)點的基因型進行(xing)判定;混池樣本數(shu)目(mu)主要是(shi)在(zai)進行(xing)snp-index計算時,是(shi)置信區間檢(jian)驗(yan)的其中一個參數(shu),混池數(shu)目(mu)越(yue)(yue)多,最(zui)終模擬得到的閾(yu)值線(xian)越(yue)(yue)準確。


Q8:混(hun)池數目和測(ce)序深度對分析(xi)有什么影響?

A8:在《User guide for mapping-by-sequencing in Arabidopsis》中,作者對混池個(ge)(ge)體(ti)數(shu)(shu)以(yi)及測(ce)序(xu)(xu)深(shen)(shen)度(du)(du)對候選基因數(shu)(shu)量(liang)的(de)(de)(de)影(ying)響(xiang)進行(xing)了評估。結果顯(xian)示,當子代個(ge)(ge)數(shu)(shu)超(chao)過30個(ge)(ge),測(ce)序(xu)(xu)深(shen)(shen)度(du)(du)大于30X之后,定位出候選基因的(de)(de)(de)數(shu)(shu)量(liang)趨于穩定。同時(shi)基于多篇(pian)文獻的(de)(de)(de)報導(dao),推薦個(ge)(ge)體(ti)數(shu)(shu)≥30個(ge)(ge)/池,測(ce)序(xu)(xu)深(shen)(shen)度(du)(du):每(mei)個(ge)(ge)親本≥20X,每(mei)個(ge)(ge)子代池≥30X。


Q9:看分析結果(guo)時(shi)應(ying)該(gai)關注哪些(xie)信息?

A9:1、定位(wei)區(qu)間(jian)(jian)的大(da)(da)小,當定位(wei)區(qu)間(jian)(jian)過大(da)(da)時,可(ke)(ke)以(yi)在BSA定位(wei)區(qu)間(jian)(jian)內找(zhao)些SSR、SNP或者InDel標(biao)記,進行局部作圖,可(ke)(ke)以(yi)有效的縮(suo)小定位(wei)區(qu)間(jian)(jian)。

2、關(guan)(guan)注定位(wei)區間內snp-index為(wei)1的位(wei)點(dian),這些位(wei)點(dian)在兩個極端混池中呈現性狀關(guan)(guan)聯(lian);

3、關注定位(wei)(wei)區(qu)間內發(fa)生非同義突變(bian)的位(wei)(wei)點(dian),氨(an)基(ji)酸的突變(bian)可能(neng)導致所在基(ji)因功能(neng)的變(bian)化;

4、關(guan)注定(ding)位(wei)區間內注釋為終止密碼子的位(wei)點(dian),提(ti)前產(chan)生終止密碼子,可能(neng)導致蛋白功(gong)能(neng)性質的改變;

5、關(guan)注定位(wei)區(qu)(qu)間(jian)上(shang)下(xia)游區(qu)(qu)域(yu)的突變,因(yin)為候(hou)選(xuan)區(qu)(qu)間(jian)的產生與分(fen)析時(shi)所選(xuan)取的各種參數有關(guan),在找(zhao)不到合適的位(wei)點時(shi),可以(yi)往候(hou)選(xuan)區(qu)(qu)間(jian)上(shang)下(xia)游區(qu)(qu)域(yu)進行查找(zhao)。


Q10:定(ding)位(wei)(wei)不到(dao)區(qu)間或定(ding)位(wei)(wei)效果(guo)差的可(ke)能原因有哪些?

A10:1、表型鑒定(ding)出(chu)現錯誤或偏差,性(xing)狀本身由(you)于易受(shou)環境影(ying)響,導(dao)致鑒定(ding)不(bu)準確,影(ying)響混池效果(guo);

2、子代群體數量過少,混池(chi)單株數過少,影響(xiang)最后定(ding)位效(xiao)果;

3、選取的材料性狀不夠(gou)極端(duan),使得最后(hou)定位區間較(jiao)大;

4、沒(mei)有測親本(ben)序列,直接用研究物種(zhong)參(can)考基因(yin)組(zu),親緣關系遠,出(chu)現(xian)大(da)量假陽性(xing);

5、研究(jiu)物種或品系為高雜合,DNA池中存在(zai)多種基(ji)因型,導致SNP檢測和基(ji)因型頻率計算可(ke)靠性降低;

6、研(yan)究(jiu)的數量性狀由(you)微效多(duo)基因控制,會(hui)導致出現多(duo)個△SNP-index相似(si)的區(qu)間。