<bdo id='ZQSPs'><sup id='YJVwZ'><div id='kGccS'><bdo id='juilX'></bdo></div></sup></bdo>

關于我們

BSA問答——進階篇

2020-11-10

Q1：BSA項(xiang)目有(you)哪些主要的分析(xi)方法？

A1：現(xian)在運用(yong)的最主要的三(san)種分析方法如(ru)下：

1、ED值，適(shi)用(yong)于親本(ben)數據遺失，僅(jin)有兩個極(ji)端(duan)混(hun)池的BSA項目(mu)，也(ye)可以用(yong)于高(gao)雜合度林(lin)木(mu)類F1代極(ji)端(duan)混(hun)池的BSA項目(mu)；

2、snp-index法，該(gai)分析的使用必(bi)須有親本的數據，適用于2個(ge)(ge)親本和(he)2個(ge)(ge)極端混池的項目；

3、GPS法(fa)，該方(fang)法(fa)主要針對(dui)的是(shi)多個混池(chi)的項目(mu)（一般2~4個混池(chi)），有無親(qin)本(ben)的數據均(jun)可。

Q2：BSA項目的閾值如何(he)設定？

A2：先匯總下BSA主要(yao)的(de)閾值選擇標準：

1、通過10000（或者(zhe)1000）次(ci)的模擬后(hou)選擇90%，95%和99%的置信區間的SNP-index值；

2、99%或者95%的分位(wei)數，或者所(suo)有SNP位(wei)點SNP-index 的平均值+3標準差；

3、根據分(fen)離(li)群體的(de)遺(yi)傳分(fen)離(li)比確(que)定閾(yu)值(zhi)(zhi)（如F2代(dai)種群分(fen)離(li)比為(wei)3:1，一般閾(yu)值(zhi)(zhi)線設(she)定為(wei)0.67）；

4、ED算法中的閾值(zhi)（ED算法閾值(zhi)眾多(duo)：有(you)平(ping)均值(zhi)+3X標準差，有(you)ED4＞0.1，也有(you)ED5 的99%分位數等）。

Q3: 測序數據與參考基因(yin)組比對率低，可能是什么原因(yin)導(dao)致的？

A3：1、參考序列(lie)質(zhi)量(liang)：參考基因(yin)組組裝質(zhi)量(liang)差，錯誤率(lv)高，比對率(lv)就會(hui)低。

2、所測物(wu)種與參考(kao)基(ji)因(yin)組的親緣(yuan)關系(xi)較遠，基(ji)因(yin)組差(cha)異(yi)較大。這時(shi)可將未比對到參考(kao)基(ji)因(yin)組的reads進(jin)行局(ju)部組裝(zhuang)后(hou)獲得新的參考(kao)基(ji)因(yin)組，再在兩個(ge)池間比對鑒定變(bian)異(yi)，進(jin)行相關性分析。

3、樣品的雜合度(du)高，重復序列多：基因組復雜度(du)較高，比對分析受到的影響也越大。

4、存在外源(yuan)污染(ran)：如個別(bie)微小昆蟲提取的(de)(de)DNA中，很可能包含植物(wu)、共生菌(jun)、病原體等的(de)(de)基(ji)因組(zu)，導致比對(dui)率較低。

Q4：某區域測序深度過(guo)高(gao)會對后(hou)續分析產(chan)生(sheng)什么影響？

A4：某(mou)區(qu)域(yu)(yu)測(ce)(ce)序(xu)深度(du)過高，可能是存在(zai)多拷貝的重復序(xu)列，這種情況下檢(jian)(jian)測(ce)(ce)出的SNP是不可靠的。測(ce)(ce)序(xu)深度(du)提高，覆蓋度(du)也會(hui)上(shang)升，當(dang)測(ce)(ce)序(xu)深度(du)達(da)到15X，覆蓋度(du)基本上(shang)飽(bao)和，測(ce)(ce)序(xu)深度(du)達(da)到30X，SNP檢(jian)(jian)測(ce)(ce)檢(jian)(jian)出率(lv)達(da)到飽(bao)和。個別區(qu)域(yu)(yu)測(ce)(ce)序(xu)深度(du)過高，會(hui)導致SNP檢(jian)(jian)測(ce)(ce)錯誤率(lv)增加，分析過程中將(jiang)會(hui)刪除此類(lei)SNP。

Q5: 結果(guo)中0/0、1/1、0/1及./.分別代表什么(me)含(han)義(yi)？

A5：這幾種(zhong)均為樣(yang)(yang)品的(de)基(ji)(ji)因(yin)型（genotype）。兩(liang)個(ge)數(shu)字中(zhong)(zhong)間用“/”分開，這兩(liang)個(ge)數(shu)字表示(shi)雙(shuang)倍體的(de)sample的(de)基(ji)(ji)因(yin)型。0 表示(shi)樣(yang)(yang)品中(zhong)(zhong)有ref的(de)allele；1 表示(shi)樣(yang)(yang)品中(zhong)(zhong)variant的(de)allele。因(yin)此：0/0 表示(shi)sample中(zhong)(zhong)該(gai)位點(dian)為純(chun)合的(de)，和(he)ref一致；0/1 表示(shi)sample中(zhong)(zhong)該(gai)位點(dian)為雜合的(de)，有ref和(he)variant兩(liang)個(ge)基(ji)(ji)因(yin)型；1/1 表示(shi)sample中(zhong)(zhong)該(gai)位點(dian)為純(chun)合的(de)，和(he)variant一致。

Q6：定位(wei)效果不理想可能是(shi)什(shen)么(me)原因導(dao)致(zhi)的？

A6：導致(zhi)定(ding)位不理想的因素很多，主要有(you)以下幾點：

1、親本間遺傳(chuan)背景差異(yi)(yi)大(da)，除了目(mu)標性(xing)狀外，還有(you)很多其他差異(yi)(yi)，這樣對分析產生的干擾很大(da)，難以定(ding)位；

2、性(xing)(xing)狀統計復雜，目標性(xing)(xing)狀可(ke)能是由多個簡單性(xing)(xing)狀構成，可(ke)以拆分性(xing)(xing)狀，重新定(ding)位(wei)，另外數量性(xing)(xing)狀本(ben)身也定(ding)位(wei)難度(du)較(jiao)高，有一定(ding)不可(ke)控性(xing)(xing)；

3、測序數據(ju)有污(wu)染，可以(yi)通過抽(chou)取部分測序數據(ju)在nr庫里做blast比對(dui)，檢(jian)查(cha)比對(dui)結果；

4、分(fen)析方法(fa)不適用，可以分(fen)別用ED法(fa)和snp-index法(fa)進行定位，比較定位結果。

Q7:準確(que)的性(xing)狀顯隱(yin)性(xing)判定，性(xing)狀分離比(bi)，混池(chi)樣本數目對分析有什(shen)么影響?

A7：群體構建后(hou)，一般先統計群體的性(xing)狀分(fen)離比(bi)，主要作用(yong)是(shi)判斷該(gai)性(xing)狀是(shi)否(fou)滿足(zu)孟德(de)爾遺(yi)傳定律，是(shi)否(fou)適(shi)用(yong)于(yu)分(fen)析模型并對位(wei)點的基因型進行(xing)判定；混池樣本數(shu)目(mu)主要是(shi)在(zai)進行(xing)snp-index計算時，是(shi)置信區間檢(jian)驗(yan)的其中一個參數(shu)，混池數(shu)目(mu)越(yue)(yue)多，最(zui)終模擬得到的閾(yu)值線(xian)越(yue)(yue)準確。

Q8：混(hun)池數目和測(ce)序深度對分析(xi)有什么影響？

A8：在《User guide for mapping-by-sequencing in Arabidopsis》中，作者對混池個(ge)(ge)體(ti)數(shu)(shu)以(yi)及測(ce)序(xu)(xu)深(shen)(shen)度(du)(du)對候選基因數(shu)(shu)量(liang)的(de)(de)(de)影(ying)響(xiang)進行(xing)了評估。結果顯(xian)示，當子代個(ge)(ge)數(shu)(shu)超(chao)過30個(ge)(ge)，測(ce)序(xu)(xu)深(shen)(shen)度(du)(du)大于30X之后，定位出候選基因的(de)(de)(de)數(shu)(shu)量(liang)趨于穩定。同時(shi)基于多篇(pian)文獻的(de)(de)(de)報導(dao)，推薦個(ge)(ge)體(ti)數(shu)(shu)≥30個(ge)(ge)/池，測(ce)序(xu)(xu)深(shen)(shen)度(du)(du)：每(mei)個(ge)(ge)親本≥20X，每(mei)個(ge)(ge)子代池≥30X。

Q9:看分析結果(guo)時(shi)應(ying)該(gai)關注哪些(xie)信息？

A9：1、定位(wei)區(qu)間(jian)(jian)的大(da)(da)小，當定位(wei)區(qu)間(jian)(jian)過大(da)(da)時，可(ke)(ke)以(yi)在BSA定位(wei)區(qu)間(jian)(jian)內找(zhao)些SSR、SNP或者InDel標(biao)記，進行局部作圖，可(ke)(ke)以(yi)有效的縮(suo)小定位(wei)區(qu)間(jian)(jian)。

2、關(guan)(guan)注定位(wei)區間內snp-index為(wei)1的位(wei)點(dian)，這些位(wei)點(dian)在兩個極端混池中呈現性狀關(guan)(guan)聯(lian)；

3、關注定位(wei)(wei)區(qu)間內發(fa)生非同義突變(bian)的位(wei)(wei)點(dian)，氨(an)基(ji)酸的突變(bian)可能(neng)導致所在基(ji)因功能(neng)的變(bian)化；

4、關(guan)注定(ding)位(wei)區間內注釋為終止密碼子的位(wei)點(dian)，提(ti)前產(chan)生終止密碼子，可能(neng)導致蛋白功(gong)能(neng)性質的改變；

5、關(guan)注定位(wei)區(qu)(qu)間(jian)上(shang)下(xia)游區(qu)(qu)域(yu)的突變，因(yin)為候(hou)選(xuan)區(qu)(qu)間(jian)的產生與分(fen)析時(shi)所選(xuan)取的各種參數有關(guan)，在找(zhao)不到合適的位(wei)點時(shi)，可以(yi)往候(hou)選(xuan)區(qu)(qu)間(jian)上(shang)下(xia)游區(qu)(qu)域(yu)進行查找(zhao)。

Q10：定(ding)位(wei)(wei)不到(dao)區(qu)間或定(ding)位(wei)(wei)效果(guo)差的可(ke)能原因有哪些？

A10：1、表型鑒定(ding)出(chu)現錯誤或偏差，性(xing)狀本身由(you)于易受(shou)環境影(ying)響，導(dao)致鑒定(ding)不(bu)準確，影(ying)響混池效果(guo)；

2、子代群體數量過少，混池(chi)單株數過少，影響(xiang)最后定(ding)位效(xiao)果；

3、選取的材料性狀不夠(gou)極端(duan)，使得最后(hou)定位區間較(jiao)大；

4、沒(mei)有測親本(ben)序列，直接用研究物種(zhong)參(can)考基因(yin)組(zu)，親緣關系遠，出(chu)現(xian)大(da)量假陽性(xing)；

5、研究(jiu)物種或品系為高雜合，DNA池中存在(zai)多種基(ji)因型，導致SNP檢測和基(ji)因型頻率計算可(ke)靠性降低；

6、研(yan)究(jiu)的數量性狀由(you)微效多(duo)基因控制，會(hui)導致出現多(duo)個△SNP-index相似(si)的區(qu)間。

国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

轉錄組

單細胞組

蛋白組

表觀基因組學

代謝組

微生物組

微生物基因組

動植物基因組

人基因組

三代測序服務

常規分子實驗

常規測序與合成

微生物采樣工具

婦幼健康

腫瘤早篩

新型冠狀病毒核酸檢測

NGS測序平臺

單細胞空轉平臺

質譜平臺

成果展示

最新資訊

培訓課程

公司概況

專家團隊

榮譽資質

新聞中心

聯系我們

加入我們