2016-09-08
通過之前小編對三代全長轉錄組測序的專題介紹(終(zhong)于等到你......三代全長準路(lu)阻測序技術原理篇(pian)/三代測序將(jiang)為轉錄組研究者(zhe)帶(dai)來(lai)哪些驚喜(xi)),各位“諾米”們應該也了(le)解(jie)到,利用(yong)三代(dai)基因測(ce)序平(ping)臺(tai)PacBio RSII/Sequel系(xi)統能獲得mRNA全(quan)長,更為精準地解(jie)讀mRNA的結構(gou)信息。可(ke)實現同源異構(gou)體分(fen)析,單堿基變異檢測(ce),可(ke)變剪(jian)接分(fen)析,檢測(ce)融合(he)基因,等位基因識別等。
可能“諾米”們會質(zhi)疑,為(wei)何我們單頁里要(yao)專門(men)強調分(fen)段建庫呢?那是因為(wei)基于PacBio平臺的(de)(de)(de)測序(xu)(xu)(xu)原理,構(gou)建好的(de)(de)(de)全長(chang)文(wen)(wen)(wen)庫要(yao)loading到測序(xu)(xu)(xu)小孔——零模波導(dao)孔(ZMWs),由于mRNA長(chang)度(du)(du)不同,在loading的(de)(de)(de)過程(cheng)中(zhong)會產生loading bias,即測序(xu)(xu)(xu)小孔會優先被(bei)長(chang)度(du)(du)較(jiao)短的(de)(de)(de)片(pian)段占據,每個(ge)測序(xu)(xu)(xu)小孔只(zhi)能容納一個(ge)文(wen)(wen)(wen)庫分(fen)子,而大部分(fen)長(chang)片(pian)段則會“無家(jia)可歸”。因此為(wei)盡(jin)量降(jiang)低loading bias的(de)(de)(de)影響,需要(yao)根據測序(xu)(xu)(xu)物種mRNA的(de)(de)(de)長(chang)度(du)(du)進行分(fen)段,使(shi)一個(ge)文(wen)(wen)(wen)庫中(zhong)的(de)(de)(de)序(xu)(xu)(xu)列長(chang)度(du)(du)控(kong)制在一個(ge)較(jiao)窄的(de)(de)(de)范圍(wei)內。
通(tong)過(guo)小編(bian)的講解,“諾米(mi)”們是否茅塞頓開呢!而關于文(wen)庫方(fang)案的選擇,小編(bian)根(gen)據已(yi)有的一些(xie)文(wen)獻(xian)做了(le)整理以供參考:
可見對于文庫的分段方式,并不是(shi)固定的。
文庫的數量和(he)分段的形式可根(gen)據實際情況進行選擇和(he)優化,主要考慮如下(xia)因素:
物種轉錄(lu)本的長度分布(bu);
所關注的mRNA長度范(fan)圍;
mRNA的覆蓋度(du)需求。
如需更好(hao)的(de)實現mRNA的(de)均勻覆蓋(gai),在(zai)保證測序數據(ju)量(liang)的(de)同時(shi),最好(hao)盡可能多的(de)構建文(wen)庫。而關于數據(ju)量(liang)的(de)要求,將在(zai)下(xia)期(qi)跟各位“諾米”討(tao)論,敬請期(qi)待!
參考文獻:
1. Minoche A et al., Exploiting single-molecule transcript sequencing for eukaryotic gene prediction. Genome Biology (2015) 16:184
2. Abdel-Ghany S et al., A survey of the sorghum transcriptome using single-molecule long reads. Nature Communications (2016) 7:11706
3. Wang B et al., Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing. Nature Communications (2016) 7:11708