2017-03-01
該研(yan)究于(yu)2016年發(fa)表于(yu)Nature子刊《Scientific Reports》上
(最(zui)新影響因子:5.228)
研究背景:
拼接(jie)組(zu)(zu)裝(zhuang)一直(zhi)以來都(dou)是(shi)宏基(ji)(ji)因(yin)組(zu)(zu)項目中最重要(yao)的一個環節,它對后續的基(ji)(ji)因(yin)功能注釋、微生物基(ji)(ji)因(yin)組(zu)(zu)重建(jian)以及物種分(fen)類注釋都(dou)起到很大的影響。目前,Illumina平臺較(jiao)短的測序(xu)(xu)片(pian)段對宏基(ji)(ji)因(yin)組(zu)(zu)拼接(jie)結果影響較(jiao)大,而(er)三代基(ji)(ji)于PacBio的SMRT單分(fen)子實時測序(xu)(xu)技術(shu)的興起,將有望顯著提(ti)升宏基(ji)(ji)因(yin)拼接(jie)組(zu)(zu)裝(zhuang)的效(xiao)果。
研究(jiu)方法(fa):
樣(yang)本來源:沼氣反應(ying)池微生物群落
測序平臺:PacBio RS II+Illumina HiSeq
通過Hiseq和PacBio平臺(tai)的測序分(fen)析,比較兩個(ge)平臺(tai)的宏基因組(zu)組(zu)裝的效果以(yi)及(ji)物種(zhong)注釋精確(que)度。
研究結果:
Hiseq平臺產出18.5 Gb宏基因組數據用于拼接,共拼接得到3,035,577個Contigs,平均189 nt,55,633個Contigs> 1 kb,最大長度148,797 nt。而利用PacBio平臺產出的95.4 Mb數據用于拼接,共拼接出2,181 個contigs,平均長度(du)4,459 nt,最大長度65,165 nt。
采用PacBio RS II測序(xu)(xu)平(ping)臺中的P4-C2試劑(ji)盒(he),插入1.5kb片(pian)段構建文庫進行CCS測序(xu)(xu),在(zai)獲得的測序(xu)(xu)結果中,上圖(tu)為質(zhi)量(liang)分(fen)數高于99%的序(xu)(xu)列(lie)(lie)長(chang)度分(fen)布統(tong)計(ji)以及序(xu)(xu)列(lie)(lie)質(zhi)量(liang)分(fen)布統(tong)計(ji),其(qi)中共(gong)71,254條序(xu)(xu)列(lie)(lie)質(zhi)量(liang)高于99%,平(ping)均(jun)序(xu)(xu)列(lie)(lie)質(zhi)量(liang)高達99.7%。
不(bu)同測序(xu)平臺、不(bu)同拼(pin)接軟(ruan)件對宏基(ji)因組(zu)測序(xu)數據組(zu)裝拼(pin)接獲得(de)的Contig長度(du)比較。
對(dui)同一(yi)份樣(yang)本分別采用(yong)PacBio(a-b)和HiSeq(c-d)測序,運用(yong)PhyloPythiaS進行物種分類注釋,并對(dui)注釋結(jie)果(GC含量、覆蓋(gai)度(du)和Contig長(chang)度(du))進行可視化(hua)比(bi)較。由圖(tu)可見,三代PacBio平臺(tai)(tai)獲(huo)得的(de)Contigs更長(chang)更完(wan)整,二代HiSeq平臺(tai)(tai)獲(huo)得的(de)Contig碎片多得多。b圖(tu)和d圖(tu)在注釋分析(xi)時加入了(le)物種特異性的(de)訓練數據集(ji)。
對兩種不同平臺物種分類注釋結果的比較,分別基于(A)圖門水平與(B)圖種水平的物種豐度比較結果。由圖可知,在門水平,兩個平臺測序數據的物種豐度較為一致,但在種水平,不同物種的豐度差異比較明顯,尤其在加入了物種特異性的訓練數據集后,PacBio平臺對于unFirm_1與unClos_1兩個物種的豐度結果統計更加精準。
研究結論:
綜上所述,運用三(san)代(dai)PacBio測(ce)序技術,將顯著提(ti)升宏基因組(zu)數據的拼接效率和物種注釋(shi)精準度,相比二代(dai)Illumina HiSeq測(ce)序平臺,可謂是取得了質(zhi)的飛躍!
派森諾(nuo)優(you)勢
2016年,派森諾生物在原有的PacBio RS II三代高通量測序儀基礎上,率先部署最新款Sequel測序儀,并已投入使用,獨家提供三代(dai)測序分析服務,助力微生物組研究!
作為行業先鋒,派森諾生物將一如既往地行使“解析序列,詮釋(shi)生命”的理念,秉承“立足(zu)客戶需要,滿足(zu)個(ge)性需求”的服務宗旨,始終如一地提供性價比最高、最優質、最快速穩定的高通量測序和數據解析方案。
派(pai)森諾生物將竭誠為您服務(wu)!
參(can)考文獻
Frank, J. A. et al. Improved metagenome assemblies and taxonomic binning using longread
circular consensus sequence data. Sci. Rep. 6, 25373; doi: 10.1038/srep25373 (2016).
原(yuan)文鏈(lian)接: