2016-11-01
很多時候,我們更希望知道菌群行使的具體功能,也就是解釋“它們在干什么?”。對菌(jun)群進行(xing)宏基因組測(ce)序自然是(shi)解決方(fang)(fang)案,但如此高大上的研究方(fang)(fang)法(fa),投(tou)入成本相對較多(duo),分析方(fang)(fang)法(fa)也相對復(fu)雜。如果僅(jin)僅(jin)知道菌(jun)群組成,該怎么把物種的“身份”和它的“功能”對應起來呢?
由此,一款名為PICRUSt的菌群代謝功能預測利器應運而生,相關論文發表在權威期刊《Nature Biotechnology》上[1]。PICRUSt全稱為“Phylogenetic Investigation of Communities by Reconstruction of Unobserved States”,可以通過16S rRNA基因序列,預測對應的細菌和古(gu)菌的代(dai)謝功(gong)能譜。
有(you)了(le)PICRUSt,相當(dang)于在菌群的“組成”和“功能”之間搭起了(le)一(yi)(yi)座橋,即使只有(you)16S rRNA基(ji)因的測序結(jie)(jie)果(guo),我(wo)們一(yi)(yi)樣可以獲得宏(hong)基(ji)因組級(ji)別的研究結(jie)(jie)果(guo)!
1 PICRUSt的基本原理
PICRUSt的(de)總體思路說來很簡單,主要分為3步:
1. 先(xian)根據已測微生物基(ji)(ji)因(yin)組的(de)16S rRNA基(ji)(ji)因(yin)全長(chang)序(xu)列(lie),推斷它們的(de)共同(tong)祖(zu)先(xian)的(de)基(ji)(ji)因(yin)功能譜;
2. 對Greengenes數(shu)據庫中其它未(wei)測(ce)物(wu)種的基因(yin)功能(neng)譜(pu)(pu)進行推斷(duan),構建(jian)古菌和細菌域全(quan)譜(pu)(pu)系的基因(yin)功能(neng)預測(ce)譜(pu)(pu);
3. 最后,將(jiang)測序(xu)得到(dao)的菌(jun)群組成“映(ying)射”到(dao)數據庫(ku)中(zhong),對菌(jun)群代謝功能進行預測。該步驟具體通(tong)過以(yi)下方式實現:
i. 對測序獲得的16S rRNA基因序列,進行“封閉式”參考OTU劃分(Closed-reference OTU picking),通過與Greengenes數(shu)據庫比對,尋找每一條(tiao)測序(xu)(xu)序(xu)(xu)列(lie)的“參考序(xu)(xu)列(lie)最近(jin)鄰居(ju)”,并歸為參考OTU;
ii. 根據“參考序列(lie)最(zui)近(jin)鄰居”的(de)rRNA基因拷(kao)貝(bei)數,對獲得的(de)OTU豐度(du)矩(ju)陣進行校正;
iii. 根(gen)據“參(can)考序列最(zui)近鄰居”對應的KEGG/EggNOG等(deng)基因功能譜數(shu)據,換(huan)算預測(ce)菌群的整體代謝(xie)功能。
PICRUSt分析的基本流程圖示【1】
2 PICRUSt的特點
PICRUSt算法的一大特點,就是基于Greengenes的16S rRNA基因全長序列數據庫,對菌群測序結果進行“封閉式”參考OTU劃分。PICRUSt開發者對古菌和細菌域的大多數模式微生物的功能進行預測,讓人欣喜的是,絕大多數的微生物預測結果與真實的基因功能譜非常接近(古菌預測精確度為0.94 ± 0.04,n = 103;細菌為0.95 ± 0.05,n = 2487)。也就是說,絕大(da)多(duo)數情況下(xia),PICRUSt的預測效果還是相當(dang)靠譜滴!
PICRUSt對細菌/古菌基因組預測的精確度
當然,若測序序列與Greengenes數(shu)據庫中沒有(you)同源物種的(de)(de)(de)參考(kao)序列,則對應的(de)(de)(de)物種將無法被預(yu)測。也(ye)就(jiu)是(shi)說,原始數(shu)據在(zai)分析過(guo)程中會有(you)一(yi)定損失(shi)。此外,PICRUSt的(de)(de)(de)特點(dian)也(ye)表(biao)明,它只能(neng)對已知(zhi)微生物的(de)(de)(de)已知(zhi)功能(neng)進行功能(neng)預(yu)測,所以目前并不能(neng)完全代替宏基因組(zu)研究,但可以看作(zuo)宏基因組(zu)研究的(de)(de)(de)“近似”結果,在(zai)經(jing)費、資(zi)源有(you)限的(de)(de)(de)情況下,不失(shi)為一(yi)種理想的(de)(de)(de)選擇。
3 PICRUSt的應用
在小編看來,PICRUSt對于菌群研究的貢獻大大滴!首先,PICRUSt能從菌群組成數據解讀潛在的功能,可謂充分發揮了16S rRNA基因測序簡單、快速、物美價廉的優勢;其次,PICRUSt對菌群功能的預測,可以幫助指導后續宏基因組De novo鳥(niao)槍法測(ce)序的(de)實驗設計,更合理地(di)篩選(xuan)用于后續研究的(de)樣本。
同時,PICRUSt分(fen)析(xi)的(de)操(cao)作相當便(bian)捷,只需對測序數據進行“封閉式(shi)”參考OTU劃分(fen),并將得到的(de)OTU豐度矩陣上傳至Galaxy在(zai)線(xian)分(fen)析(xi)平臺(tai)(),按提示(shi)操(cao)作就能得到預測結果(guo)啦!
PICRUSt在線分析平臺
4 16S+PICRUSt,研究新趨勢
PICRUSt這(zhe)一(yi)方法(fa)橫空出世后,已有越(yue)來越(yue)多的(de)研究開始采(cai)用這(zhe)一(yi)方法(fa)預測菌群組成數據(ju),相關論(lun)文(wen)發(fa)表數量(liang)逐年增長,表明該方法(fa)已得到(dao)大(da)家廣泛的(de)認可。16S+PICRUSt,已成為發(fa)表高水(shui)平(ping)論(lun)文(wen)的(de)技(ji)能(neng);同時與宏基(ji)因組分析相比(bi),更(geng)方便快捷,成本也更(geng)低,何樂而不(bu)為!
采用PICRUSt方法的菌群研究文獻逐年增長
比(bi)如,今年發表在(zai)微生態學旗艦期刊《The ISME Journal》(影響(xiang)因(yin)子9.328)的一(yi)篇論文(wen)《Cigarette smoking and the oral microbiome in a large study of American adults》[2]中,作者就通過(guo)PICRUSt預(yu)測了吸(xi)煙人(ren)(ren)群(qun)和(he)未吸(xi)煙人(ren)(ren)群(qun)的口腔菌(jun)群(qun),發現共(gong)有(you)83個(ge)基因(yin)功能代謝(xie)(xie)通路存在(zai)顯著差異,吸(xi)煙大大降低了碳水化合物和(he)能量(liang)代謝(xie)(xie)、異型(xing)生物質降解等代謝(xie)(xie)通路的含量(liang)。
PICRUSt對吸煙人群口腔菌群的功能預測[2]
結語
經過(guo)上(shang)面的(de)(de)講解,大(da)家是(shi)(shi)(shi)不(bu)是(shi)(shi)(shi)感(gan)受到了(le)PICRUSt預(yu)測(ce)菌(jun)(jun)群功(gong)(gong)能(neng)(neng)的(de)(de)強大(da)威(wei)力了(le)呢?小編在這(zhe)里(li)想說,PICRUSt雖然厲害,但(dan)(dan)并不(bu)是(shi)(shi)(shi)萬能(neng)(neng),一(yi)方面由于(yu)(yu)它(ta)是(shi)(shi)(shi)基于(yu)(yu)16S rRNA基因的(de)(de)參(can)考序列庫(ku),因此尚無法對(dui)(dui)真菌(jun)(jun)群落(luo)進行功(gong)(gong)能(neng)(neng)預(yu)測(ce),而(er)預(yu)測(ce)過(guo)程也(ye)會造成(cheng)原始數(shu)據的(de)(de)部分損失,對(dui)(dui)于(yu)(yu)不(bu)同來源的(de)(de)菌(jun)(jun)群的(de)(de)預(yu)測(ce)效(xiao)果也(ye)有所(suo)差異(一(yi)般(ban)對(dui)(dui)于(yu)(yu)人源微生(sheng)物組(zu)的(de)(de)預(yu)測(ce)效(xiao)果最好);同時,它(ta)并不(bu)能(neng)(neng)完全代替宏基因組(zu)研究(目前只能(neng)(neng)對(dui)(dui)已知微生(sheng)物的(de)(de)已知功(gong)(gong)能(neng)(neng)進行功(gong)(gong)能(neng)(neng)預(yu)測(ce)),但(dan)(dan)可(ke)以對(dui)(dui)后續實驗設計作出(chu)指導。
參考文獻
1. Langille MGI, Zaneveld J, Caporaso JG, McDonald D, Knights D, et al. (2013) Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nature Biotechnology 31: 814-+.
2. Wu J, Peters BA, Dominianni C, Zhang Y, Pei Z, et al. (2016) Cigarette smoking and the oral microbiome in a large study of American adults. ISME J 10.1038/ismej.2016.37.