国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>公司新聞>新聞詳情

【5分鐘小課堂第3彈】看不見摸不著的它們,都在忙活些啥?宏基因組功能注釋為您解答!

2016-09-01

在上(shang)一(yi)期的“5分鐘(zhong)小課堂”中,小(xiao)編介紹了(le)宏基因組學(xue)大數(shu)據拼接組裝(zhuang)的基本原理和(he)操作工具,小(xiao)伙伴們有(you)(you)木有(you)(you)親自體(ti)驗(yan)一把“拼圖游戲”呢?同時,我們也已經提到,拼圖獲得的Contigs/Scaffolds序列將是后續一系列分析的數據來源。比如,各位小伙伴一定很想知道,這些序列各自具有怎樣的生物學意義呢?也就是說,拼圖揭示的這些微生物都在干什么?要想解答這個問題,就需要借助宏基因組學研究的“法寶”之二:功能注釋(Annotation)!

 

1. 要想注釋好,數據庫尋寶

Contigs/Scaffolds序(xu)列(lie)經基因(yin)預測、ORF開放閱讀(du)框識別(Open Reading Frame)和蛋白(bai)翻譯之后(hou),就可(ke)以(yi)進行功(gong)能(neng)注釋(shi)(shi)分(fen)析(xi)了。我們將基因(yin)/蛋白(bai)序(xu)列(lie)在特定的(de)數(shu)據庫中搜索(suo)比對,從而完成功(gong)能(neng)注釋(shi)(shi)分(fen)析(xi)。常用的(de)功(gong)能(neng)數(shu)據庫主(zhu)要包括KEGG、EggNOG和CAZy等。

1.1 KEGG數據庫

KEGG數據庫(Kyoto Encyclopedia of Genes and Genomes)[1]是最常用的(de)功能注釋數(shu)據庫,其核心為生物代(dai)謝通路分析數(shu)據庫(KEGG PATHWAY Database),以KEGG直系同源基因簇(即KO,KEGG orthologous groups)為基本單元,根據各個KO的具體功能逐層歸類,并繪制代謝通路地圖。

KEGG代謝通路地圖示例

KEGG數據庫的特色之一就是完善的代謝通路地圖和注釋說明。不僅如此,作為最常用的功能注釋數據庫,KEGG還提供了KAAS(KEGG Automatic Annotation Server)[2]GhostKOALA(KEGG Orthology And Links Annotation)[3]等在線注釋分析平臺,我們只需要提交蛋白序列(lie),即(ji)可獲取相應(ying)的(de)KO注釋結果。

KAAS和GhostKOALA在線注釋分析平臺

1.2 EggNOG數據庫

EggNOG數據庫(Evolutionary Genealogy of Genes: Non-supervised Orthologous Groups)[4]由(you)歐洲分(fen)子生(sheng)物學實驗室(European Molecular Biology Laboratory,EMBL)所管理,目前已構建了接近200萬個直系同源基因簇(Orthologous groups of genes)的功能注釋信息。EggNOG數據庫將基因功能分為25個大類,每一大類以一個英語大寫字母代表。

EggNOG數據庫主頁截圖

1.3 CAZy數據庫

CAZy數據庫(Carbohydrate-Active enZYmes Database)[5]成立于1998年,聚焦于降解、修飾或生成糖苷鍵(Glycosidic bond)的碳水化合物活性酶,是研究相關酶類的專業數據庫。

CAZy數據庫主頁截圖

除了上述常用數據庫外(wai),還有PHI病原與宿主互作數據庫、VFDB病原菌毒力因子數據庫、MvirDB生物防御數據庫、CARD抗生素抗性基因綜合數據庫等等各種功能注釋數據庫,它們可以幫助我們充分挖掘宏基因組學數據,全面闡釋菌群功能特性。 

2. 功能注釋豐度譜分析

在獲得(de)菌群(qun)的(de)功(gong)(gong)能注釋信息后,我們(men)就可以對(dui)各樣(yang)本的(de)功(gong)(gong)能代謝譜進行(xing)一(yi)系列(lie)更(geng)深入分析啦!以KEGG數據庫注釋結果為例,我們可以統計菌群中各類代謝功能的數量:

KEGG第二等級代謝通路的注釋結(jie)果統計圖(tu)

我(wo)們還可以進一步分析(xi)兩樣本(ben)(組(zu))間(jian)共有和獨有的(de)代謝(xie)通(tong)路(lu),或是它們各自富(fu)集的(de)代謝(xie)通(tong)路(lu):

共有(you)/獨有代謝通路圖

代謝通路富集(ji)分析(xi)圖

我們(men)還可以根據代謝通路富集分析進行(xing)聚(ju)類分析,并繪制熱圖:


KO聚類分析熱圖

是不是感覺分(fen)(fen)析結(jie)果(guo)立馬高大上了(le)?小編告(gao)訴您,上述這(zhe)些還只(zhi)是基礎分(fen)(fen)析,只(zhi)要(yao)好好利用功能(neng)代謝譜的數據,有可能(neng)發現(xian)更深入、更有科學意義的研究(jiu)結(jie)果(guo)!

3. 物種組成譜的注釋分析

除(chu)了對宏基因組的(de)代謝功能譜進行(xing)注釋(shi)分析,我們還可以對物種組成譜進行(xing)分析,通過(guo)將Contigs/Scaffolds序列與NCBI-NT數據庫進行BLASTN比對,可以獲得宏基因組的精細組成信息。與基于rRNA基因部分可變區/全長的菌群組成和多樣性普查相比,宏基因組學物種組成譜分析往往可以根據特定微生物物種所獨有的標記基因,在種以及種以下更精細水平(如菌株水平),以“高分辨率”展現菌群的組成結構:

種水平的宏基因組物種組成譜分析圖

我們還(huan)可以進一步評(ping)估宏基因組的(de)功能(neng)豐度(du)譜(pu)和物種組成譜(pu)是(shi)否具(ju)有一致(zhi)的(de)共性,并且(qie)通過(guo)關聯分(fen)析,量化兩(liang)者之間一致(zhi)性的(de)高低(di):

功能——物種一致性分析圖

4. 結語

這一期的小課堂中,我們主要介(jie)紹了(le)宏基因組功能(neng)和物種注(zhu)釋的方(fang)法,和相(xiang)關的一系列數據分析結果。通過(guo)這些分析,我們不僅可以在種以及種以下的精(jing)細水平(ping)揭示“誰在宏基因組里?”,更能夠闡明“它們在這里做什么?”。通過解答這兩個層面的問題,我們可以對宏基因組的結構和功能有更全面的認識。

在(zai)獲(huo)得宏基(ji)因組的功能豐度譜(pu)和物種組成譜(pu)后(hou),如何進行更(geng)深入(ru)的數據挖掘并篩選生物標記物呢?欲(yu)知后(hou)事如何,且待下(xia)回分解,敬(jing)請各位小伙伴保持關注哦!

附:【5分鐘小課堂】后續預告

茫茫菌群,誰是天使,誰是元兇,誰又是圍觀路人甲?

菌株水平的超高分辨率解析,宏基因組學就是這么高大上! 

參考文獻

1. Kanehisa M, Goto S, Kawashima S, Okuno Y, Hattori M (2004) The KEGG resource for deciphering the genome. Nucleic Acids Res 32: D277-D280.

2. Moriya Y, Itoh M, Okuda S, Yoshizawa AC, Kanehisa M (2007) KAAS: an automatic genome annotation and pathway reconstruction server. Nucleic Acids Res 35: W182-W185.

3. Kanehisa M, Sato Y, Morishima K (2016) BlastKOALA and GhostKOALA: KEGG Tools for Functional Characterization of Genome and Metagenome Sequences. J Mol Biol 428: 726-731.

4. Jensen LJ, Julien P, Kuhn M, von Mering C, Muller J, et al. (2008) eggNOG: automated construction and annotation of orthologous groups of genes. Nucleic Acids Res 36: D250-D254.

5. Lombard V, Golaconda Ramulu H, Drula E, Coutinho PM, Henrissat B (2014) The carbohydrate-active enzymes database (CAZy) in 2013. Nucleic Acids Res 42: D490-495.