国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

Greengenes2:更廣的覆蓋度,更好的一致性

2024-01-02

好消息!

Greengenes2數據庫(ku)現已加入派(pai)森諾微生(sheng)物多樣(yang)性(xing)的流(liu)程中!!!


在高(gao)通(tong)量(liang)測序中(zhong),使(shi)用(yong)16S rRNA擴(kuo)增子(zi)方(fang)法和宏基因(yin)組學方(fang)法的研究通(tong)常會產生不同的結果,這通(tong)常被歸因(yin)于PCR擴(kuo)增偏差,目前(qian)還沒(mei)有很好地(di)方(fang)法解(jie)決(jue)這一問題。

2023年(nian)7月(yue),Nature Biotechnology(IF: 46.9)發表(biao)(biao)了(le)(le)Daniel McDonald(通(tong)訊作者Rob Knight)等人的(de)(de)文章(zhang),引入(ru)了(le)(le)Greengenes2。這是一個參考樹(shu),通(tong)過將(jiang)序列插入(ru)到全基(ji)因(yin)組(zu)(zu)系統發育(yu)樹(shu)中,將(jiang)基(ji)因(yin)組(zu)(zu)和(he)16S rRNA數據(ju)庫(ku)統一在一個一致(zhi)的(de)(de)、集成的(de)(de)資源(yuan)中。結(jie)果表(biao)(biao)明從(cong)相同的(de)(de)樣本中生成的(de)(de)16S rRNA和(he)宏基(ji)因(yin)組(zu)(zu)數據(ju)在主坐標空間、分(fen)類學和(he)表(biao)(biao)型效應大小上是一致(zhi)的(de)(de)。此外,Greengenes2數據(ju)庫(ku)的(de)(de)系統發育(yu)覆(fu)蓋(gai)率遠大于(yu)SILVA、Greengenes和(he)GTDB等數據(ju)庫(ku)。Greengenes2數據(ju)庫(ku)將(jiang)會是微生物組(zu)(zu)研究的(de)(de)一個利器(qi)。


鳥(niao)槍法宏基因(yin)(yin)組測(ce)序(xu)(xu)和(he)(he)(he)(he)16S rRNA基因(yin)(yin)擴增子測(ce)序(xu)(xu)研(yan)究在微(wei)(wei)生物(wu)組研(yan)究中被(bei)廣泛使(shi)用(yong),但使(shi)用(yong)這(zhe)些方法的(de)研(yan)究者通常發現它們的(de)結果(guo)差異較(jiao)大。這(zhe)種(zhong)跨(kua)方法的(de)標(biao)準化(hua)不(bu)(bu)足限制了微(wei)(wei)生物(wu)組用(yong)于可重復性(xing)生物(wu)標(biao)志物(wu)的(de)發現。造成(cheng)這(zhe)樣(yang)結果(guo)的(de)一個關鍵原(yuan)因(yin)(yin)是(shi)二者依賴(lai)于不(bu)(bu)同的(de)分類和(he)(he)(he)(he)系(xi)統發育。例如,Web of Life ( WoL ) 和(he)(he)(he)(he)Genome Taxonomy Database ( GTDB ) 提(ti)供(gong)的(de)全基因(yin)(yin)組樹(shu)只覆蓋了一小部(bu)分已知的(de)細(xi)菌(jun)和(he)(he)(he)(he)古細(xi)菌(jun),而(er)SILVA和(he)(he)(he)(he)Greengenes則較(jiao)為(wei)全面,但通常無(wu)法鏈(lian)接到基因(yin)(yin)組。

本研究作者(zhe)利(li)用迭代的(de)方法產(chan)生一(yi)個單一(yi)的(de)大規模(mo)參考樹(shu),統一(yi)這些不同的(de)數據層(基因組(zu)和16S rRNA),即為Greengenes2。數據來源(yuan)及主要(yao)處理流程如下:

1、首先(xian)從NCBI中均勻采(cai)樣了(le)15,953個(ge)細(xi)菌(jun)和古細(xi)菌(jun)基(ji)因(yin)(yin)組的(de)(de)全基(ji)因(yin)(yin)組,并使(shi)用新的(de)(de)工作(zuo)(zuo)流(liu)程(cheng) uDance總結 380 個(ge)全局標記基(ji)因(yin)(yin)的(de)(de)進化軌(gui)跡,重建(jian)了(le)準(zhun)確(que)的(de)(de)系統發(fa)育樹。這項工作(zuo)(zuo)即(ji)WoL版(ban)本2 ( WoL2 ),是(shi)對(dui)之前發(fa)布(bu)的(de)(de)WoL1(10,575個(ge)基(ji)因(yin)(yin)組)的(de)(de)重要升級。

2、進一步添(tian)加了來自(zi)Living Tree Project(LTP)2022 年1月發布的(de)18,356個全(quan)長16S rRNA序列、來自(zi)Karst等人和地球微生物(wu)組(zu)計劃500(EMP500)的(de)1,725,274個接近(jin)完整的(de)16S rRNA基(ji)因以(yi)及所有全(quan)長使用(yong)uDance v1.1.0將GTDB r207的(de) 16S rRNA序列定(ding)位到基(ji)于基(ji)因組(zu)的(de)主干,生成(cheng)明確(que)表示的(de) 16S rRNA的(de)基(ji)因組(zu)支持的(de)系統發育。

3、使用支(zhi)持深度(du)學習的系統發育放置插入(ru)了來(lai)自(zi)Qiita的23,113,447個短V4 16S rRNA Deblur v1.1.0擴增子序(xu)列變體(ti)(ASV)(檢索于(yu)2021年12月14日)以及來(lai)自(zi)SILVA v138的線粒體(ti)和葉(xie)綠體(ti)16S rRNA。這(zhe)一(yi)步代表來(lai)自(zi)Qiita超(chao)過(guo)300,000個公共和私人樣本的ASV,包(bao)括整個環(huan)境微生(sheng)物組(zu)計劃EMP和美國腸道(dao)計劃(American Gut Project/Microsetta,圖 1a)。

4、使用(yong)uDance確保(bao)基于基因組的(de)關(guan)(guan)系保(bao)持固定,并推斷全(quan)長(chang)16S rRNA序列(lie)之間的(de)關(guan)(guan)系。對(dui)于短片段(duan),保(bao)持基因組和(he)全(quan)長(chang)關(guan)(guan)系固定,并彼(bi)此(ci)獨立地(di)插入片段(duan)。經過對(dui)片段(duan)放置進(jin)行重復刪除和(he)質量控制后,生成了一棵涵蓋來自31個不同(tong)地(di)球微生物(wu)組項目本體論(lun)(EMP Ontology 3,EMPO3)環境的(de)21,074,442個序列(lie)的(de)樹,其中(zhong)46.5%的(de)物(wu)種(zhong)(zhong)級葉子(zi)被完整(zheng)的(de)基因組覆蓋。使用(yong)tax2tree v1.1將(jiang)分類(lei)標簽(qian)修(xiu)飾到系統發育上。物(wu)種(zhong)(zhong)注釋(shi)(shi)使用(yong)GTDB r207,并結合2022年1月(yue)發布的(de)LTP。分類(lei)學以(yi)GTDB為優(you)先(xian)順序進(jin)行協調(diao),包(bao)括保(bao)留GTDB的(de)多系標簽(qian)等。物(wu)種(zhong)(zhong)注釋(shi)(shi)將(jiang)使用(yong)最新(xin)版本的(de)GTDB和(he)LTP每6個月(yue)更(geng)新(xin)一次。


圖1.png

圖1 | Greengenes2數據庫覆蓋信息以及使用Greengenes2實現16S擴增子與宏基因組結果一致性。

a:Greengenes2系(xi)統發育,ASV多分支折(zhe)疊;樹枝末端顏色表(biao)示在美國腸道計劃(AGP)、地球微生物組(zu)計劃(EMP),兩者(zhe)都有(Both)或兩者(zhe)都沒有(Neither)。外圈顏色代(dai)表(biao)Top 20門(men);

b:進(jin)化樹同a,使用是否存(cun)在于SILVA 138的(de)最佳(jia)BLAST比對結果進(jin)行著色(se)。外圈顏色(se)與樹枝末端顏色(se)相同。

c:EMP樣本(ben)和通(tong)過ASV片段放置(zhi)添加到樹中的新分(fen)支(zhi)長(chang)度(du)的量(通(tong)過總主干分(fen)支(zhi)長(chang)度(du)歸一化)。

d:配對的16S V4 rRNA ASV和全基(ji)因組鳥槍樣本的Bray–Curtis PCoA展(zhan)示(shi)(數(shu)據(ju)來自(zi)The Microsetta Initiative的THDMI子集);

e:數據(ju)(ju)同d,但用(yong)屬水平數據(ju)(ju)計算Bray-Curtis;

f:數(shu)據(ju)同d、e,但在ASV和(he)基因組標識符水平上(shang)計算加權UniFrac。


Greengenes2的(de)(de)(de)(de)系統(tong)發(fa)(fa)育覆蓋率遠大于(yu)SILVA、Greengenes和(he)(he)GTDB等。過(guo)去比(bi)對(dui)16S和(he)(he)宏基因(yin)組(zu)(zu)(zu)數據(ju)集的(de)(de)(de)(de)各種努(nu)力仍然導致(zhi)分布不(bu)重疊,并且只有普氏分析(Procrustes)等技(ji)術才能顯示(shi)結果(guo)之間的(de)(de)(de)(de)關系。在(zai)兩個(ge)大型(xing)人(ren)(ren)類糞(fen)便隊列中,16S和(he)(he)宏基因(yin)組(zu)(zu)(zu)數據(ju)都(dou)是在(zai)同一(yi)(yi)(yi)(yi)樣本(ben)(ben)上生成的(de)(de)(de)(de),Bray-Curtis(非系統(tong)發(fa)(fa)育)排序(xu)在(zai)特(te)征水平上無法一(yi)(yi)(yi)(yi)致(zhi)(圖(tu)1d),并且在(zai)特(te)征屬水平合(he)并仍表現不(bu)佳(圖(tu)1e)。而UniFrac(一(yi)(yi)(yi)(yi)種系統(tong)發(fa)(fa)育方(fang)法)與Greengenes2樹(shu)一(yi)(yi)(yi)(yi)起使用提供了更好的(de)(de)(de)(de)一(yi)(yi)(yi)(yi)致(zhi)性(圖(tu)1f)。對(dui)非人(ren)(ren)類環境的(de)(de)(de)(de)適用性,在(zai)16S和(he)(he)來(lai)自EMP的(de)(de)(de)(de)宏基因(yin)組(zu)(zu)(zu)數據(ju)的(de)(de)(de)(de)特(te)征級別上計(ji)算了Bray-Curtis和(he)(he)加權UniFrac。本(ben)(ben)研究也測試了環境類型(xing)樣本(ben)(ben),與人(ren)(ren)源數據(ju)一(yi)(yi)(yi)(yi)樣,Greengenes2系統(tong)發(fa)(fa)育使用后結果(guo)具有更好的(de)(de)(de)(de)一(yi)(yi)(yi)(yi)致(zhi)性。

作(zuo)者發現(xian)(xian),每(mei)個樣本的(de)(de)(de)宏基因組和16S分(fen)類相(xiang)對(dui)豐度分(fen)布(bu)甚(shen)(shen)至與物(wu)(wu)種(zhong)水(shui)(shui)平(ping)(ping)(ping)(ping)一致(zhi)。首(shou)先(xian)使用Woltka流程(cheng)計算了宏基因組數據的(de)(de)(de)分(fen)類配(pei)置(zhi)文件。使用來自(zi)q2-feature-classifier(v2022.2)的(de)(de)(de)樸素貝(bei)葉斯分(fen)類器將每(mei)個級別的(de)(de)(de)GTDB r207分(fen)類結(jie)果與SILVA v138(圖2a)或(huo)下至物(wu)(wu)種(zhong)水(shui)(shui)平(ping)(ping)(ping)(ping)與Greengenes v13_8(圖2b)進(jin)行(xing)比較(jiao)(無(wu)法進(jin)行(xing)物(wu)(wu)種(zhong)水(shui)(shui)平(ping)(ping)(ping)(ping)的(de)(de)(de)一致(zhi)性(xing)比較(jiao))。相(xiang)比之下,Greengenes2在屬水(shui)(shui)平(ping)(ping)(ping)(ping)提供了極好(hao)(hao)的(de)(de)(de)一致(zhi)性(xing)(Pearson r = 0.85),在物(wu)(wu)種(zhong)水(shui)(shui)平(ping)(ping)(ping)(ping)上提供了良好(hao)(hao)的(de)(de)(de)一致(zhi)性(xing)(Pearson r = 0.65)(圖2c)。有趣的(de)(de)(de)是,這棵(ke)樹(shu)現(xian)(xian)在已經足夠完整,以至于精確(que)匹配(pei)16S ASV然(ran)后從(cong)樹(shu)上讀(du)取物(wu)(wu)種(zhong)注釋甚(shen)(shen)至比樸素貝(bei)葉斯分(fen)類器表(biao)現(xian)(xian)得更好(hao)(hao)(屬水(shui)(shui)平(ping)(ping)(ping)(ping) r = 0.54和物(wu)(wu)種(zhong)水(shui)(shui)平(ping)(ping)(ping)(ping) r = 0.84)。

總之,這些結(jie)果表明,使(shi)用一致的(de)、綜合(he)的(de)分(fen)類資源顯著(zhu)提高了(le)使(shi)用不(bu)同數據(ju)類型的(de)微生(sheng)物組研究的(de)可重復性。

圖2.png

圖2 | 16S rRNA ASVs和宏(hong)基因組數據之間(jian)的分類(lei)學和效應大小一致性。

a-c:飲食(shi)微生物組計劃的16S和全基因組宏基因組圖譜(pu)之間的樣本分類學(xue)比較。實線表示中位(wei)數,虛線表示第(di)25和第(di)75個百分位(wei)數。

d-e:用Evident對來自飲食(shi)微生物組計劃的(de)成對16S和全(quan)基(ji)因組鳥(niao)槍樣本(ben)(ben)進行的(de)效應大小(xiao)計算(suan)。使用16S的(de)ASV和鳥(niao)槍樣本(ben)(ben)的(de)基(ji)因組標(biao)識符以(yi)最大分辨率進行計算(suan)。這(zhe)里顯示的(de)數據是(shi)人類腸道微生物組樣本(ben)(ben)。星(xing)號表示特定的(de)變量。


參考文獻

McDonald D, Jiang Y, Balaban M, et al. Greengenes2 unifies microbial data in a single reference tree[J]. Nature Biotechnology, 2023.