2024-07-24
代謝(xie)組學(xue)分(fen)析(xi)產生了(le)大量的(de)(de)(de)生物(wu)信息數(shu)(shu)據(ju)(ju)。代謝(xie)數(shu)(shu)據(ju)(ju)庫(ku)是專門收集、存儲和分(fen)析(xi)生物(wu)體代謝(xie)信息的(de)(de)(de)數(shu)(shu)據(ju)(ju)庫(ku)。簡單來(lai)說(shuo),它就(jiu)像一個(ge)關于(yu)生物(wu)體內各種(zhong)物(wu)質如何(he)相互轉化、生成和消耗的(de)(de)(de)“百(bai)科(ke)(ke)(ke)全書”。代謝(xie)數(shu)(shu)據(ju)(ju)庫(ku)是生物(wu)醫藥、植物(wu)農業(ye)、食品科(ke)(ke)(ke)學(xue)、環境科(ke)(ke)(ke)學(xue)、畜牧養(yang)殖等研究(jiu)領(ling)(ling)域(yu)不可或缺(que)的(de)(de)(de)工具,它為我們理解生命過程、預測代謝(xie)產物(wu)和通路、揭示疾病機(ji)制、開(kai)發新藥和新技術提供(gong)了(le)強大的(de)(de)(de)支持。本文(wen)匯總了(le)代謝(xie)組學(xue)研究(jiu)常用的(de)(de)(de)十幾個(ge)數(shu)(shu)據(ju)(ju)庫(ku),通過對不同數(shu)(shu)據(ju)(ju)庫(ku)的(de)(de)(de)特點與適(shi)用范圍(wei)的(de)(de)(de)歸(gui)納總結(jie),旨在為相關領(ling)(ling)域(yu)的(de)(de)(de)科(ke)(ke)(ke)研工作者快速選擇合適(shi)的(de)(de)(de)數(shu)(shu)據(ju)(ju)庫(ku)提供(gong)參考。
1、HMDB (//hmdb.ca) 人類代(dai)謝(xie)數據庫(Human Metabolome Database,簡(jian)稱HMDB)是世(shi)界上最(zui)大、最(zui)全面的(de)生物體(ti)特異性代(dai)謝(xie)組(zu)學數據庫,包(bao)含了目(mu)前(qian)已知(zhi)的(de)所有有關人體(ti)小分子代(dai)謝(xie)物的(de)詳細信息。目(mu)前(qian),該數據庫包(bao)含220945個代(dai)謝(xie)物條目(mu)以及8610個和這(zhe)些代(dai)謝(xie)條目(mu)有關的(de)蛋白質序列(酶和轉運蛋白)。 該數(shu)據庫(ku)內容完整詳(xiang)細,包含有(you)關人類(lei)代(dai)(dai)謝(xie)(xie)物及其生(sheng)物學作用(yong)、疾病(bing)關聯(lian)(lian)、化學反應(ying)、代(dai)(dai)謝(xie)(xie)途徑(jing)和參考光(guang)譜等(deng)信息;支持多(duo)種(zhong)(zhong)搜索方式,比如化合物名(ming)(ming)稱(cheng)、分子量大小、分子結構;與多(duo)個數(shu)據庫(ku)關聯(lian)(lian),包括KEGG、PubChem、MetaCyc和ChEBI等(deng);可以(yi)快速系(xi)統地(di)了解代(dai)(dai)謝(xie)(xie)物,包括分子量、結構、各種(zhong)(zhong)名(ming)(ming)稱(cheng)、分類(lei)、生(sheng)物學途徑(jing)、代(dai)(dai)謝(xie)(xie)酶、相關研究等(deng)信息。 該庫(ku)目前不支(zhi)持批量搜(sou)索(suo),僅(jin)限于單個代(dai)謝(xie)產物(wu)搜(sou)索(suo);該庫(ku)未(wei)收錄(lu)代(dai)謝(xie)通路圖,但可鏈接到其他通路數據庫(ku)中;該庫(ku)包(bao)含(han)較全的代(dai)謝(xie)物(wu)在不同樣(yang)本中的濃度信(xin)息;也有二級譜(pu)圖,但是覆(fu)蓋度與(yu)準確性尚無法準確評估,僅(jin)做參考。
2、KEGG (//www.kegg.jp) 京都基(ji)因(yin)與(yu)基(ji)因(yin)組(zu)百科(ke)全書(Kyoto Encyclopedia of Genes and Genomes, 簡稱 KEGG)數(shu)據庫(ku)(ku)是世界上最大(da)、最全的生物(wu)(wu)信(xin)息(xi)學數(shu)據庫(ku)(ku)之一。該數(shu)據庫(ku)(ku)主(zhu)要偏重于(yu)代謝通路和(he)整合代謝、基(ji)因(yin)和(he)蛋(dan)白通路信(xin)息(xi)。目(mu)前有572條代謝通路和(he)19373個(ge)各類代謝產物(wu)(wu)(動物(wu)(wu)、植(zhi)物(wu)(wu)和(he)細菌等)。該數(shu)據庫(ku)(ku)的構建(jian)旨(zhi)在了解生物(wu)(wu)系(xi)統(tong)(如細胞,組(zu)織等)中(zhong)基(ji)因(yin)、蛋(dan)白及代謝物(wu)(wu)的功能及相互作用(yong)關(guan)系(xi)。可以查詢到與(yu)代謝物(wu)(wu)相關(guan)的代謝通路、人類疾(ji)病及藥物(wu)(wu)等信(xin)息(xi)。 該數(shu)據庫內(nei)容全(quan)面,使用廣泛。整(zheng)合了(le)基(ji)因組、化(hua)學、系(xi)統功(gong)能和健康(kang)信息(xi);將已經完整(zheng)測序的(de)基(ji)因組中的(de)基(ji)因與(yu)更高(gao)級(ji)別的(de)細胞、物種和生態系(xi)統水平的(de)系(xi)統功(gong)能進行關聯;強大(da)的(de)圖形功(gong)能使研究(jiu)者(zhe)能夠(gou)對其所要(yao)研究(jiu)的(de)眾多的(de)代謝途徑以及(ji)各途徑之間(jian)的(de)關系(xi)有一個直(zhi)觀全(quan)面的(de)了(le)解。
3、Reactome (//reactome.org/) Reactome是一個(ge)免費開源(yuan)、人工(gong)整(zheng)理并經過同行(xing)評審,收錄了人類和(he)其他生(sheng)物(wu)的(de)反(fan)應、蛋白質、途徑、小分(fen)子和(he)藥物(wu)的(de)數(shu)據庫,提(ti)供了可視(shi)化、解釋和(he)分(fen)析的(de)生(sheng)物(wu)信(xin)息學(xue)工(gong)具,用于通路知識的(de)可視(shi)化、解釋和(he)分(fen)析,以(yi)支持(chi)基(ji)礎研究、臨床(chuang)研究、基(ji)因(yin)組分(fen)析、建模(mo)、系統生(sheng)物(wu)學(xue)研究等。 作為另一版本(ben)的(de)代謝通(tong)路圖譜庫(ku),該庫(ku)包(bao)含(han)了(le)(le)多樣性(xing)的(de)經(jing)典代謝通(tong)路、信號轉(zhuan)導、基因(yin)轉(zhuan)錄調控、細(xi)胞凋亡與疾病相(xiang)關通(tong)路。該庫(ku)引用了(le)(le)100多種不同的(de)在(zai)線生物(wu)(wu)信息(xi)學資源(yuan)庫(ku),包(bao)括NCBI Gene、Ensembl、UniProt、UCSC基因(yin)組瀏覽(lan)器(qi)、ChEBI小分子數據庫(ku)和(he)PubMed文獻(xian)數據庫(ku)等。Reactome(第86版—2023年9月)有11148個蛋白質編碼基因(yin)的(de)條目,涉及14803個反應(ying)及2647個通(tong)路,描述了(le)(le)1119種藥物(wu)(wu)對正常和(he)疾病過程(cheng)的(de)調節作用。
4、SMPDB (//smpdb.ca/) The Small Molecule Pathway Database(SMPDB)是一個交互的、可視化的小(xiao)分子通路(lu)數據(ju)庫。SMPDB作為HMDB的子庫之(zhi)一,旨(zhi)在支持(chi)人類代(dai)謝途(tu)徑(jing)、生理途(tu)徑(jing)、藥物代(dai)謝、藥物反(fan)應以及疾病的通路(lu)發現(xian)與闡明。 該數(shu)(shu)據(ju)庫擁有(you)完善的(de)通(tong)路信息,包含(han)132335種人(ren)(ren)類代(dai)謝(xie)、藥物(wu)和(he)疾病途徑的(de)通(tong)路圖以及60628種其他生物(wu)體(ti)的(de)通(tong)路圖;此外,該數(shu)(shu)據(ju)庫包含(han)了(le)超過3萬(wan)種發(fa)現于人(ren)(ren)體(ti)中(zhong)的(de)小分子通(tong)路,其中(zhong)70%的(de)通(tong)路為該數(shu)(shu)據(ju)庫獨有(you),在(zai)其他數(shu)(shu)據(ju)庫中(zhong)無(wu)法找到;提供了(le)巧妙詳(xiang)細地人(ren)(ren)類代(dai)謝(xie)通(tong)路、代(dai)謝(xie)疾病通(tong)路、代(dai)謝(xie)物(wu)信號通(tong)路和(he)藥物(wu)活性通(tong)路的(de)超級鏈接圖表,具有(you)強大的(de)通(tong)路圖表繪制功能(neng)。
5、mzCloud (//www.mzcloud.org/) mzCloud數(shu)(shu)據庫(ku)由Thermo公司基于(yu)標準品使用(yong)QE系列質(zhi)譜儀構(gou)建的(de)云(yun)端質(zhi)譜數(shu)(shu)據庫(ku),它包含在許多實驗條件下獲得的(de)高(gao)分(fen)辨率(lv)和低分(fen)辨率(lv)MSn下各種化(hua)合(he)物(wu)的(de)質(zhi)譜圖(tu)譜和相(xiang)關的(de)碎片(pian)數(shu)(shu)據,解決(jue)了光譜重現(xian)性問題。該數(shu)(shu)據庫(ku)提供了可自由搜索的(de)光譜、光譜樹、結構(gou)、碎片(pian)、前體離子、色譜數(shu)(shu)據和化(hua)合(he)物(wu)相(xiang)關參(can)考文獻(xian)的(de)信息,可以幫助用(yong)戶(hu)對質(zhi)譜圖(tu)中(zhong)的(de)碎片(pian)進行解釋和標識,根據質(zhi)譜數(shu)(shu)據推斷化(hua)合(he)物(wu)的(de)結構(gou)和特性,常用(yong)于(yu)非靶向(xiang)代(dai)謝組學(xue)研(yan)究中(zhong)的(de)物(wu)質(zhi)鑒定。
6、Metlin (//metlin.scripps.edu) Metabolite Link (Metlin)數據庫(ku)是(shi)由美(mei)國(guo)斯(si)克里普斯(si)研究(jiu)院(Scripps Research Institute)開(kai)發的(de)(de)一個非常(chang)全面的(de)(de)二(er)級質(zhi)(zhi)(zhi)譜(pu)數據庫(ku),主要用(yong)于液質(zhi)(zhi)(zhi)非靶(ba)向代(dai)(dai)謝(xie)(xie)(xie)組學(xue)(xue)代(dai)(dai)謝(xie)(xie)(xie)物(wu)(wu)(wu)鑒定領域,目前(qian)包(bao)括超過100萬種(zhong)分子,包(bao)括脂(zhi)質(zhi)(zhi)(zhi),類(lei)固(gu)醇,植物(wu)(wu)(wu)和(he)細菌(jun)代(dai)(dai)謝(xie)(xie)(xie)物(wu)(wu)(wu),小肽,碳水化合物(wu)(wu)(wu),外源性(xing)藥物(wu)(wu)(wu)/代(dai)(dai)謝(xie)(xie)(xie)物(wu)(wu)(wu),中心碳代(dai)(dai)謝(xie)(xie)(xie)物(wu)(wu)(wu)和(he)毒物(wu)(wu)(wu),超431000個高(gao)分辨(bian)率(lv)MS/MS質(zhi)(zhi)(zhi)譜(pu)圖(tu)(tu)。該庫(ku)含(han)有(you)大量代(dai)(dai)謝(xie)(xie)(xie)物(wu)(wu)(wu)的(de)(de)二(er)級質(zhi)(zhi)(zhi)譜(pu)圖(tu)(tu),而(er)且每個化合物(wu)(wu)(wu)都(dou)有(you)多種(zhong)不(bu)同碰(peng)撞能(neng)的(de)(de)圖(tu)(tu)譜(pu),可以清晰(xi)的(de)(de)找到(dao)代(dai)(dai)謝(xie)(xie)(xie)物(wu)(wu)(wu)的(de)(de)碎片(pian)離(li)子,方便比(bi)對鑒定代(dai)(dai)謝(xie)(xie)(xie)物(wu)(wu)(wu);用(yong)戶還可以獲得分子量、化學(xue)(xue)式(shi)、化學(xue)(xue)結構等信(xin)息(xi)(xi)。但是(shi)該數據庫(ku)沒有(you)代(dai)(dai)謝(xie)(xie)(xie)物(wu)(wu)(wu)在生物(wu)(wu)(wu)體中的(de)(de)濃度、代(dai)(dai)謝(xie)(xie)(xie)通路(lu)等信(xin)息(xi)(xi),偏重(zhong)于化學(xue)(xue)分析;且Metlin雖然(ran)有(you)大量高(gao)質(zhi)(zhi)(zhi)量的(de)(de)二(er)級質(zhi)(zhi)(zhi)譜(pu)圖(tu)(tu),但是(shi)因為收費較高(gao),不(bu)適(shi)合日常(chang)查詢(xun)使(shi)用(yong)。
7、MassBank (//massbank.eu/) MassBank是第一個用于(yu)(yu)(yu)生命科學(<3000 Da)的(de)(de)(de)化(hua)合(he)物質(zhi)譜的(de)(de)(de)公共(gong)存儲(chu)庫,旨在公開分享(xiang)從化(hua)學標準品得到(dao)的(de)(de)(de)質(zhi)譜圖,以方便用戶進(jin)行代(dai)謝物的(de)(de)(de)鑒定。該(gai)數據(ju)庫人為地(di)將來自(zi)于(yu)(yu)(yu)相同(tong)代(dai)謝物但是不(bu)(bu)同(tong)碰撞能(neng)量或(huo)者不(bu)(bu)同(tong)的(de)(de)(de)碎裂方式的(de)(de)(de)碎片離子合(he)并成一張質(zhi)譜圖,這使鑒定的(de)(de)(de)結(jie)果不(bu)(bu)再依賴于(yu)(yu)(yu)某一特定的(de)(de)(de)儀(yi)器設置或(huo)者特定廠家的(de)(de)(de)儀(yi)器。 但是由于數據庫中所有(you)(you)(you)的記(ji)錄并未經過充分的篩選(xuan),會出現有(you)(you)(you)些條目對應的信息較差或(huo)者(zhe)存在錯誤注釋以及有(you)(you)(you)一些譜圖也包含了噪音信號或(huo)者(zhe)提取(qu)的效果(guo)并不(bu)是很好(hao)的情況。
8、BiGG Models (//bigg.ucsd.edu90) BiGG Models是一個基(ji)(ji)于代(dai)(dai)謝(xie)(xie)組(zu)(zu)學的系統生物學整合數(shu)(shu)據(ju)庫,可用于預測代(dai)(dai)謝(xie)(xie)途徑的使用和生長表型。作為生化、遺傳和基(ji)(ji)因組(zu)(zu)結構(gou)的代(dai)(dai)謝(xie)(xie)網絡重(zhong)建的知(zhi)識庫,目前擁有(you)108個基(ji)(ji)因組(zu)(zu)規模(mo)代(dai)(dai)謝(xie)(xie)模(mo)型(GEM)的代(dai)(dai)謝(xie)(xie)知(zhi)識,數(shu)(shu)據(ju)庫中代(dai)(dai)表的獨(du)(du)特反應數(shu)(shu)量(liang)有(you)28302個,獨(du)(du)特代(dai)(dai)謝(xie)(xie)物的數(shu)(shu)量(liang)有(you)9088種。代(dai)(dai)謝(xie)(xie)物與許多外部數(shu)(shu)據(ju)庫相(xiang)連,包括KEGG、MetaCyc、Reactome、HMDB、RCSB PDB、Model SEED和Entrez Gene。 該數據庫(ku)最大的特點是(shi)含有各(ge)類模式生(sheng)(sheng)(sheng)物(wu)的代(dai)謝(xie)譜圖(tu)模型(xing)。用(yong)戶可(ke)以直觀的調取各(ge)種生(sheng)(sheng)(sheng)物(wu)的整體(ti)代(dai)謝(xie)通(tong)路,也可(ke)以查看某個(ge)具體(ti)的生(sheng)(sheng)(sheng)化(hua)反(fan)應。同(tong)時(shi)也可(ke)以進行(xing)代(dai)謝(xie)產物(wu)搜索。但是(shi)該數據庫(ku)側重描述了代(dai)謝(xie)通(tong)路和生(sheng)(sheng)(sheng)化(hua)反(fan)應信息,缺少代(dai)謝(xie)產物(wu)絕對濃度,以及其應用(yong)和意(yi)義方面信息。
9、BioCyc (//www.biocyc.org/) BioCyc是(shi)(shi)一個集合了數(shu)(shu)千個測序(xu)(xu)生物體基(ji)因(yin)組和代謝途徑的(de)功能數(shu)(shu)據(ju)庫(ku)。BioCyc是(shi)(shi)人工校驗數(shu)(shu)以萬計(ji)的(de)論文構建(jian)成的(de)高質(zhi)量(liang)的(de)數(shu)(shu)據(ju)庫(ku),特(te)別是(shi)(shi)大腸桿(gan)菌,枯草芽孢桿(gan)菌,人類及釀酒(jiu)酵母的(de)數(shu)(shu)據(ju)庫(ku)內容;支(zhi)持計(ji)算預測完全測序(xu)(xu)的(de)生物體的(de)代謝途徑、缺失(shi)酶(mei)和操縱子;集成多個數(shu)(shu)據(ju)庫(ku)數(shu)(shu)據(ju),例(li)如UniProt中的(de)蛋白(bai)特(te)征和GO注(zhu)釋等。 BioCyc中的(de)每一個數據庫描述了單個有機體的(de)基(ji)因組和代(dai)謝通路,該數據庫會按照質量(liang)等級分為三個層(ceng)(ceng)級,其中第一層(ceng)(ceng)數據庫質量(liang)最高。這里(li)簡單介紹BioCyc第一層(ceng)(ceng)數據庫中兩個主要(yao)的(de)數據庫HumanCyc和MetaCyc。 (1)HumanCyc(//humancyc.org/) HumanCyc是描述人類(lei)基因(yin)和代(dai)謝(xie)途徑(jing)的(de)數據(ju)庫。該數據(ju)庫具(ju)有人體(ti)細(xi)胞內代(dai)謝(xie)通(tong)路(lu)總體(ti)圖(tu),用(yong)戶能夠縮放查看(kan)具(ju)體(ti)的(de)某個代(dai)謝(xie)通(tong)路(lu),點(dian)擊某個代(dai)謝(xie)產物(wu)節點(dian),可以獲得(de)該代(dai)謝(xie)產物(wu)的(de)化(hua)學(xue)結構(gou)圖(tu)、化(hua)學(xue)式以及(ji)相應的(de)生化(hua)反應。 (2)MetaCyc(//metacyc.org/) MetaCyc是非冗余(yu)且通過實(shi)驗手段(duan)闡(chan)明過的(de)(de)代(dai)謝(xie)(xie)(xie)通路(lu),包(bao)含(han)參與初級和(he)次級代(dai)謝(xie)(xie)(xie)的(de)(de)途徑(jing),以及相(xiang)關的(de)(de)代(dai)謝(xie)(xie)(xie)物、反應、酶(mei)和(he)基因,在(zai)(zai)植物代(dai)謝(xie)(xie)(xie)組學中(zhong)使用較為普遍。MetaCyc 目前包(bao)含(han)3153條途徑(jing)、19020種反應和(he)19372種代(dai)謝(xie)(xie)(xie)物,且在(zai)(zai)實(shi)時(shi)更新(xin)(xin)中(zhong)。MetaCyc可(ke)以作為新(xin)(xin)陳代(dai)謝(xie)(xie)(xie)在(zai)(zai)線百(bai)科全書,用來預測測序基因組中(zhong)的(de)(de)代(dai)謝(xie)(xie)(xie)途徑(jing),通過酶(mei)數(shu)據庫支持(chi)代(dai)謝(xie)(xie)(xie)工程。
10、GMD (//gmd.mpimp-golm.mpg.de/) The Golm Metabolome Database(GMD)作為一(yi)個(ge)(ge)植(zhi)物代(dai)謝組學數據(ju)庫,側重于非(fei)靶向(xiang)代(dai)謝組學。已有1450種已被鑒定的代(dai)謝物和10336個(ge)(ge)GC-MS圖(tu)譜信息。 該數據(ju)庫含有(you)大(da)量植(zhi)物代(dai)謝(xie)(xie)物的(de)GC-MS圖(tu)譜(特別是衍生化后的(de)),用戶可以(yi)導入自己GC-MS數據(ju)進(jin)行(xing)搜(sou)索比(bi)對和鑒定(ding);該數據(ju)庫還含有(you)部(bu)(bu)分代(dai)謝(xie)(xie)產物在(zai)植(zhi)物中的(de)濃度,可以(yi)按照(zhao)植(zhi)物名、部(bu)(bu)位等(deng)進(jin)行(xing)搜(sou)索。 由于(yu)該數(shu)據(ju)庫主要收錄了(le)植(zhi)物的(de)代謝組,沒有其他(ta)生物的(de)信息,且缺(que)乏LC-MS/MS圖譜,限(xian)制(zhi)了(le)這個數(shu)據(ju)庫的(de)應用。但(dan)是(shi)GMD對(dui)于(yu)進(jin)行植(zhi)物代謝組學研究的(de)人員來說(shuo),?仍然是(shi)一個重要的(de)資(zi)源(yuan),?特(te)別是(shi)對(dui)于(yu)那些需要進(jin)行GC-MS數(shu)據(ju)分析(xi)的(de)研究者。
11、PlantCyc (//plantcyc.org/) Plant Metabolic Pathway Databases(PlantCyc)作(zuo)為植(zhi)(zhi)物代謝(xie)(xie)途徑數(shu)據庫,是植(zhi)(zhi)物代謝(xie)(xie)網絡(Plant Metabolic Network,PMN)的主(zhu)要(yao)組(zu)件之(zhi)一。它(ta)包含(han)計算分(fen)析的基因(yin)、蛋白(bai)酶(mei)、化合(he)物、化合(he)反應和初級(ji)、次級(ji)代謝(xie)(xie)產(chan)物等信(xin)息。PlantCyc匯集了500多(duo)種植(zhi)(zhi)物的1146條途徑、4217種酶(mei)、5392個反應、4899個化合(he)物的信(xin)息。
12、Lipid Maps (//www.lipidmaps.org/) Lipid metabolites and pathways strategy(LIPID MAPS)數據(ju)(ju)(ju)庫(ku)(ku)是世(shi)界上(shang)最(zui)大的(de)(de)公共(gong)脂(zhi)(zhi)質(zhi)(zhi)(zhi)數據(ju)(ju)(ju)庫(ku)(ku),旨在利(li)用系統(tong)生(sheng)物(wu)(wu)學(xue)方法、質(zhi)(zhi)(zhi)譜方法等鑒(jian)定(ding)、定(ding)量生(sheng)物(wu)(wu)體內(nei)的(de)(de)脂(zhi)(zhi)質(zhi)(zhi)(zhi),揭(jie)示多種生(sheng)命活動、環境變(bian)化(hua)帶來的(de)(de)脂(zhi)(zhi)質(zhi)(zhi)(zhi)變(bian)化(hua)。LIPID MAPS有48519種脂(zhi)(zhi)質(zhi)(zhi)(zhi)化(hua)合物(wu)(wu),包含LIPIDAT,Cyberlipids和(he)其他公共(gong)數據(ju)(ju)(ju)庫(ku)(ku)與生(sheng)物(wu)(wu)有關(guan)的(de)(de)脂(zhi)(zhi)質(zhi)(zhi)(zhi)數據(ju)(ju)(ju),提供了(le)組織脂(zhi)(zhi)質(zhi)(zhi)(zhi)結(jie)構和(he)生(sheng)化(hua)數據(ju)(ju)(ju)的(de)(de)系統(tong)化(hua)和(he)標(biao)準(zhun)化(hua)方法。 該(gai)數據庫一方(fang)面可以(yi)進行脂質(zhi)(zhi)化合物信(xin)息(xi)(xi)的(de)(de)檢索及下載;另一方(fang)面還提供了一些生(sheng)物信(xin)息(xi)(xi)學(xue)分(fen)(fen)析工(gong)具(ju),比如(ru)基于質(zhi)(zhi)譜的(de)(de)脂質(zhi)(zhi)定(ding)性工(gong)具(ju),通過給定(ding)特定(ding)的(de)(de)m/z或二級譜圖等信(xin)息(xi)(xi),可以(yi)預測可能的(de)(de)脂質(zhi)(zhi)分(fen)(fen)子等等。對于脂質(zhi)(zhi)組學(xue)初學(xue)者,LIPID MAPS是一個(ge)非(fei)常好的(de)(de)學(xue)習(xi)平(ping)臺。
13、Lipidblast (//fiehnlab.ucdavis.edu/projects/LipidBlast) Lipidblast是(shi)由美(mei)國加州大學戴維(wei)斯(si)分(fen)(fen)校(xiao)的(de)(de)(de)Oliver Fiehn實驗室于(yu)2013年(nian)在Nature Methods上發表(biao)的(de)(de)(de)基于(yu)計算機(ji)模擬的(de)(de)(de)脂(zhi)質(zhi)(zhi)組學理論數(shu)據庫,可用于(yu)注釋和鑒定植物、細菌、藻類、動(dong)物、人類、病毒中的(de)(de)(de)數(shu)百種(zhong)脂(zhi)質(zhi)(zhi)。該(gai)數(shu)據庫適(shi)用于(yu)各種(zhong)低分(fen)(fen)辨率和高分(fen)(fen)辨率儀器。目前(qian)包含29類常見脂(zhi)質(zhi)(zhi),含有119341種(zhong)化合物以及212685張MS/MS譜圖,可作為Lipidmaps分(fen)(fen)析的(de)(de)(de)補(bu)充。
14、LipidBank (//lipidbank.jp/) LipidBank是一個開放的(de)、公(gong)開免費的(de)天(tian)(tian)然(ran)脂(zhi)質數(shu)據庫(ku),包括脂(zhi)肪(fang)酸、甘油脂(zhi)、鞘脂(zhi)、類固醇和各種維生素。該數(shu)據庫(ku)包含6000多(duo)種獨特的(de)分(fen)子(zi)結(jie)構(gou)(ChemDraw cdx格式、MDL MOL格式)及其脂(zhi)質名稱(通用名稱、IUPAC),光譜信息(質量、UV、IR、NMR等)與文獻信息。該數(shu)據庫(ku)只(zhi)納(na)入天(tian)(tian)然(ran)脂(zhi)質分(fen)子(zi),并且所(suo)有分(fen)子(zi)信息均由脂(zhi)質研究專家(jia)手動整理和批準。
15、ChemFOnt (//www.chemfont.ca) 化(hua)學(xue)(xue)功(gong)能本(ben)體論(ChemFOnt)是基(ji)(ji)于GO數(shu)據(ju)庫衍(yan)生的,描述(shu)了>341 000種(zhong)生物(wu)重要化(hua)學(xue)(xue)物(wu)質(zhi)的功(gong)能和(he)作(zuo)用,幾乎包含(han)(han)HMDB的代(dai)(dai)謝物(wu),目前包含(han)(han)390萬(wan)個(ge)蛋白(bai)質(zhi)-化(hua)學(xue)(xue)關系(xi)(xi)和(he)1030萬(wan)個(ge)化(hua)學(xue)(xue)-功(gong)能關系(xi)(xi)。ChemFOnt能夠幫助統一(yi)化(hua)學(xue)(xue)品和(he)化(hua)學(xue)(xue)屬(shu)性的描述(shu),從而創建更全面的生化(hua)系(xi)(xi)統計算模(mo)型,更好地(di)將功(gong)能化(hua)學(xue)(xue)信息(xi)整合(he)到代(dai)(dai)謝組學(xue)(xue)、蛋白(bai)質(zhi)組學(xue)(xue)、基(ji)(ji)因組學(xue)(xue)和(he)宏基(ji)(ji)因組學(xue)(xue)數(shu)據(ju)分析工(gong)作(zuo)流程中。 由于該(gai)數據(ju)庫(ku)支持范圍(wei)有限(xian),目前僅支持部分化(hua)學(xue)(xue)元素和(he)化(hua)學(xue)(xue)鍵,無(wu)法顯示(shi)所有化(hua)學(xue)(xue)結(jie)構;ChemFont可(ke)(ke)能(neng)與某些軟件和(he)平臺不兼容,需要(yao)(yao)額外的(de)配置才(cai)能(neng)正常(chang)使用(yong);此外,使用(yong)ChemFont需要(yao)(yao)學(xue)(xue)習其特(te)定(ding)的(de)符號和(he)規則,對于初學(xue)(xue)者來說(shuo)可(ke)(ke)能(neng)學(xue)(xue)習成(cheng)本高。
16、PubChem (//pubchem.ncbi.nlm.nih.gov) PubChem 是世界上最大(da)(da)的免(mian)費訪問化(hua)(hua)學(xue)信(xin)息(xi)集合。PubChem主要包(bao)含小分子化(hua)(hua)合物(wu),但(dan)也包(bao)含較大(da)(da)的分子,例如核苷(gan)酸、碳水(shui)化(hua)(hua)合物(wu)、脂質、肽和(he)(he)化(hua)(hua)學(xue)修飾的大(da)(da)分子。用戶可以(yi)按名稱(cheng)、分子式、結(jie)構和(he)(he)其他標(biao)識符搜索化(hua)(hua)學(xue)品,也可以(yi)查找(zhao)有關化(hua)(hua)學(xue)和(he)(he)物(wu)理性(xing)質、生(sheng)物(wu)活性(xing)、安全(quan)性(xing)和(he)(he)毒(du)性(xing)數據、專利、文(wen)獻引用等信(xin)息(xi)。
17、ChemSpider (//www.chemspider.com/) ChemSpider是(shi)一個免費(fei)的化學結(jie)(jie)構數據庫,提供數百(bai)個數據庫的1億多(duo)個結(jie)(jie)構的快(kuai)速文本和(he)結(jie)(jie)構式檢(jian)索。它為(wei)化學工作者(zhe)提供了較全的理論與實驗(yan)數據,包括光譜、熔(rong)點(dian)、沸(fei)點(dian)等物(wu)(wu)理性質。對于(yu)藥化或藥物(wu)(wu)設計的人來說,依據靶點(dian)檢(jian)索化合物(wu)(wu)也是(shi)很有用的功能。
18、ChEBI (//www.ebi.ac.uk/chebi/aboutChebiForward.do) Chemical Entities of Biological Interest (ChEBI)是一個(ge)收錄生物(wu)(wu)(wu)醫學(xue)(xue)(xue)(xue)相(xiang)關化(hua)(hua)學(xue)(xue)(xue)(xue)條(tiao)目的(de)(de)(de)數(shu)據庫(ku),ChEBI的(de)(de)(de)目標是提供一個(ge)綜合(he)(he)(he)的(de)(de)(de)、可(ke)訪問(wen)的(de)(de)(de)化(hua)(hua)學(xue)(xue)(xue)(xue)實(shi)體(ti)資(zi)源(yuan),以(yi)支(zhi)持生物(wu)(wu)(wu)科學(xue)(xue)(xue)(xue)研(yan)究(jiu)。該數(shu)據庫(ku)涵蓋了(le)(le)廣泛的(de)(de)(de)化(hua)(hua)學(xue)(xue)(xue)(xue)實(shi)體(ti),包(bao)括小分子化(hua)(hua)合(he)(he)(he)物(wu)(wu)(wu)、天然產物(wu)(wu)(wu)、合(he)(he)(he)成物(wu)(wu)(wu)、標準化(hua)(hua)合(he)(he)(he)物(wu)(wu)(wu)以(yi)及(ji)其他生物(wu)(wu)(wu)分子,并包(bao)含了(le)(le)豐富的(de)(de)(de)屬性信(xin)息,如(ru)化(hua)(hua)學(xue)(xue)(xue)(xue)結(jie)構、分子質量、化(hua)(hua)學(xue)(xue)(xue)(xue)式、化(hua)(hua)學(xue)(xue)(xue)(xue)命名等(deng)。它在(zai)藥物(wu)(wu)(wu)研(yan)究(jiu)、藥物(wu)(wu)(wu)設計、代謝(xie)途徑預測(ce)、化(hua)(hua)學(xue)(xue)(xue)(xue)信(xin)息檢(jian)索等(deng)方面發(fa)揮了(le)(le)重(zhong)要的(de)(de)(de)作用。
19、MiMeDB (//mimedb.org) 微(wei)(wei)(wei)生(sheng)(sheng)物(wu)(wu)(wu)(wu)代謝(xie)(xie)(xie)物(wu)(wu)(wu)(wu)數(shu)據(ju)(ju)庫(MiMeDB)作為(wei)一個(ge)獨特的多(duo)組學(xue)數(shu)據(ju)(ju)庫,它(ta)(ta)匯集了有關人類(lei)微(wei)(wei)(wei)生(sheng)(sheng)物(wu)(wu)(wu)(wu)組、代謝(xie)(xie)(xie)組(人類(lei)和(he)微(wei)(wei)(wei)生(sheng)(sheng)物(wu)(wu)(wu)(wu))、蛋(dan)白質組(人類(lei)和(he)微(wei)(wei)(wei)生(sheng)(sheng)物(wu)(wu)(wu)(wu))和(he)基因組(微(wei)(wei)(wei)生(sheng)(sheng)物(wu)(wu)(wu)(wu))的廣泛(fan)信(xin)息。它(ta)(ta)旨在用于(yu)代謝(xie)(xie)(xie)組學(xue)、臨(lin)床(chuang)化(hua)學(xue)、生(sheng)(sheng)物(wu)(wu)(wu)(wu)標志(zhi)物(wu)(wu)(wu)(wu)發現中的應用。MiMeDB可(ke)鏈接到包括FooDB、HMDB、KEGG、PubChem、MetaCyc、ChEBI、UniProt、ChemFOnt等在內的15個(ge)其他數(shu)據(ju)(ju)庫。該數(shu)據(ju)(ju)庫易于(yu)搜索、瀏覽和(he)導航。目前包含24254種(zhong)化(hua)合物(wu)(wu)(wu)(wu)、1904種(zhong)微(wei)(wei)(wei)生(sheng)(sheng)物(wu)(wu)(wu)(wu)、648861種(zhong)光譜、626種(zhong)疾(ji)病、3112種(zhong)參考(kao)文獻的信(xin)息。