2024-04-25
經過近(jin)半(ban)年的研(yan)(yan)(yan)發、測試與驗證,派森(sen)諾全新一代(dai)代(dai)謝組學(xue)數據(ju)庫——PerSonalbio Next-Generation Metabolomics Database(簡(jian)稱PSNGM)現已正式(shi)上線啟用(yong)。該代(dai)謝數據(ju)庫采用(yong)創新型(xing)模(mo)式(shi)構建,不僅來源(yuan)豐富、容(rong)量巨大,更(geng)重要的是包含了(le)醫學(xue)、動物(wu)、植(zhi)物(wu)、微生物(wu)、腸道菌群及中藥(yao)6大分類庫,95%以上代(dai)謝物(wu)可實(shi)現RT假陽性過濾,該庫的研(yan)(yan)(yan)發旨在為客(ke)戶提供更(geng)為精準、可靠且(qie)高深度的代(dai)謝組學(xue)分析結(jie)果(guo),助力代(dai)謝組學(xue)技術(shu)在各研(yan)(yan)(yan)究(jiu)領域(yu)取得更(geng)為卓(zhuo)越的研(yan)(yan)(yan)究(jiu)成(cheng)果(guo)。
派(pai)森諾PSNGM代(dai)謝庫組成及特點(dian)
PSNGM代(dai)謝(xie)數據庫的(de)主要特(te)點
1、來源豐富,MSMS圖譜數(shu)量(liang)龐大
除了傳(chuan)統的(de)(de)商(shang)業庫(ku)(ku)、公共(gong)庫(ku)(ku)及標(biao)準(zhun)品自建庫(ku)(ku),PSNGM庫(ku)(ku)集合了40+的(de)(de)資(zi)源(yuan)庫(ku)(ku),利用精(jing)準(zhun)、強悍(han)的(de)(de)AI模型打造了龐大的(de)(de)MSMS圖(tu)譜庫(ku)(ku),極大的(de)(de)補(bu)充了基于(yu)標(biao)準(zhun)品庫(ku)(ku)數(shu)量的(de)(de)限制,使(shi)得(de)可(ke)靠的(de)(de)代謝物(Saleh Alseekh等[1]發布的(de)(de)最新鑒定(ding)標(biao)準(zhun):Level A-B)鑒定(ding)深度(du)大幅提升。
2、分類齊全(quan),涵蓋各個研究(jiu)領域
PSNGM庫(ku)準確的(de)將(jiang)所包含的(de)代謝物(wu)分為了6大類:醫學、動(dong)物(wu)、植物(wu)、微(wei)(wei)生物(wu)、腸(chang)道菌群及中藥庫(ku),幾乎涵蓋(gai)了生命科學各個研究領(ling)域(yu),分庫(ku)的(de)關鍵作(zuo)用(yong)可(ke)進一步提升代謝物(wu)鑒(jian)定的(de)可(ke)靠性,降低假陽性幾率。
6大(da)分類庫容量(liang)
3、3D定性,讓(rang)代謝物定性更準
PSNGM庫(ku)(ku)采用先進AI算法,可(ke)實現庫(ku)(ku)中95%以上代謝物具(ju)備可(ke)靠RT參考,可(ke)很好(hao)的降低代謝物鑒定的假陽性(xing)。LC-MS平(ping)臺的一級質譜(pu)MS1、二級質譜(pu)MS2和保留時間RT是(shi)定性(xing)最關鍵(jian)的3個參數,絕大部(bu)分(fen)情況下只有自建標(biao)準(zhun)品(pin)庫(ku)(ku)才能實現3D定性(xing),但自建標(biao)準(zhun)品(pin)庫(ku)(ku)由于標(biao)準(zhun)品(pin)的原(yuan)因容量非常(chang)有限(xian)。
Georgios Theodoridis[2]等(deng)人于(yu)2023年在國(guo)際(ji)知名期(qi)刊《Analytical Chemistry》上發表了(le)一(yi)篇關于(yu)代(dai)(dai)謝組學的(de)(de)(de)重要論文,文章集(ji)中(zhong)揭露了(le)基于(yu)LC-MS技(ji)術的(de)(de)(de)代(dai)(dai)謝物(wu)鑒定(ding)(ding)中(zhong)存在的(de)(de)(de)行業亂象,列舉(ju)了(le)一(yi)系列典型錯誤案(an)例(li),如將農藥、殺蟲劑等(deng)工(gong)業化學品(pin)誤報為生物(wu)標志物(wu),或將僅存在于(yu)植物(wu)體內的(de)(de)(de)代(dai)(dai)謝物(wu)錯誤識別為哺乳(ru)動物(wu)的(de)(de)(de)生物(wu)標記(ji)物(wu)等(deng),這些現象在當前(qian)代(dai)(dai)謝組學研究中(zhong)十分常見。代(dai)(dai)謝物(wu)定(ding)(ding)性過程中(zhong)存在的(de)(de)(de)準確(que)性、高假陽性率等(deng)問(wen)題,亟待引(yin)起業界重視并尋求改善措施,而采用分類庫和3D定(ding)(ding)性是直接(jie)有效的(de)(de)(de)方(fang)法(fa)。
PSNGM庫代謝(xie)物定性示例:鏡像圖上方(fang)為(wei)樣品采集(ji)的實際(ji)圖譜(pu),下方(fang)為(wei)數據庫中圖譜(pu)
4、完善而豐富的標簽信息,讓(rang)結(jie)果解讀更輕松
PSNGM庫包含代(dai)謝物的化學分類、主流數(shu)據庫ID、各類結構編碼、Biogenic、DBSource、中文名等豐富的標簽信息,讓(rang)數(shu)據分析(xi)更(geng)便捷、更(geng)輕松。
5、個(ge)性化定制,讓研究更精準
PSNGM代謝(xie)庫(ku)(ku)(ku)的能力不僅僅局限(xian)于6大分類庫(ku)(ku)(ku),還可以實(shi)現個性化(hua)定制庫(ku)(ku)(ku),例(li)如黃酮庫(ku)(ku)(ku)、全(quan)氟和多氟烷基物(wu)質(zhi)(PFASs)庫(ku)(ku)(ku)、氧(yang)化(hua)脂質(zhi)庫(ku)(ku)(ku)、暴露組庫(ku)(ku)(ku)、小分子藥物(wu)庫(ku)(ku)(ku)等(deng),讓研(yan)究(jiu)結果更精準(zhun)。
歷經數十年發展,代謝組學已取得顯著進步,但其深入應用仍受制于兩大核心瓶頸:一是代謝物鑒定的深度不足,目前僅能觸及約5-10%的鑒定率[3];二是鑒定的準確性受限,由于同分異構體等復雜情況導致假陽性結果頻現。這兩方面困境在很大程度上取決于所使用代謝數據庫的容量規模與功能性能。正因如此,派森諾公司推出了新一代數據庫PSNGM,其設計宗旨在于針對性地突破上述瓶頸,顯著提升代謝物鑒定的廣度與精度。
現實研究中,部分研究者易于陷入片面追求代謝物數量而忽視鑒定準確性的思維陷阱。須知,若代謝物定性環節即存在偏差,更多的鑒定數量非但無法增益研究,反而可能導致研究結果偏離,乃至得出錯誤的結論與見解。這一問題已引起學術界的廣泛關注,如Georgios Theodoridis[2]等人明確呼吁:強化代謝物鑒定的嚴謹性與標準化報告至關重要,此舉將有力鞏固代謝組學作為一門科學的內在價值與可信度。PSNGM代謝庫現已正式上線啟用,其仍在不斷完善和優化中,期望能為更多學者的代謝組學研究提供更有利的保障和支持。
參考文獻(xian):
1.Alseekh S, Aharoni A, Brotman Y, et al. Mass spectrometry-based metabolomics: a guide for annotation, quantification and best reporting practices[J]. Nature methods, 2021, 18(7): 747-756.
2.Theodoridis G, Gika H, Raftery D, et al. Ensuring fact-based metabolite identification in liquid chromatography–mass spectrometry-based metabolomics[J]. Analytical Chemistry, 2023, 95(8): 3909-3916.
3.da Silva R R, Dorrestein P C, Quinn R A. Illuminating the dark matter in metabolomics[J]. Proceedings of the National Academy of Sciences, 2015, 112(41): 12549-12550.