2020-05-21
燃(ran)情五月,各(ge)地逐步(bu)落(luo)實開學(xue)計劃,科(ke)學(xue)研(yan)究(jiu)的(de)步(bu)伐也是時候大步(bu)邁開了,今夏(xia)最火(huo)熱的(de)代(dai)謝組(zu)學(xue)研(yan)究(jiu)你安排(pai)上了嗎?提前(qian)了解代(dai)謝組(zu)結果(guo),堅定(ding)我們代(dai)謝組(zu)研(yan)究(jiu)的(de)決心。今天帶你走進代(dai)謝組(zu)學(xue)研(yan)究(jiu),一(yi)文搞定(ding)代(dai)謝組(zu)數(shu)據看不懂的(de)問題。
1. 基(ji)峰圖(tu)(Base Peak Chromatogram,BPC):經色譜分(fen)離(li)流出的(de)組分(fen)不斷進入質譜,質譜連續掃(sao)描(miao)進行數據采集。每(mei)一次掃(sao)描(miao)得到(dao)一張質譜圖(tu),選擇每(mei)張質譜圖(tu)中強度最大的(de)離(li)子連續描(miao)繪,以(yi)離(li)子強度為縱坐標、時(shi)間為橫坐標,得到(dao)的(de)圖(tu)譜。
2. 總離(li)子流(liu)圖(tu)(Total ion chromatogram ,TIC):總離(li)子流(liu)隨時(shi)(shi)間變化(hua)的(de)(de)圖(tu)譜。在TIC中(zhong),縱(zong)坐標表示(shi)收集存儲(chu)離(li)子的(de)(de)電流(liu)總強度(du),橫坐標表示(shi)離(li)子的(de)(de)生成時(shi)(shi)間或連續掃(sao)描的(de)(de)掃(sao)描次數。
3. TIC和BPC都是對于樣品(pin)整體信息的反(fan)映,一般(ban)情(qing)況下(xia)BPC圖(tu)(tu)比TIC圖(tu)(tu)要(yao)漂亮,所以文章(zhang)里(li)面很多時候會用到(dao)BPC圖(tu)(tu)。但是有的學者認為BPC圖(tu)(tu)不(bu)是樣品(pin)真實的反(fan)映,所以不(bu)接受BPC,只(zhi)接受TIC。
4. 如果想挑選任意樣本展示在一張圖中,只需使(shi)用(yong)特(te)定的軟件打(da)開代謝組原始文件就(jiu)可以導出BPC圖或者(zhe)TIC圖。
1. 質(zhi)(zhi)量(liang)控制(zhi)(QC):在(zai)進(jin)行(xing)基于質(zhi)(zhi)譜技(ji)術的(de)代謝(xie)組學研究時,為(wei)了獲得可靠且高質(zhi)(zhi)量(liang)的(de)代謝(xie)組學數據(ju)(ju),通常需(xu)進(jin)行(xing)質(zhi)(zhi)量(liang)控制(zhi)(quality control, QC)。QC只是對(dui)樣(yang)本檢測結(jie)果所做的(de)一個展示,并未對(dui)數據(ju)(ju)進(jin)行(xing)篩(shai)選(xuan)和“漂洗”等(deng)操作。
2. 質量保證(zheng)(QA):為了發現生(sheng)物標(biao)記(ji)(ji)物,潛(qian)在的(de)(de)特征峰在QC樣(yang)本中的(de)(de)相(xiang)對(dui)標(biao)準偏差(relative standard deviation,RSD),即變異系數不能超過30%,如果超過的(de)(de)話,相(xiang)關(guan)特征峰應(ying)予以刪(shan)(shan)除。所(suo)以,在QC基(ji)礎上(shang),通常會(hui)進行QA,用(yong)來刪(shan)(shan)除QC樣(yang)本中重復性差的(de)(de)特征峰(features),以便獲得更(geng)高(gao)質量的(de)(de)數據集(ji),更(geng)有利于生(sheng)物標(biao)記(ji)(ji)物的(de)(de)檢(jian)測。
3. 總(zong)結:QC是(shi)為了發現問題,檢(jian)查在樣本檢(jian)測(ce)過(guo)程中是(shi)否(fou)存在異常;QA是(shi)為了篩選(xuan)更可信(xin)的特征峰進行(xing)后續(xu)分析(xi)。
由于代謝(xie)組數(shu)據(ju)具有多維(wei)且某些變(bian)量(liang)間高(gao)度相關(guan)的特點(dian),運用傳統的單變(bian)量(liang)分(fen)(fen)析(xi)無(wu)法快速、充分(fen)(fen)、準確地挖掘數(shu)據(ju)內潛在(zai)的信(xin)息。因此在(zai)分(fen)(fen)析(xi)代謝(xie)組數(shu)據(ju)需要(yao)運用化學計量(liang)學原理和(he)多元統計的方法,對(dui)采集的多維(wei)數(shu)據(ju)進行降維(wei)和(he)歸類分(fen)(fen)析(xi),從而挖掘提煉出最(zui)有用的信(xin)息。
目(mu)前(qian)主流(liu)的代謝(xie)組多元統(tong)計分析具體會進行如(ru)下三步曲:
1. 主成(cheng)分(fen)分(fen)析 (Principal Component Analysis, PCA):觀察所有樣(yang)本(ben)之間的(de)總體分(fen)布(bu)趨勢,找出可能存(cun)在的(de)離散點。
2. 偏最小二(er)乘(cheng)判(pan)別(bie)分(fen)(fen)析(xi)(xi) (Partial Least Squares-Discriminant Analysis, PLS-DA):目前代謝組學數據分(fen)(fen)析(xi)(xi)中最常使用(yong)的(de)(de)(de)一種分(fen)(fen)類方法(fa),它在降維的(de)(de)(de)同時結合了回歸模型,并利用(yong)一定(ding)的(de)(de)(de)判(pan)別(bie)閾值對回歸結果進行判(pan)別(bie)分(fen)(fen)析(xi)(xi)。
3. 正交(jiao)-偏最小二乘(cheng)判別(bie)分析 (Orthogonal Partial Least Squares Discriminant Analysis, OPLS-DA):代謝組(zu)(zu)學數據(ju)分析中另一種常用的(de)方法,是PLS-DA的(de)擴展,可最大程度查看組(zu)(zu)間差異(yi)。
1. 聚(ju)類分(fen)(fen)析(xi)被用于判斷代謝(xie)(xie)物在不(bu)(bu)同(tong)(tong)實驗(yan)條件下(xia)的(de)(de)代謝(xie)(xie)模式(shi)(shi)。以(yi)不(bu)(bu)同(tong)(tong)實驗(yan)條件下(xia)代謝(xie)(xie)物的(de)(de)相對值為(wei)代謝(xie)(xie)水(shui)平,做(zuo)層次聚(ju)類(hierarchical clustering)分(fen)(fen)析(xi),結果(guo)以(yi)熱(re)圖(tu)表(biao)示。熱(re)圖(tu)表(biao)現的(de)(de)是一個數據(ju)(ju)矩陣(zhen),通(tong)過(guo)使用顏(yan)色(se)梯(ti)度使數據(ju)(ju)間的(de)(de)差異實現可視(shi)化,通(tong)過(guo)數據(ju)(ju)縮放,保留較(jiao)大(da)差異,同(tong)(tong)時也能突顯(xian)較(jiao)小(xiao)差異。不(bu)(bu)同(tong)(tong)顏(yan)色(se)的(de)(de)區域代表(biao)不(bu)(bu)同(tong)(tong)的(de)(de)聚(ju)類分(fen)(fen)組(zu)信(xin)息,同(tong)(tong)組(zu)內的(de)(de)代謝(xie)(xie)模式(shi)(shi)相似,可能具有相似的(de)(de)功能或(huo)參與相同(tong)(tong)的(de)(de)生(sheng)物學過(guo)程。因此通(tong)過(guo)將(jiang)代謝(xie)(xie)模式(shi)(shi)相同(tong)(tong)或(huo)者相近的(de)(de)代謝(xie)(xie)物聚(ju)成(cheng)類,可以(yi)用來推(tui)測(ce)已知(zhi)或(huo)未知(zhi)代謝(xie)(xie)物的(de)(de)生(sheng)物學功能。
2. 將(jiang)所(suo)有(you)樣本及相(xiang)關數據進(jin)行(xing)距離矩陣計算,并(bing)(bing)采(cai)用層次(ci)聚類(lei)(hierarchical cluster)對所(suo)有(you)樣本進(jin)行(xing)聚類(lei),形成表現樣本間相(xiang)似度的(de)(de)樹狀圖。層次(ci)聚類(lei)指的(de)(de)是從下而上地(di)合(he)并(bing)(bing)cluster,具體(ti)而言,就是每(mei)次(ci)找到距離最短的(de)(de)兩個(ge)cluster,然后進(jin)行(xing)合(he)并(bing)(bing)成一(yi)個(ge)大的(de)(de)cluster,直到全部(bu)合(he)并(bing)(bing)為(wei)一(yi)個(ge)cluster,整個(ge)過程(cheng)就是建立一(yi)個(ge)樹結(jie)構(gou)的(de)(de)過程(cheng)。
3. 總結:代謝物層次聚類(lei)(lei)分(fen)析(xi)主(zhu)要是用(yong)來(lai)將代謝物據成類(lei)(lei),觀察代謝物分(fen)群(qun)的(de)情況;樣本樹狀圖分(fen)析(xi)主(zhu)要是用(yong)來(lai)對樣本進行(xing)聚類(lei)(lei),觀察樣本之間的(de)關系(xi)。
差異代(dai)(dai)謝(xie)物(wu)關(guan)(guan)聯分析的(de)(de)(de)目的(de)(de)(de)是研究代(dai)(dai)謝(xie)物(wu)之間(jian)變化(hua)趨勢的(de)(de)(de)一致性(xing),通過計算所有代(dai)(dai)謝(xie)物(wu)兩兩之間(jian)的(de)(de)(de)皮爾森相(xiang)關(guan)(guan)系數或(huo)斯皮爾曼等級(ji)相(xiang)關(guan)(guan)系數來分析各個代(dai)(dai)謝(xie)物(wu)間(jian)的(de)(de)(de)相(xiang)關(guan)(guan)性(xing)。代(dai)(dai)謝(xie)物(wu)相(xiang)關(guan)(guan)性(xing)往往揭示(shi)了(le)代(dai)(dai)謝(xie)物(wu)之間(jian)變化(hua)的(de)(de)(de)協同性(xing):與(yu)某(mou)(mou)類代(dai)(dai)謝(xie)物(wu)變化(hua)趨勢相(xiang)同,則(ze)為正相(xiang)關(guan)(guan);與(yu)某(mou)(mou)類代(dai)(dai)謝(xie)物(wu)變化(hua)趨勢相(xiang)反,則(ze)為負(fu)相(xiang)關(guan)(guan)。