国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

小伙用Excel做差異分析

2020-11-18

不少初(chu)次接觸轉錄組測序的(de)小伙(huo)伴,在拿(na)(na)到一份分(fen)析結果,并且興致沖(chong)沖(chong)地(di)打開差異表(biao)達分(fen)析的(de)表(biao)格(ge)后,卻被(bei)一連串(chuan)陌(mo)生的(de)名詞澆滅了科研的(de)熱情:foldchange是(shi)(shi)(shi)什(shen)么?為什(shen)么還有個log2foldchange?Pvalue我(wo)認識,那padj又是(shi)(shi)(shi)什(shen)么?重要的(de)是(shi)(shi)(shi),這(zhe)個basemean到底該怎么理解(jie)?報告里說:basemean是(shi)(shi)(shi)DESeq軟(ruan)件對一個組內所有生物學重復的(de)基(ji)因表(biao)達量(liang)做“均一化”結果,可(ke)是(shi)(shi)(shi)我(wo)拿(na)(na)三(san)個重復的(de)fpkm算了平均數(shu)也對不上啊(a)?


莫慌!我們這就用大家都耳熟能詳的老朋友——Excel,來演示一下DESeq軟件對basemean的計算過程,詳細大家在看完這篇軟文之后會對basemean有一個清晰的認知。

(溫馨提示(shi):文末有(you)“太長(chang)不看總結(jie)版”)


假設我們獲得了一張基因表達量表格(ge),該表格(ge)中共有A1-A3,B1-B3共6個樣品,1-11編號的11個基因,基因表達量以read count值表示(shi):

圖片2.png


1、、對所有read count值取(qu)對數,0值仍記為(wei)0:

圖片3.png


2、計(ji)算每個基因在(zai)6個樣(yang)品中(zhong)的表達量均值(橫向計(ji)算)

圖片4.png


3、用(yong)每個基因的(de)(de)表達量減去(qu)對應的(de)(de)均值,即2-7列的(de)(de)數據(ju)依次減去(qu)第8列的(de)(de)數據(ju)

圖片5.png


4、按樣品取中位數

圖片6.png


5、因為計算(suan)的(de)第一步(bu)取(qu)了(le)對數,所以現在將中位數利用指(zhi)數函數轉(zhuan)換(huan)回(hui)去,記為sizefactor

圖片7.png


6、回到原始的(de)read count表(biao)格,用(yong)每一個數(shu)值除(chu)以(yi)對應樣(yang)品的(de)sizefactor,得(de)到均一化的(de)表(biao)達量

圖片8.png


7、按照分(fen)組方(fang)式(shi)計算平均(jun)數,記(ji)為basemean(這里為了展示方(fang)便保留了兩位(wei)小(xiao)數)

圖片9.png


自此我(wo)們已經得(de)出了A組與B組每個基(ji)因的(de)basemean,接下來通過兩個basemean相(xiang)除,我(wo)們就可以得(de)到差(cha)異(yi)倍數foldchange,再通過負二(er)項分布檢驗,我(wo)們就得(de)到了代表(biao)顯著性的(de)P值和padj值。這樣一張差(cha)異(yi)表(biao)達分析表(biao)是不是就初見雛形了呢(ni)!


“太長不(bu)看(kan)總結版”

從DESeq的basemean的計算原理我們可以知道:

NO.1basemean不(bu)是通(tong)過fpkm計算(suan)的(de)(de),也不(bu)是直(zhi)接求(qiu)平均數(shu)算(suan)的(de)(de),是先(xian)用(yong)read count除(chu)以sizefactor進行均一化,再用(yong)均一化之后的(de)(de)read count按分組(zu)方式計算(suan)平均數(shu)。所以我們說basemean是基因表達量的(de)(de)“均一化”結果,而不(bu)能直(zhi)接說是fpkm的(de)(de)平均數(shu)。

NO.2“牽一(yi)(yi)發(fa)而(er)動全(quan)身”:計算(suan)sizefactor時先通過橫向(xiang)(樣品)計算(suan)Δ值,再通過縱向(xiang)(基(ji)因(yin))找(zhao)出Δ值的(de)中位數,因(yin)此一(yi)(yi)旦(dan)改變任何一(yi)(yi)個樣品或(huo)一(yi)(yi)個基(ji)因(yin),所(suo)有的(de)sizefactor都會(hui)跟(gen)著發(fa)生變化(hua),也就(jiu)(jiu)會(hui)導致(zhi)basemean變化(hua)。理解了(le)這一(yi)(yi)點,我們就(jiu)(jiu)可(ke)以解決這樣的(de)問題了(le):“A VS C和A VS B兩(liang)(liang)個DESeq表,A組(zu)沒有變啊,為(wei)什(shen)么兩(liang)(liang)個表里同一(yi)(yi)個基(ji)因(yin)的(de)basemeanA是(shi)不(bu)同的(de)?”


鄭重申明(ming):本文對于(yu)basemean的計算僅用于(yu)展示(shi)軟(ruan)(ruan)件(jian)分析(xi)原理,實(shi)際(ji)結果請(qing)以派森諾提供的差異(yi)分析(xi)結果為準。