2020-01-07
2020年已經到啦,新年快樂!新的一年,順利拿到轉錄組測序結果的小伙伴們,趁著年關,都開始忙活起數據的深度挖掘了,這一開始搞數據,各種各樣的問題就隨之而來,比如:
哎(ai)呀,我找(zhao)到的(de)這些基因,怎么把它們對應(ying)的(de)表達量,差(cha)異結果和注釋放在一張表里呢??
這(zhe)個多組差異基因(yin)在一(yi)起(qi)的表(biao)格,沒有注釋(shi)呢,怎么加上去??
下面(mian),咱們就來看看用EXCEL的(de)(de)函數,簡單(dan)快(kuai)捷(jie)的(de)(de)實現(xian),將多個表(biao)格里面(mian),相同(tong)的(de)(de)基因ID對應的(de)(de)信(xin)息整理在一起。
1、首先(xian)通(tong)過差異倍(bei)數(shu)或(huo)者(zhe)GO和KEGG的(de)富集分析結果,挑選(xuan)出一些目的(de)基因,示(shi)例如下(xia):
2、添加表達量信(xin)息,打開expression表格,總表中是所有基因(yin)(yin)的(de)reads count和FPKM,我們(men)將FPKM添加到目(mu)的(de)基因(yin)(yin)表格中:
3、在1中(zhong)的(de)表格(ge)的(de)B列,輸入=VLOOKUP(可以將(jiang)不(bu)同表格(ge)對(dui)(dui)應起來的(de)值,需要對(dui)(dui)應的(de)信(xin)息(xi)所(suo)在的(de)表格(ge),對(dui)(dui)應后需要輸出的(de)信(xin)息(xi)在表格(ge)的(de)哪一列,匹配時使(shi)用精確匹配)
對應在表(biao)格中(zhong)即為=VLOOKUP(A2(即1中(zhong)的(de)(de)基(ji)因(yin)ID,因(yin)為兩個(ge)表(biao)格可以對應的(de)(de)是基(ji)因(yin)ID),[Expression.xlsx]Sheet1!$A:$F(需(xu)要對應的(de)(de)是Expression.xlsx表(biao)格的(de)(de)Sheet1的(de)(de)A-F列,也可以選(xuan)擇全表(biao)),4(即需(xu)要輸出的(de)(de)是第一個(ge)樣(yang)本的(de)(de)FPKM值,該(gai)結果在選(xuan)中(zhong)的(de)(de)表(biao)達(da)量(liang)的(de)(de)表(biao)格的(de)(de)區域,在第4列的(de)(de)位置(zhi)),FALSE(即匹(pi)配時使用精確匹(pi)配))
這樣(yang)就可(ke)以(yi)直接目的(de)基因在獲得KB樣(yang)本的(de)FPKM值,同理可(ke)以(yi)在下一(yi)列輸入:
=VLOOKUP(A2(即1中的(de)(de)(de)(de)基因(yin)ID,因(yin)為兩個(ge)(ge)表(biao)格可(ke)以對(dui)應(ying)的(de)(de)(de)(de)是基因(yin)ID),[Expression.xlsx]Sheet1!$A:$F(需要對(dui)應(ying)的(de)(de)(de)(de)是Expression.xlsx表(biao)格的(de)(de)(de)(de)Sheet1的(de)(de)(de)(de)A-F列,也可(ke)以選擇全表(biao)),6(即需要輸出的(de)(de)(de)(de)是第(di)二個(ge)(ge)樣本的(de)(de)(de)(de)FPKM值(zhi),該結果在選中的(de)(de)(de)(de)表(biao)達量的(de)(de)(de)(de)表(biao)格的(de)(de)(de)(de)區域,在第(di)6列的(de)(de)(de)(de)位置),FALSE(即匹配(pei)時(shi)使用精確匹配(pei))),從而(er)獲(huo)得F列Gab樣本的(de)(de)(de)(de)FPKM:
4、按照相同的(de)方法,可以將基(ji)因的(de)注釋(shi)也(ye)加入到第一部分的(de)目的(de)基(ji)因表格中,需要的(de)信息在annotation表中的(de)話,注釋(shi)表格如(ru)下:
輸入:
=VLOOKUP(A2(即(ji)1中的(de)(de)(de)基(ji)因ID,因為兩個表(biao)(biao)格(ge)可以對應的(de)(de)(de)是基(ji)因ID),[Annotation.xlsx]Sheet1!$1:$1048576(需要(yao)對應的(de)(de)(de)是Annotation.xlsx]表(biao)(biao)格(ge)的(de)(de)(de)Sheet1的(de)(de)(de)全(quan)表(biao)(biao)),7(即(ji)需要(yao)輸(shu)出(chu)的(de)(de)(de)基(ji)因的(de)(de)(de)名(ming)字,該結果(guo)在選(xuan)中的(de)(de)(de)表(biao)(biao)格(ge)的(de)(de)(de)區域的(de)(de)(de)第7列的(de)(de)(de)位置),FALSE(即(ji)匹配時使用精確匹配))
5、第一(yi)行(xing)的第一(yi)個基因需(xu)要的信息均調取(qu)過(guo)來后,可以點(dian)擊單(dan)元(yuan)格的右下角(jiao),出(chu)現“+“后,雙擊,即可獲得所有行(xing)的信息:
按照以(yi)上的(de)方(fang)法,基(ji)本可(ke)以(yi)實現同一個(ge)基(ji)因(yin),在不(bu)同表(biao)格(ge)中(zhong)的(de)信息(xi)(xi)的(de)調取(qu),不(bu)管是(shi)表(biao)達量,注釋信息(xi)(xi)還是(shi)其他的(de)對應信息(xi)(xi)都(dou)可(ke)以(yi)按照此(ci)方(fang)法操作,如此(ci)實用(yong)的(de)技(ji)巧趕緊(jin)get起來!!
!!!但是需要(yao)注意的一點(dian)!!!
一定要保證(zheng),做對應(ying)關系的(de)(de)值,即(ji)上文所(suo)說的(de)(de)基(ji)因(yin)ID,也可(ke)以是其他的(de)(de),像基(ji)因(yin)name等(deng),該值在對應(ying)的(de)(de)需(xu)要搜索的(de)(de)表(biao)(biao)格中(zhong),即(ji)上述提到的(de)(de)表(biao)(biao)達量的(de)(de)表(biao)(biao),注釋表(biao)(biao),或者其他需(xu)要對應(ying)的(de)(de)表(biao)(biao)中(zhong),必須是選擇區域的(de)(de)第一列(lie),如下面所(suo)示:
目標基因(yin)的信(xin)息提供的是gene name,需要(yao)調取的是基因(yin)的ID,
對應的(de)注釋(shi)表格,應該將name放(fang)到需要的(de)信息gene id的(de)前面才可(ke)以使用。