2019-09-25
所研究物種是(shi)否(fou)有(you)(you)可用參考基因組(zu)(zu)(zu)是(shi)做轉(zhuan)錄(lu)組(zu)(zu)(zu)測序之前需(xu)要(yao)確認的第一個問題,這決定了我(wo)們(men)是(shi)做有(you)(you)參轉(zhuan)錄(lu)組(zu)(zu)(zu)測序還(huan)是(shi)無(wu)參轉(zhuan)錄(lu)組(zu)(zu)(zu)測序。有(you)(you)參轉(zhuan)錄(lu)組(zu)(zu)(zu)項目會將測到(dao)的轉(zhuan)錄(lu)本序列直接比對(dui)到(dao)參考基因組(zu)(zu)(zu),以確定基因信息;無(wu)參的話,我(wo)們(men)就需(xu)要(yao)借助拼(pin)接軟件,獲得unigene集后(hou)去做注(zhu)釋來獲得基因信息。
基因(yin)組(zu)只有序列(lie)信息(xi)(xi)可以做為(wei)轉錄組(zu)測序的(de)參考基因(yin)組(zu)嗎?答案是不(bu)能哦!轉錄組(zu)測序的(de)參考基因(yin)組(zu)不(bu)僅需(xu)要有序列(lie)信息(xi)(xi),還要有對(dui)應的(de)結構注(zhu)釋(shi)以及功能注(zhu)釋(shi)。
說了這么多,進入正題吧!在(zai)不(bu)知道物種是否有(you)能(neng)參考基因組的(de)情況下,首先推薦大(da)家在(zai)3大主流基因組網站進行查詢:
一、Ensembl數據庫:
//ensembl.org/index.html
由EuropeanBioinformaticsInstitute(EBI)與WellcomeTrustSangerInstitute(WTSI)共同合作開發。物種豐富且更新及時,其基因組文件整理方便做轉錄組分析啦,深得生信工程師恩寵!
以動物(wu)的(de)頁面(mian)為例,人、小鼠和(he)斑馬魚(yu)這類的(de)常用模式物(wu)種,我(wo)們可以直接點(dian)進去看基因組信息(xi)。若ensembl數據庫中有收錄我們要查的物種基因組,點擊view full list of all Ensembl species,我們可以在list中找到我們關注的物種,如果列表中沒有、可直接在搜索框搜索(圖1、圖2)。很多物種擁有不止一個基因組版本,不同基因組版本可能來源于不同的基因組項目,或對應這不同的亞種,進入相應物種頁面之后,我們可以進入到不同的基因組鏈接中進行查看,例如小鼠不同株系的細胞,也是需要在該位置點擊株系列表瀏覽(圖3)。
圖1:
圖2:
圖3:
除(chu)了動物(wu)的(de)以(yi)(yi)外,將頁面拉到最下方,有植物(wu),真菌以(yi)(yi)及細菌基因組庫的(de)超鏈接(jie)哦(圖4)!
圖4:
二、NCBI數據庫:
//www.ncbi.nlm.nih.gov/
NationalCenterforBiotechnologyInformation擁(yong)有較全面(mian)的基(ji)因組,比ensembl更被大家所熟悉。
與(yu)Ensembl不一樣,NCBI的基因組搜索欄可以搜索所有類型的物種。在條件欄選擇genome,然后輸入目標物種拉丁名,點擊后方search就能進入對應的基因組頁面啦,是不是很方便(圖5)!
圖 5:
這里要注意(yi)哦,不是所有搜到的基因(yin)組都(dou)能作為參考基因(yin)組,必須(xu)要有完整的注釋信(xin)息(xi)才行。當目(mu)標物種不止一個基因(yin)組時(shi),我(wo)們(men)需要瀏覽(lan)基因(yin)組列(lie)表(圖6),進入到列表之后,有gene以及protein注釋的才能作為轉錄組的參考基因組(圖7)。原核物種的參考基因組要具體到菌株,所以要看目標菌株是否有參。無參的話也不要緊,做個完成圖或者框架圖就可以作為轉錄組的參考基因組啦(圖8)!
圖 6:
圖 7:
圖 8:
另外,搜索有些物種(zhong)基因組的時候你(ni)會(hui)看(kan)到以下畫面(圖9),這里并不能直接看到gene與protein信息,一般這種情況下表明基因組缺少注釋信息,這個可以進一步查看genebank assembly進行核實(圖10),看顯示文件中是否有cds,protein及RNA等注釋文件,發現該基因組確實缺少注釋信息,只有基因組序列信息(圖11)。
圖 9:
圖10:
圖 11:
三、UCSC數據庫:
//genome.ucsc.edu
由University of California Santa Cruz創立和維護,主要包含了人類、小鼠及果蠅等常見動物基因組信息(圖12)。使用率低于前兩個基因組數據庫。對于不常見的物種,優先選擇前兩個數據庫搜索基因組。
圖 12:
未(wei)完待續,更多(duo)精(jing)彩敬(jing)請(qing)期(qi)待哦(e)……