2020-08-18
近(jin)日收到不(bu)少(shao)老(lao)師的郵件(jian)和電話,咨詢如何將細菌(jun)基(ji)因(yin)(yin)組denovo測序數據(ju)上(shang)傳至NCBI?攻(gong)略千千萬(wan)、眼花繚亂,不(bu)知道該選擇(ze)哪個是好(hao)?對于初次(ci)上(shang)傳基(ji)因(yin)(yin)組的小白(bai)來說,這個確實有點犯難。
別著急,小(xiao)編整理了細菌基(ji)因組denovo上(shang)傳至NCBI的完整流程,保證簡單、高(gao)效又方便(bian)。
基(ji)本流程
1、NCBI注冊
注冊網(wang)站:
//www.ncbi.nlm.nih.gov/account/register/?back_url=http%3A%2F%2Fwww.ncbi.nlm.nih.gov%2Fhome%2Fsubmit.shtml&partners-uri=cms:/account/partners
打開NCBI注(zhu)冊網站,按照網頁上(shang)的要(yao)求(qiu)進(jin)(jin)行個人信息填寫(xie),需要(yao)注(zhu)意的是此處要(yao)填寫(xie)郵(you)箱(xiang),一般不建議使用qq郵(you)箱(xiang)、163郵(you)箱(xiang)和foxmail郵(you)箱(xiang),因為這些郵(you)箱(xiang)經常會存在接(jie)收不到(dao)NCBI郵(you)件的現象。所有信息都填寫(xie)完成后點擊Create account,郵(you)箱(xiang)會接(jie)收到(dao)NCBI發過來的網站,打開此網站進(jin)(jin)行激活(huo)即可完成賬號注(zhu)冊。
2、基(ji)本信息填(tian)寫
打開(kai)NCBI官網(wang)//www.ncbi.nlm.nih.gov/,輸(shu)入(ru)賬(zhang)號和密碼(ma),點擊網(wang)頁上的(de)Submit欄(lan)可(ke)進(jin)入(ru)GenBank界面,找到細菌基因組提(ti)交(jiao)欄(lan),點擊進(jin)入(ru)即(ji)可(ke)開(kai)始本次的(de)提(ti)交(jiao)(或直接點擊//submit.ncbi.nlm.nih.gov/subs/genome/進(jin)入(ru)提(ti)交(jiao)界面)。
具體(ti)步(bu)驟(zou)如(ru)下:
1、點擊New submission進入(ru),此步操作可以得到SUB號;
2、選擇Single genome(因為(wei)細菌denovo測序是(shi)針對單個(ge)基(ji)因組(zu)進(jin)行的(de)),點擊continue;
3、進(jin)入SUBMITTER完善個人信(xin)息,此處的郵(you)(you)箱仍然不建議使用qq郵(you)(you)箱、163郵(you)(you)箱和foxmail郵(you)(you)箱;
4、General Information信息填寫(此處以未申請BioProject和BioSample號為例(li),如果已經申請過可(ke)以直(zhi)接(jie)將對應的(de)BioProject和BioSample號直(zhi)接(jie)填寫即可(ke)):
(1)BioProject和BioSample處選(xuan)擇NO,釋放數據(ju)日期(qi)可根據(ju)自己的需要來(lai)進(jin)行選(xuan)擇;
(2)組裝和測序信息填寫(可(ke)根據結題(ti)報告上給出的信息進(jin)行填寫):
細菌框(kuang)架(jia)圖(tu)項目的組(zu)裝軟(ruan)件:A5-Miseq,版本V20160825;Spades,版本V3.12;
細菌完成圖項目(mu)的組(zu)裝軟件:Fyle,版(ban)本(ben)V2.5;CANU,版(ban)本(ben) V1.7.1;
(3)測序深(shen)度及測序平臺的選擇:
測序深度=測序數據量/基因組大小(我司結題報告上一般會給出);
測(ce)序平(ping)臺(tai):二代一般為Illumina平(ping)臺(tai);三(san)代一般為Pacbio/Nanopore平(ping)臺(tai);
(4)填(tian)寫(xie)基因組(zu)的組(zu)裝信息以及是否有(you)關(guan)聯的文章,填(tian)寫(xie)完成后(hou)點擊Continue進入下(xia)一步;
3、BioProject信息(xi)填寫
菌(jun)(jun)株英文描述(大概100個左右(you)word ):描述下(xia)(xia)該菌(jun)(jun)株進(jin)行全基(ji)因組測序的目的、意(yi)義(yi)及用途(工業/農業/醫療(liao)等(deng)等(deng))等(deng)信(xin)息(共(gong)性\不(bu)同),填(tian)寫完成后(hou)點擊(ji)Continue進(jin)入下(xia)(xia)一(yi)步;
4、BioSample信(xin)息填寫
1、選擇Microbe,點擊Continue進入下一(yi)步;
2、BioSample Attributes:填寫物種拉丁名(ming)稱及(ji)菌株(zhu)名(ming);菌株(zhu)的來(lai)源,保存單位(xxx單位分離及(ji)分離信(xin)息(xi) xxx單位保存或 xxx保藏中心(xin)保存)和樣(yang)本收集時間;
3、source:是否需要NCBI注釋——選擇Yes;
5、Sequence上傳,信息(xi)填寫
1、Files:細菌(jun)完成(cheng)圖(tu)如果(guo)只(zhi)組(zu)(zu)裝出一條染色體,沒有質粒(li)可選擇選項(xiang)1;細菌(jun)框架圖(tu)組(zu)(zu)裝出多(duo)條contig或細菌(jun)完成(cheng)圖(tu)組(zu)(zu)裝出了(le)多(duo)條完整的染色體/質粒(li)可選擇選項(xiang)2;
2、選擇(ze)網(wang)頁版上(shang)傳(chuan)(chuan),并將基因組中(zhong)的(de)染色體和質(zhi)粒的(de)fasta文件全(quan)部上(shang)傳(chuan)(chuan),上(shang)傳(chuan)(chuan)后點擊(ji)Continue進入(ru)下(xia)一步;
3、Assignment:需要確(que)認組裝得到的(de)(de)(de)染(ran)色體(ti)有(you)幾條(tiao)、是(shi)(shi)否含有(you)質(zhi)粒(li),染(ran)色體(ti)和質(zhi)粒(li)是(shi)(shi)否為完整的(de)(de)(de)環狀的(de)(de)(de),以及Sequence ID需要與fasta文件中>后名(ming)字一致。在提交質(zhi)粒(li)信息的(de)(de)(de)時候,質(zhi)粒(li)的(de)(de)(de)命名(ming)為以“P”開(kai)頭的(de)(de)(de)名(ming)字或(huo)者命名(ming)為unnamed、unnamed1......
4、填寫作者名(ming)字及排序,以及該(gai)基因組(zu)是否有相關聯(lian)的文章(zhang),點擊(ji)Continue進入下一步;
6、數據提交
核查已填入的(de)(de)信息是否(fou)有誤,有問題的(de)(de)話返回對應的(de)(de)界面(mian)進行修改,確(que)認無誤后點擊Submit完成(cheng)本次(ci)NCBI上(shang)傳。一般上(shang)傳一個(ge)星(xing)期內NCBI會(hui)發郵件到郵箱(xiang),給出相應的(de)(de)登(deng)錄號,這個(ge)登(deng)錄號可直接用(yong)于后續的(de)(de)文章中。
以上(shang)就是細菌基因(yin)組上(shang)傳至NCBI的(de)詳細步驟(zou),是不(bu)是已(yi)經學(xue)會了(le)?趕快用自己的(de)數據來(lai)試試吧!如果大家在上(shang)傳過程(cheng)中有任何疑問,歡迎和我們一起探討,可在文末(mo)留言(yan)或(huo)者(zhe)郵件交流(microsupport@doudin.cn)。
下(xia)(xia)一期(qi)我們將介紹《小(xiao)基因組(zu)上(shang)傳NCBI的(de)流程(cheng)》,感興趣的(de)老師(shi)可以提前預定哦,我們下(xia)(xia)期(qi)不見不散。