2024-08-05
SRA(Sequence Read Archive)作為NCBI用于保存大規模測序原始(shi)(shi)數(shu)(shu)據(ju)的(de)(de)數(shu)(shu)據(ju)庫,也是絕大多數(shu)(shu)轉錄(lu)組(zu)文(wen)章上(shang)傳原始(shi)(shi)數(shu)(shu)據(ju)的(de)(de)較(jiao)優選擇。這里我們整理(li)了單細胞(bao)轉錄(lu)組(zu)原始(shi)(shi)數(shu)(shu)據(ju)上(shang)傳SRA的(de)(de)超簡單方法(fa),5分鐘(zhong)讓你成為平(fei)平(chang)無(li)奇(hai)的(de)(de)數(shu)(shu)據(ju)上(shang)傳小天才!
1.NCBI登錄
1.1 進(jin)入網址://www.ncbi.nlm.nih.gov/,然后點(dian)擊右(you)上(shang)角的log in進(jin)行登錄(lu);
1.2 如(ru)果您沒有NCBI的賬號,可(ke)以(yi)進行(xing)申請,或者使用其他登錄方式(shi):
1.3 登錄完成(cheng)后依次點擊submit,如(ru)下:
1.4 點擊(ji)new submission,創建新的(de)上傳(chuan)任務(wu)單;
2.信息填寫(xie)
2.1 接下來就是信息(xi)填寫了,只要根據網站提示填寫相應內(nei)容即(ji)可(ke)。首先是個(ge)人(ren)信息(xi),*為必填選(xuan)項(xiang),包括名字,郵(you)(you)(you)箱(這里(li)盡量不要使(shi)用qq郵(you)(you)(you)箱,以(yi)避免無法(fa)正常接收郵(you)(you)(you)件),以(yi)及學校信息(xi)等,填寫完成后點擊(ji)繼續。
2.2 接下來填(tian)寫(xie)General Information,這里(li)主要(yao)填(tian)寫(xie)是否已經(jing)注(zhu)冊BioProject和BioSample的信息,沒有(you)申請直接選擇NO即可。另外可以(yi)根據(ju)(ju)您(nin)的需要(yao),選擇數據(ju)(ju)是上傳后(hou)立即公布(bu),還是指定日期(qi)公布(bu),填(tian)寫(xie)完成后(hou)點擊繼續(xu)。
2.3 之后(hou)填(tian)寫(xie)項(xiang)目(mu)信息,*為(wei)必填(tian)項(xiang),填(tian)寫(xie)項(xiang)目(mu)標題及項(xiang)目(mu)信息,根(gen)據老師的項(xiang)目(mu)情況及實驗處(chu)理進行填(tian)寫(xie)即可。非必填(tian)內容可以直接跳過,點擊continue繼續(xu)。
2.4 選擇樣本(ben)類型,如植物、動物、人、細(xi)菌等(deng),這里(li)我們以(yi)人類Human為例,選好后點擊continue繼續。
2.5 接下(xia)來需要提(ti)交(jiao)BioSample attributes,這(zhe)里有在線填(tian)寫(xie)和下(xia)載(zai)表格填(tian)寫(xie)兩種方式。這(zhe)里我們推薦(jian)下(xia)載(zai)表格填(tian)寫(xie)。
所(suo)有的信(xin)息(xi)根(gen)據提示及項(xiang)(xiang)目情況進行(xing)填(tian)寫(xie)即(ji)可(ke)(ke)。綠色字(zi)段為必填(tian)項(xiang)(xiang),如(ru)缺少相關信(xin)息(xi),如(ru)任何必填(tian)項(xiang)(xiang)沒有資料,可(ke)(ke)以填(tian)寫(xie)'not collected', 'not applicable' 或 'missing';;黃(huang)色字(zi)段則為非必填(tian)項(xiang)(xiang)。(注意,這里信(xin)息(xi)如(ru)果填(tian)寫(xie)不符(fu)合規范(fan),上(shang)傳(chuan)后會報錯,只(zhi)需根(gen)據提示的信(xin)息(xi)對表格(ge)內容進行(xing)相應(ying)修改后重新上(shang)傳(chuan)即(ji)可(ke)(ke))。
2.6 下(xia)一步輸(shu)入SRA Metadata信息,還是可以(yi)(yi)選(xuan)擇線上填(tian)(tian)寫或下(xia)載(zai)表格填(tian)(tian)寫,這(zhe)里還是以(yi)(yi)表格填(tian)(tian)寫為(wei)例。參照示例填(tian)(tian)寫相(xiang)關信息后,點擊continue繼(ji)續(xu)。
以(yi)人類(lei)肝臟空轉舉例,單細(xi)胞或空間轉錄組(zu)數據在紅框部(bu)分選擇如截(jie)圖所示即可,測序儀器和型號可咨詢(xun)公(gong)司確定,其他樣本信息可自行填寫;
File name就是(shi)原始數(shu)據的名稱,雙端測序應該(gai)有R1和R2兩(liang)個(ge)名字;
3.數(shu)據上傳(chuan)
3.1 終于(yu)到了(le)最(zui)后一(yi)步上傳(chuan)(chuan)數據啦!老(lao)師根據自己(ji)的數據情況,選擇(ze)適(shi)合(he)的上傳(chuan)(chuan)方式即可。如(ru)果數據較少,可以選擇(ze)直接網頁(ye)上傳(chuan)(chuan);單(dan)細胞轉錄(lu)組數據一(yi)般較大,這里推薦Aspera方法上傳(chuan)(chuan)數據:
3.2 準備好原始數據(ju),原始數據(ju)都是xxx.fastq格式;
3.3 準(zhun)備Aspera上傳所(suo)需(xu)相關文件(jian);
軟件下(xia)載路(lu)徑(jing)和操作步驟(zou)(zou)ncbi頁(ye)面上都會有(you)(請看下(xia)面截(jie)圖),以下(xia)是中文(wen)操作步驟(zou)(zou):
1)下載key file文件(一般會是一個aspera.openssh文件),放在一個固定的位置(zhi)。
2)在本地(di)找到(dao)ascp.exe程(cheng)序位置。可(ke)以(yi)先(xian)在應(ying)用里(li)找到(dao)Aspera Connect軟(ruan)件,右鍵點(dian)擊“屬(shu)性”找到(dao)Aspera Connect快捷方式,再次右鍵點(dian)擊“屬(shu)性”進(jin)入,里(li)面會看到(dao)有ascp.exe程(cheng)序。
比如我的是在C:\Users\psn\AppData\Local\Programs\IBM\Aspera Connect\bin里面。
3)在這個文件夾里面(mian)(ascp.exe程(cheng)序所(suo)(suo)在位置文件夾),在文件夾的空白處,按(an)住shift鍵 同(tong)時鼠(shu)標(biao)右擊,打開power shell命(ming)(ming)令窗口(kou)。然(ran)后(hou)輸入(ru)命(ming)(ming)令行(ncbi頁面(mian)上的):ascp.exe -i <key_file< font="">文件所(suo)(suo)在路徑(jing)> -QT -l100m -k1 -d <需要(yao)上傳的原始數據所(suo)(suo)在路徑(jing)> subasp@upload.ncbi.nlm.nih.gov:uploads/caihong.song_outlook.com_I6Ezp1wv
舉例我(wo)的(de):
.\ascp.exe -i V:\tmp\202402\AAA_ST-seq\aspera.openssh -QT -l100m -k1 -d V:\tmp\202402\AAA_ST-seq\rawdata subasp@upload.ncbi.nlm.nih.gov:uploads/caihong.song_outlook.com_I6Ezp1wv
注意:輸入的命令(ling)行(xing)就是ncbi頁(ye)面上的命令(ling)行(xing),注意最前面要(yao)額外加(jia)上.\。每個(ge)人的都(dou)不一樣,只是需要(yao)把標黃標綠的位置,替換(huan)成我們存放(fang)這些文件的位置路(lu)徑即可。
4)然后(hou)數(shu)據(ju)就會自動上傳了,顯(xian)示100%時表(biao)明上傳完畢;
5)數(shu)據上傳(chuan)成(cheng)功(gong)后(hou),最后(hou)一(yi)步(bu)檢查(cha)一(yi)下(xia)上傳(chuan)信(xin)息是否(fou)有誤,確定(ding)沒問題的話點擊(ji)submit,我們(men)的上傳(chuan)工作(zuo)就完成(cheng)啦,接下(xia)來就靜(jing)靜(jing)的等(deng)待NCBI發(fa)送郵件給我們(men)了。
注意:如果數據上傳中出現了無法修(xiu)改的(de)錯(cuo)誤(wu),或遲遲沒有審核完(wan)成的(de)情況,大家都可以發(fa)郵件給(gei)NCBI進(jin)行咨詢。
本(ben)期單細胞轉錄組原始數據(ju)SRA上傳教學已結束,大家都學會了嗎(ma)?