2021-07-08
單(dan)(dan)細(xi)胞(bao)測序技術的(de)出現使我們能夠(gou)從一(yi)個新的(de)維度去理解細(xi)胞(bao)的(de)行為,包(bao)括命(ming)運(yun)決定,發育過渡(du),以及對脅迫和疾病的(de)反(fan)應,ScRNA-seq數據(ju)分(fen)析(xi)(xi)從降維、聚類和細(xi)胞(bao)定義開(kai)始,在此基礎之上再開(kai)展(zhan)差異分(fen)析(xi)(xi)、富集分(fen)析(xi)(xi)、細(xi)胞(bao)通訊等(deng)各種(zhong)高級和個性(xing)化分(fen)析(xi)(xi)。做過項目的(de)老師一(yi)定深有(you)感觸,在單(dan)(dan)細(xi)胞(bao)聚類分(fen)群(qun)(qun)后,如何定義每一(yi)類細(xi)胞(bao)群(qun)(qun)是(shi)整(zheng)個單(dan)(dan)細(xi)胞(bao)分(fen)析(xi)(xi)的(de)基礎,也是(shi)重中之重,但同(tong)時(shi)也是(shi)非常(chang)耗時(shi)、非常(chang)復雜的(de)一(yi)步(bu)。
那么(me)具體如何(he)鑒(jian)定(ding)不同(tong)cluster的(de)(de)細胞(bao)類(lei)(lei)型(xing)呢?通用(yong)的(de)(de)方法有(you)兩(liang)種(zhong)(zhong)(zhong):一(yi)(yi)種(zhong)(zhong)(zhong)是通過細胞(bao)類(lei)(lei)型(xing)特異性表達的(de)(de)marker基(ji)因識(shi)別(bie);第(di)二(er)種(zhong)(zhong)(zhong)是建立已知(zhi)細胞(bao)類(lei)(lei)型(xing)的(de)(de)轉錄譜(pu)數據(ju)庫,將未(wei)知(zhi)細胞(bao)類(lei)(lei)型(xing)的(de)(de)表達譜(pu)數據(ju)與(yu)之比(bi)較(jiao)相似性,推測它最(zui)有(you)可能是哪(na)種(zhong)(zhong)(zhong)細胞(bao)。第(di)一(yi)(yi)種(zhong)(zhong)(zhong)方法需要(yao)人工(gong)收集marker基(ji)因比(bi)對各個(ge)cluster的(de)(de)顯著高表達基(ji)因綜合(he)分析,第(di)二(er)種(zhong)(zhong)(zhong)方法可以使用(yong)SingleR包自(zi)動(dong)識(shi)別(bie)細胞(bao)類(lei)(lei)型(xing)。建議(yi)兩(liang)種(zhong)(zhong)(zhong)方法結合(he)起來進行(xing)細胞(bao)鑒(jian)定(ding)。 在正式介紹鑒定方法之前我們首先來明確一下細胞類型鑒定的目的: 1、確定單(dan)細胞測(ce)序樣本的異(yi)質性(xing)組成,比如腫瘤微環境; 2、針對性分析研究單細胞測序數據(ju); 3、從測序結(jie)果中找到(dao)新的(de)細胞(bao)類型。 一、 人工鑒定細胞類型 首先需(xu)要清楚(chu)(chu)用于單細(xi)(xi)胞(bao)(bao)(bao)測序的(de)樣(yang)本中主要包(bao)含(han)(han)(han)哪(na)些(xie)細(xi)(xi)胞(bao)(bao)(bao)類(lei)型,例如(ru)PBMC樣(yang)本,包(bao)含(han)(han)(han)T細(xi)(xi)胞(bao)(bao)(bao)、B細(xi)(xi)胞(bao)(bao)(bao)、單核(he)細(xi)(xi)胞(bao)(bao)(bao)、粒細(xi)(xi)胞(bao)(bao)(bao);腫(zhong)瘤樣(yang)本可能會(hui)包(bao)含(han)(han)(han)腫(zhong)瘤細(xi)(xi)胞(bao)(bao)(bao)、上皮(pi)(pi)細(xi)(xi)胞(bao)(bao)(bao)、內皮(pi)(pi)細(xi)(xi)胞(bao)(bao)(bao)、成纖維細(xi)(xi)胞(bao)(bao)(bao)等,如(ru)果對(dui)所研究的(de)組織包(bao)含(han)(han)(han)哪(na)些(xie)細(xi)(xi)胞(bao)(bao)(bao)類(lei)型不(bu)是很清楚(chu)(chu),可以參(can)考數據庫,例如(ru)Cellmarker。一些(xie)常見(jian)的(de)marker基因如(ru)下: 或可依據細胞周期、細胞的遷移以及分化(hua)狀(zhuang)態(tai)鑒定(如下圖) 二、 SingleR軟件自動識別細胞類型 SingleR是(shi)一個(ge)(ge)基于R包(bao)的(de)(de)軟件(jian),具有豐富的(de)(de)參(can)考數據(ju)(區分主(zhu)類(lei)型(xing)(xing)和子類(lei)型(xing)(xing)、單細胞(bao)型(xing)(xing)和群體(ti)型(xing)(xing)):A、HPCA:hand-annotated Human Primary Cell Atlas(手工注釋的(de)(de)人類(lei)原始細胞(bao)圖(tu)譜),包(bao)含37個(ge)(ge)主(zhu)要類(lei)型(xing)(xing)、157個(ge)(ge)亞型(xing)(xing)以及713個(ge)(ge)樣(yang)本;B、BluePrint+ENCODE:24個(ge)(ge)主(zhu)要類(lei)型(xing)(xing)、43個(ge)(ge)亞型(xing)(xing)、259個(ge)(ge)bulk轉(zhuan)錄組測序樣(yang)本;C、小鼠(shu):ImmGen和mouse.rnaseq數據(ju)庫。 軟件(jian)會根據每個細胞(bao)或cluster的基因表達均值與(yu)樣本之(zhi)間(jian)的相(xiang)關(guan)性進行(xing)鑒定。對于(yu)(yu)每種(zhong)細胞(bao)類型(xing),使用(yong)其表達中(zhong)值大于(yu)(yu)所有其他細胞(bao)類型(xing)中(zhong)前N個基因表達中(zhong)值的細胞(bao)進行(xing)關(guan)聯,每種(zhong)細胞(bao)類型(xing)的SingleR得(de)分是相(xiang)關(guan)性的80%。循(xun)環往復(fu),最后(hou)以得(de)分最高的為準。 以上(shang)就是關于細胞類型鑒定的兩(liang)種方法分享啦,大(da)家在判定的過程中(zhong)最好(hao)是將兩(liang)者(zhe)結(jie)合起來,祝(zhu)各位一(yi)判一(yi)個(ge)準(zhun)兒~