国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

單細胞數據的新視角:用NMF解構隱藏的基因特征

2025-01-10

1、背 景

非(fei)負(fu)矩陣分解(jie)(jie)(NMF)是一種(zhong)分析高維(wei)數據的(de)(de)方法,它(ta)通過將高維(wei)的(de)(de)基(ji)(ji)因(yin)表達(da)矩陣分解(jie)(jie)為(wei)低維(wei)的(de)(de)特征矩陣和(he)系(xi)數矩陣,提取出隱藏(zang)在數據中(zhong)的(de)(de)主要特征和(he)模式(shi)。目(mu)前常(chang)用(yong)于單細胞數據中(zhong)識別基(ji)(ji)因(yin)表達(da)的(de)(de)潛在模式(shi)和(he)多個樣本中(zhong)穩健的(de)(de)基(ji)(ji)因(yin)程(cheng)序(MP),尤其適合分析異質性極高的(de)(de)的(de)(de)腫瘤細胞中(zhong)的(de)(de)基(ji)(ji)因(yin)程(cheng)序。軟件由瑞士洛(luo)桑大學的(de)(de)Santiago J. Carmona團隊(dui)開發,目(mu)前發布在//github.com/carmonalab/GeneNMF。

2、分(fen)析方(fang)法與流程

GeneNMF 分析主(zhu)要包括(kuo)三個步驟:

A.不同樣本的(de)非負(fu)矩(ju)陣分解

B.?基(ji)因模(mo)塊(kuai)聚類和分群

C.確定基因模塊功能

流程示例如下:

圖1 GeneNMF 分析流程

在實際項目分(fen)(fen)析(xi)中,我們會根據(ju)單細胞scRNA分(fen)(fen)析(xi)得到(dao)的(de)(de)(de)(de)RDS文件,提(ti)取過濾后(hou)的(de)(de)(de)(de)data信(xin)息(xi)來進行(xing)每個(ge)分(fen)(fen)組(推薦sample)的(de)(de)(de)(de)NMF分(fen)(fen)析(xi);然后(hou)根據(ju)每個(ge)基(ji)(ji)因模塊之間的(de)(de)(de)(de)成(cheng)對相似性對基(ji)(ji)因程(cheng)序聚類和(he)可視(shi)化;最(zui)后(hou)對每個(ge)基(ji)(ji)因程(cheng)序的(de)(de)(de)(de)基(ji)(ji)因進行(xing)富集分(fen)(fen)析(xi)和(he)Ucell打分(fen)(fen),評估(gu)不(bu)同基(ji)(ji)因程(cheng)序的(de)(de)(de)(de)生物學意義。

3、結(jie)果(guo)示例

3.1基因程序聚類熱圖

軟(ruan)件首先會根據數(shu)(shu)據分(fen)(fen)(fen)組信息,對(dui)每(mei)個樣本在多個K值(分(fen)(fen)(fen)解(jie)基數(shu)(shu)量,也(ye)可(ke)以(yi)是(shi)預期細(xi)胞類(lei)型(xing)數(shu)(shu)量等)水(shui)平上分(fen)(fen)(fen)別進行NMF分(fen)(fen)(fen)析(xi),以(yi)保證識別到基因(yin)模塊的穩健性(xing)。然后根據基因(yin)模塊間(jian)的余弦(xian)相似性(xing)聚類(lei)得到基因(yin)程序(xu),這里可(ke)以(yi)自定義聚類(lei)結果的程序(xu)數(shu)(shu)。

圖2 基因程(cheng)序聚類熱圖

我(wo)們同時(shi)也會輸出每(mei)個基(ji)因程(cheng)(cheng)序的基(ji)因和(he)權(quan)重的gene2weight_anno.xls表格,方便初(chu)步確定(ding)基(ji)因程(cheng)(cheng)序基(ji)因的功(gong)能。

表1 基因(yin)程序(xu)注(zhu)釋表格(ge)

3.2基因(yin)程序(xu)的特征打分

得到(dao)基因(yin)(yin)(yin)程(cheng)(cheng)序(xu)(xu)后,我們可(ke)以將每個基因(yin)(yin)(yin)程(cheng)(cheng)序(xu)(xu)作為(wei)一個基因(yin)(yin)(yin)集進行Ucell打(da)分,查看不同分組(zu)下某些基因(yin)(yin)(yin)程(cheng)(cheng)序(xu)(xu)是(shi)否在單個樣本中富集,或(huo)(huo)者不同的基因(yin)(yin)(yin)程(cheng)(cheng)序(xu)(xu)在某些分組(zu)中有較高得分。結合不同樣本或(huo)(huo)細胞類(lei)型的臨床數(shu)據,可(ke)以探究基因(yin)(yin)(yin)程(cheng)(cheng)序(xu)(xu)與不同性狀間的關聯(lian)。

圖3 基因(yin)程序(xu)不(bu)同分(fen)組小提琴圖

3.3打分(fen)聚類(lei)圖(tu)展示

為(wei)了(le)方便查看(kan)不同(tong)(tong)分組的打分情況,軟(ruan)件會根據Ucell打分進行(xing)降(jiang)維(wei)聚類。因(yin)為(wei)這里的基因(yin)程序是在(zai)多個樣(yang)(yang)本中發現的,因(yin)此重新(xin)降(jiang)維(wei)聚類可能(neng)是減輕樣(yang)(yang)本間批(pi)次效(xiao)應的一(yi)種有效(xiao)方法(fa)。展示(shi)結果如下圖所示(shi),通過(guo)對比不同(tong)(tong)分組的打分高(gao)低,進一(yi)步確(que)認不同(tong)(tong)類型的細胞和基因(yin)程序的關聯(lian)。

圖5 Ucell打(da)分Feature圖

3.4基因程序的富集分析(xi)

最后(hou),我們會(hui)對(dui)每個基因(yin)程序的(de)基因(yin)與GO/KEGG數據(ju)庫(ku)進(jin)行富(fu)集分析,以確定不(bu)(bu)同(tong)基因(yin)程序參與和影響哪些生(sheng)物學過(guo)程。這(zhe)里(li)也可以選擇物種(zhong)的(de)marker基因(yin)集,輔(fu)助判定不(bu)(bu)同(tong)的(de)細(xi)胞類型。

圖4 每(mei)個(ge)基因(yin)程序的基因(yin)富(fu)集分析

通過GeneNMF分(fen)析,我們可(ke)以(yi)更(geng)好地理(li)解細(xi)胞的異(yi)質性和功能多樣性,目前該算法已經廣泛應(ying)用于(yu)單細(xi)胞的細(xi)胞亞群識別、基因模塊發現(xian)以(yi)及多樣本數據整合等分(fen)析。

參考文獻

[1]//www.biorxiv.org/content/10.1101/2024.05.31.596823v1

[2]Barkley, D., Moncada, R., Pour, M.et al.Cancer cell states recur across tumor types and form specific interactions with the tumor microenvironment.Nat Genet 54, 1192–1201(2022).

[3]Gavish, A., Tyler, M., Greenwald, A.C.et al.Hallmarks of transcriptional intratumour heterogeneity across a thousand tumours.Nature 618, 598–606 (2023)