admin管理员组文章数量:1440174
SpaGene:识别空间模式与配受体共定位
今天来学习一个空转的可以分析配体受体共定位方法(这个方法还可以分析如空间模式spatial patterns,空间高变基因,我比较关注共定位):SpaGene,该方法于2022年9月发表在Genome Res杂志上,文献标题为《Scalable and model-free detection of spatial patterns and colocalization》。
SpaGene 是一种新型的空间组学分析方法,无需依赖模型,能够快速在大规模空间组学研究中识别空间模式。它在分析模拟数据和真实空间转录组学数据时表现优于现有方法,具有更强的分析能力和可扩展性。SpaGene 不仅可以重建未观察到的组织结构,还能通过共定位发现配体 - 受体相互作用,为研究细胞间的相互作用提供了有力工具。原理如下:
- s1.构建空间网络:SpaGene 首先根据空间位置构建一个 k-最近邻图(k-nearest neighbor graph),其中每个节点代表一个细胞或位点。
- s2.提取子网络:对于每个基因,SpaGene 从 k-最近邻图中提取一个子网络,该子网络仅包含该基因高表达的细胞或位点。
- s3.量化子网络的连通性:SpaGene 使用 EMD(Earth Mover's Distance)来量化子网络的连通性。EMD 衡量子网络的度分布与完全连接网络的度分布之间的距离。度分布是指子网络中具有特定度(即连接数)的细胞或位点的比例。EMD 距离越短,表明空间连通性越高。
- s4.比较观察值与随机值:SpaGene 将观察到的 EMD 距离与随机排列后的预期距离进行比较。如果某个基因的 EMD 距离显著短于随机值,则该基因被识别为空间可变基因。
SpaGene的工作原理
通过spagene鉴定到的五种空间模式以及与其他方法性能的比较:
主嗅球(MOB)的空间转录组学结果
SpaGene 在分析主嗅球(main olfactory bulb,MOB)的空间转录组学数据时,成功识别了多个已知的空间可变基因,这些基因在 MOB 的特定层中表达。例如:
- Pcp4 在颗粒细胞层(GCL)中高表达;
- Slc17a7 在嗅球细胞层(MCL)中高表达;
- Cck 在球状层(GL)中高表达;
- Serpine2 在外丛状层(EPL)中高表达;
- Fabp7 在嗅神经层(ONL)中高表达。
基于这些识别出的空间可变基因,SpaGene 成功重建了 MOB 的七层结构:
小鼠小脑的 Slide-seqV2 数据结果
SpaGene 成功识别了四个已知在特定小脑层中表达的空间可变基因:
基因 | 表达层 | 功能描述 |
---|---|---|
Kcnd2 | 颗粒层(Granule Layer, GL) | 该基因在颗粒层中高表达,编码钾电压门控通道亚家族D成员2,与神经元的兴奋性和信号传导相关。 |
Car8 | 浦肯野层(Purkinje Layer, PL) | 在浦肯野层中高表达,编码碳酸酐酶相关蛋白8,与浦肯野细胞的结构和功能相关。 |
Gad1 | 分子层(Molecular Layer, ML) | 主要表达于分子层,编码谷氨酸脱羧酶1,参与γ-氨基丁酸(GABA)的合成,对抑制性神经传递有重要作用。 |
Mbp | 白质(White Matter) | 在白质中高表达,编码髓鞘碱性蛋白,是髓鞘的主要成分之一,对神经纤维的髓鞘化和信号传导至关重要。 |
识别配体-受体相互作用
SpaGene 不仅能够识别空间可变基因,还能扩展用于识别配体-受体相互作用:
- 在主嗅球(MOB)的空间转录组学数据中,SpaGene 识别了 35 对配体-受体相互作用,其中最显著的两对是 IGFBP5-CAV1(p.adjust = 3×10⁻³¹)和 APOE-LRP6(p.adjust = 2×10⁻¹⁸)。这些相互作用主要发生在外神经层(ONL)和颗粒层(GL)之间;
- 在小鼠小脑的 Slide-seqV2 数据中,SpaGene 识别了 13 对配体-受体相互作用,其中最显著的一对是 PSAP-GPR37L1(p.adjust = 1×10⁻²⁷)。
代码实操案例
先来简单学习一波官网的案例:/?.html
安装:
代码语言:javascript代码运行次数:0运行复制## 使用西湖大学的 Bioconductor镜像
options(BioC_mirror=";)
options("repos"=c(CRAN="/"))
library(devtools)
install_github("liuqivandy/SpaGene")
识别高变基因和空间模式
这里的示例数据来自作者的github上:是一个10x visium的空转数据
输入数据为一个count矩阵和空间坐标位置location:
代码语言:javascript代码运行次数:0运行复制## Load the data
load("brain10X/brain10x_raw.rds")
head(location)
count[1:5,1:5]
## Find spatially variable genes and patterns
brain10x_sv <- SpaGene(count,location)
head(brain10x_sv$spagene_res)
# the most significant spt
spagene_res <- brain10x_sv$spagene_res[order(brain10x_sv$spagene_res$adjp),]
head(spagene_res)
# 鉴定空间模式 spatial patterns,设置npattern=15
pattern <- FindPattern(brain10x_sv,nPattern = 15)
PlotPattern(pattern,location,pt.size = 0.5)
pattern的理解: gene similarity with the pattern (genepattern), and the pattern weight (patternw),每个pattern具体的值:
可视化 spatial patterns:
找到每个pattern相关的top5基因,并绘制热图可视化:
代码语言:javascript代码运行次数:0运行复制# Top 5 genes falling into each pattern
top5 <- apply(pattern$genepattern,2,function(x){
names(x)[order(x,decreasing=T)][1:5]
})
dat <- pattern$genepattern[rownames(pattern$genepattern)%in%top5,]
head(dat)
pheatmap(dat,fontsize_row = 6)
共定位分析
所有的 包括人和小鼠的配体受体对可以在这里下载:
代码语言:javascript代码运行次数:0运行复制########################
## Identify colocalized ligand-receptor pairs
library(stringr)
load("LRpair_human.rds")
head(LRpair)
LRpair$ligand_gene_symbol <- str_to_title(LRpair$ligand_gene_symbol)
LRpair$receptor_gene_symbol <- str_to_title(LRpair$receptor_gene_symbol)
brain10x_lr <- SpaGene_LR(count,location,LRpair=LRpair)
# the most signficant colocalized LR pairs
head(brain10x_lr[order(brain10x_lr$adj),])
## Plot Ligand-receptor pair Cck-Cckbr
plotLR(count,location,LRpair=c("Cck","Cckbr"),alpha.min=0.2,pt.size = 1)
在单细胞中鉴定到的配受体对,可以在空转上进一步验证,看其是否具有真实发生的可能~
本文标签: SpaGene识别空间模式与配受体共定位
版权声明:本文标题:SpaGene:识别空间模式与配受体共定位 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/biancheng/1747711665a2748086.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论