admin管理员组文章数量:1443558
Peaks 根据组蛋白修饰模式进行分类
看到了这么一篇文章
《S100A8/S100A9 cytokine acts as a transcriptional coactivator during breast cellular transformation》
Link: /
作者根据组蛋白修饰模式定义的不同类型调控区域,对 S100A8/A9 峰进行了分类。最终分为 Promoter, Enhancer,Repressed 和 Other 区。
这里涉及一个基本知识点:
组蛋白修饰是染色质结构和基因表达调控的重要机制之一。不同的组蛋白修饰在基因组的不同区域具有特定的功能和作用。以下是一些常见的组蛋白修饰及其功能:
H3K4me1(组蛋白 H3 第 4 位赖氨酸单甲基化):
- 功能:通常与增强子区域相关联,是活性增强子标志之一。
- 作用:标志潜在的增强子区域,参与调控基因的转录起始。
H3K4me3(组蛋白 H3 第 4 位赖氨酸三甲基化):
- 功能:与启动子区域相关联,是活跃基因的启动子标志。
- 作用:参与转录起始复合物的招募,促进基因转录。
H3K27me3(组蛋白 H3 第 27 位赖氨酸三甲基化):
- 功能:与基因沉默相关联,是抑制性标志。
- 作用:标志沉默基因区域,通过聚合酶抑制和染色质结构改变抑制基因表达。
H3K27ac(组蛋白 H3 第 27 位赖氨酸乙酰化):
- 功能:与活性增强子和启动子相关联。
- 作用:标志活跃的增强子和启动子区域,促进开放染色质结构和基因表达。
H3K36me3(组蛋白 H3 第 36 位赖氨酸三甲基化):
- 功能:与转录延伸相关联。
- 作用:标志转录活跃区域,参与 RNA 聚合酶 II 的延伸过程。
H3K9me3(组蛋白 H3 第 9 位赖氨酸三甲基化):
- 功能:与异染色质形成相关联,是沉默性标志。
- 作用:参与异染色质形成,抑制基因表达,维持基因组稳定性。
这些组蛋白修饰通过改变染色质结构、影响转录因子和聚合酶的招募,来调控基因表达。它们在细胞分化、发育、疾病发生等过程中发挥关键作用。不同的修饰组合和定位形成了复杂的染色质状态,精细调控基因组功能。
因此我们在相同的实验条件下,转录因子结合区域有这些修饰,就代表着这些区域是什么功能,除了传统意义上根据参考基因组来分类,根据这些组蛋白修饰位点进行分类不失是一种合理的方式。
我们简单的复刻这张图。
简单的分为以下几个步骤。
Step1 : 获取 S100A8/S100A9 peaks
原文中给出了数据提交:GSE155421
根据信息我们进行分组:
代码语言:javascript代码运行次数:0运行复制EtOH_S100A8_ChIP EtOH_S100A8_Input EtOH_S100A9_ChIP EtOH_S100A9_Input
2 2 3 3
TAM_S100A8_ChIP TAM_S100A8_Input TAM_S100A9_ChIP TAM_S100A9_Input
3 3 3 3
接下来,老规矩运行常规程序。
- 质控
- BWA 比对
- MACS3 callpeak
Step2: 获取组蛋白修饰 peaks
这部分的数据是:GSE100259
同样的,我们进行老三步:质控、BWA 比对、MACS3 callpeak。得到每个组蛋白修饰的bed 文件。
Step3: Peaks 分类
图中可以看出,作者关注的是峰顶左右 2000 bp 的范围,因为我们先使用 S100A8/S100A9 的peaks 峰位点与组蛋白修饰 peaks 区交集,看是否在其范围内,在其范围内我们就认定其为某一类。具体哪些修饰代表哪些分类,原文有参考说明,想用在自己文章里就去模仿一下方法就好啦。
我这里因为这个数据量比较大,所以我简单我挑选了一些文件做了这一步分析。
我们可以使用 bedtools
工具,生成我们的分类区间。
bedtools intersect -a EtOH_S100A8.bed -b H3K4me3_peaks.narrowPeak > promoter.bed
bedtools intersect -a EtOH_S100A8.bed -b H3K4me1_peaks.narrowPeak > enhancer.bed
其实这一步就可以进行统计结果了。
最后使用 computeMatrix 和 plotHeatmap 进行可视化。
代码语言:javascript代码运行次数:0运行复制computeMatrix reference-point \
--referencePoint center \
-b 2000 -a 2000 \
-R promoter.bed enhancer.bed \
-S EtOH_S100A8.bw EtOH_H3K4me1.bw EtOH_H3K4me3.bw \
--skipZeros \
-o matrix1_TSS.gz \
--outFileSortedRegions regions1_H3K4me3_l2r_genes.bed
代码语言:javascript代码运行次数:0运行复制plotHeatmap -m matrix1_TSS.gz \
-out ExampleHeatmap.png \
--whatToShow 'heatmap and colorbar'
最后成图是我自己的原因造成的,想尝试一下可以自己动手试试。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-03-24,如有侵权请联系 cloudcommunity@tencent 删除程序工具可视化数据统计本文标签: Peaks 根据组蛋白修饰模式进行分类
版权声明:本文标题:Peaks 根据组蛋白修饰模式进行分类 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.betaflare.com/biancheng/1748135502a2813829.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论