admin管理员组

文章数量:1443558

Peaks 根据组蛋白修饰模式进行分类

看到了这么一篇文章

《S100A8/S100A9 cytokine acts as a transcriptional coactivator during breast cellular transformation》

Link: /

作者根据组蛋白修饰模式定义的不同类型调控区域,对 S100A8/A9 峰进行了分类。最终分为 Promoter, Enhancer,Repressed 和 Other 区。

这里涉及一个基本知识点:

组蛋白修饰是染色质结构和基因表达调控的重要机制之一。不同的组蛋白修饰在基因组的不同区域具有特定的功能和作用。以下是一些常见的组蛋白修饰及其功能:

H3K4me1(组蛋白 H3 第 4 位赖氨酸单甲基化):

  • 功能:通常与增强子区域相关联,是活性增强子标志之一。
  • 作用:标志潜在的增强子区域,参与调控基因的转录起始。

H3K4me3(组蛋白 H3 第 4 位赖氨酸三甲基化):

  • 功能:与启动子区域相关联,是活跃基因的启动子标志。
  • 作用:参与转录起始复合物的招募,促进基因转录。

H3K27me3(组蛋白 H3 第 27 位赖氨酸三甲基化):

  • 功能:与基因沉默相关联,是抑制性标志。
  • 作用:标志沉默基因区域,通过聚合酶抑制和染色质结构改变抑制基因表达。

H3K27ac(组蛋白 H3 第 27 位赖氨酸乙酰化):

  • 功能:与活性增强子和启动子相关联。
  • 作用:标志活跃的增强子和启动子区域,促进开放染色质结构和基因表达。

H3K36me3(组蛋白 H3 第 36 位赖氨酸三甲基化):

  • 功能:与转录延伸相关联。
  • 作用:标志转录活跃区域,参与 RNA 聚合酶 II 的延伸过程。

H3K9me3(组蛋白 H3 第 9 位赖氨酸三甲基化):

  • 功能:与异染色质形成相关联,是沉默性标志。
  • 作用:参与异染色质形成,抑制基因表达,维持基因组稳定性。

这些组蛋白修饰通过改变染色质结构、影响转录因子和聚合酶的招募,来调控基因表达。它们在细胞分化、发育、疾病发生等过程中发挥关键作用。不同的修饰组合和定位形成了复杂的染色质状态,精细调控基因组功能。

因此我们在相同的实验条件下,转录因子结合区域有这些修饰,就代表着这些区域是什么功能,除了传统意义上根据参考基因组来分类,根据这些组蛋白修饰位点进行分类不失是一种合理的方式。

我们简单的复刻这张图。

简单的分为以下几个步骤。

Step1 : 获取 S100A8/S100A9 peaks

原文中给出了数据提交:GSE155421

根据信息我们进行分组:

代码语言:javascript代码运行次数:0运行复制
EtOH_S100A8_ChIP EtOH_S100A8_Input  EtOH_S100A9_ChIP EtOH_S100A9_Input 
         2                 2                 3                 3 
TAM_S100A8_ChIP  TAM_S100A8_Input   TAM_S100A9_ChIP  TAM_S100A9_Input 
         3                 3                 3                 3 

接下来,老规矩运行常规程序。

  • 质控
  • BWA 比对
  • MACS3 callpeak

Step2: 获取组蛋白修饰 peaks

这部分的数据是:GSE100259

同样的,我们进行老三步:质控、BWA 比对、MACS3 callpeak。得到每个组蛋白修饰的bed 文件。

Step3: Peaks 分类

图中可以看出,作者关注的是峰顶左右 2000 bp 的范围,因为我们先使用 S100A8/S100A9 的peaks 峰位点与组蛋白修饰 peaks 区交集,看是否在其范围内,在其范围内我们就认定其为某一类。具体哪些修饰代表哪些分类,原文有参考说明,想用在自己文章里就去模仿一下方法就好啦。

我这里因为这个数据量比较大,所以我简单我挑选了一些文件做了这一步分析。

我们可以使用 bedtools工具,生成我们的分类区间。

代码语言:javascript代码运行次数:0运行复制
bedtools intersect -a EtOH_S100A8.bed -b H3K4me3_peaks.narrowPeak > promoter.bed

bedtools intersect -a EtOH_S100A8.bed -b H3K4me1_peaks.narrowPeak > enhancer.bed

其实这一步就可以进行统计结果了。

最后使用 computeMatrix 和 plotHeatmap 进行可视化。

代码语言:javascript代码运行次数:0运行复制
computeMatrix reference-point \ 
       --referencePoint center \
       -b 2000 -a 2000 \
       -R promoter.bed enhancer.bed \
       -S EtOH_S100A8.bw EtOH_H3K4me1.bw EtOH_H3K4me3.bw \
       --skipZeros \
       -o matrix1_TSS.gz \
       --outFileSortedRegions regions1_H3K4me3_l2r_genes.bed
代码语言:javascript代码运行次数:0运行复制
plotHeatmap -m matrix1_TSS.gz \
     -out ExampleHeatmap.png \
     --whatToShow 'heatmap and colorbar'

最后成图是我自己的原因造成的,想尝试一下可以自己动手试试。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-03-24,如有侵权请联系 cloudcommunity@tencent 删除程序工具可视化数据统计

本文标签: Peaks 根据组蛋白修饰模式进行分类