admin管理员组

文章数量:1442498

BD Rhapsody上游定量流程

之前我们分享过10x平台的上游定量分析流程,本文将详细介绍BD Rhapsody平台进行单细胞转录组数据的上游定量分析流程。

1、环境准备:Docker的安装与配置

BD Rhapsody的分析流程依赖于Docker容器技术,确保了软件环境的一致性和可重复性。

安装docker :需要root权限(独享或者共享服务器)。

代码语言:javascript代码运行次数:0运行复制
sudo apt-get update
sudo apt-get install ca-certificates curl gnupg

然后,添加Docker的官方GPG密钥并设置Docker仓库:

代码语言:javascript代码运行次数:0运行复制
sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL  | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
sudo chmod a+r /etc/apt/keyrings/docker.gpg
echo"deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg]  $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

最后,安装Docker Engine:

代码语言:javascript代码运行次数:0运行复制
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

验证Docker:运行以下命令以确认Docker已成功安装:

代码语言:javascript代码运行次数:0运行复制
sudo docker run hello-world

用户权限设置:为避免每次运行Docker命令时都使用sudo,将当前用户添加到Docker组:

代码语言:javascript代码运行次数:0运行复制
sudo groupadd docker
sudo usermod -aG docker $USER
sudo systemctl restart docker

2、准备参考基因组和GTF文件

参考基因组和GTF文件是转录组分析的基础,用于reads的比对和基因表达的定量。这些文件可以从BD官方文档提供的链接或Gencode等数据库下载。

.x_WTA_references/

代码语言:javascript代码运行次数:0运行复制
# 小鼠GRCm38参考基因组下载:
wget .x_WTA_references/GRCm38-PhiX-gencodevM19/GRCm38-PhiX-gencodevM19-20181206.tar.gz
# 小鼠GRCm38GTF下载
.x_WTA_references/GRCm38-PhiX-gencodevM19/gencodevM19-20181206.gtf

# 人类hg19参考基因组下载:
wget .x_WTA_references/hg19/hg19-gencode.tar.gz
# 人类hg19 GTF:
.x_WTA_references/hg19/hg19-gencode.gtf

3、 配置YML文件

YML文件是用于指定分析输入和参数的配置文件。BD Rhapsody提供了一个模板YML文件,根据自己的实验数据进行修改。

复制模板:首先,复制模板文件并重命名为my.yml:

代码语言:javascript代码运行次数:0运行复制
cp template_wta_1.9.1.yml my.yml

编辑YML文件:使用文本编辑器打开my.yml,并根据以下关键部分进行修改:

Reads:指定FASTQ.GZ格式的测序数据文件路径。例如:

代码语言:javascript代码运行次数:0运行复制
Reads:
  - class: File
    location: "/input/sample_R1.fastq.gz"
  - class: File
    location: "/input/sample_R2.fastq.gz"

如果是多个样本:

代码语言:javascript代码运行次数:0运行复制
- class: File
   location: "/input/JZsc1641_S3_L003_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc1641_S3_L003_R2_001.fastq.gz"
 - class: File
   location: "/input/JZsc1672_S3_L004_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc1672_S3_L004_R2_001.fastq.gz"
 - class: File
   location: "/input/JZsc875_S18_L002_R1_001.fastq.gz"
 - class: File
   location: "/input/JZsc875_S18_L002_R2_001.fastq.gz"

Reference_Genome:指定STAR索引的路径(tar.gz格式)。例如:

代码语言:javascript代码运行次数:0运行复制
Reference_Genome:
  class: File
  location: "/reference/GRCm38-PhiX-gencodevM19-20181206.tar.gz"

Transcriptome_Annotation:指定GTF注释文件的路径。例如:

代码语言:javascript代码运行次数:0运行复制
Transcriptome_Annotation:
  class: File
  location: "/reference/gencode.vM31.primary_assembly.annotation-filtered.gtf"

其他参数:根据需要设置细胞计数、subsample和multiplex选项。

例如:

代码语言:javascript代码运行次数:0运行复制
Exact_Cell_Count: 10000
Subsample: 0.01
Sample_Tags_Version: mouse

4、 运行CWL管道

CWL(Common Workflow Language)文件定义了分析流程,cwltool用于执行该流程。

安装CWL Runner:如果尚未安装cwltool,运行:

代码语言:javascript代码运行次数:0运行复制
sudo apt-get update
sudo apt-get install cwltool

运行分析:使用以下命令在后台运行分析:

代码语言:javascript代码运行次数:0运行复制
nohup cwl-runner \
  --outdir ./scRNA-out \
  rhapsody_wta_1.9.1.cwl \
  my.yml \
  2>&1 > test.log &

--outdir ./scRNA-out:指定输出目录。

rhapsody_wta_1.9.1.cwl:CWL文件路径。

my.yml:配置好的YML文件。

nohup和&:确保任务在后台运行。

5、 查看分析结果

分析完成后,结果将保存在./scRNA-out目录下。CRR1211169_Expression_Data.st就是我们所需要的稀疏矩阵。具体的输出文件和格式请参考BD Rhapsody的官方文档。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-03-30,如有侵权请联系 cloudcommunity@tencent 删除官方文档后台配置权限数据

本文标签: BD Rhapsody上游定量流程