当前位置: 首页 > news >正文

一行代码绘制高分SCI火山图

一、概述

在近半年中,我读了很多的高分SCI文章,很多文章中都有多种不同的火山图,包括「普通的火山图渐变火山图、以及包含GO通路信息的火山图」!

经过一段时间的文献阅读和资料查询,终于找到了一个好用而且简单的包——ggVolcano, 它是一个基于R语言和ggplot2绘图包开发的生物信息学数据可视化工具。它可以用于绘制火山图(Volcano plot),帮助研究者分析高通量实验数据,如基因表达谱或蛋白质组学数据,以识别差异表达或差异富集的基因或蛋白质。

二、数据集

1. 安装及使用

由于无法直接安装ggVolcano,我们需要下载devtools,通过devtools直接从github下载,代码如下:

# 下载器
install.packages("devtools")
library(devtools)
# 火山图
devtools::install_github("BioSenior/ggvolcano")
library(ggvolcano)
# 拼图
install.packages("patchwork")
library(patchwork)
# 渐变色色彩修改
install.packages("RColorBrewer")
library(RColorBrewer)

2. 读取数据

首先,我们需要读取aSAH数据集,查看数据集信息

data(deg_data)
head(deg_data,3)

数据集展示

        row  baseMean log2FoldChange     lfcSE      stat       pvalue         padj
GCR1   GCR1 7201.5782       2.244064 0.2004959  11.19256 4.434241e-29 2.153711e-25
OPI10 OPI10 1009.4171      -2.257454 0.2096469 -10.76789 4.880607e-27 1.185255e-23
AGA2   AGA2  249.1173       3.829474 0.3623263  10.56913 4.143136e-26 6.707736e-23

三、基础用法

ggVolcano绘制的火山图可以根据指定的差异表达或统计显著性阈值,将基因或蛋白质标记为显著差异的或富集的(例如p值小于0.05或fold change大于2),并且根据其差异表达或显著性水平值的高低,用颜色或大小进行编码。此外,它还支持在图中显示用户自定义的标注、注释或基因集富集分析结果,以帮助观察者更好地理解和解释结果。该包主要配置了三个函数:

1. 普通火山图:ggvolcano

  • 方法参数解释:
    result: DEG结果数据。
    x: 对应于x轴的列名,默认为“log2FoldChange”。
    y: 对应于y轴的列名,默认为“padj”。
    pointSize: 点的大小。
    pointShape: 点的形状。
    fills: 包含点的填充颜色的向量。
    colors: 包含点的画笔颜色的向量。
    x_lab: x轴的标签。
    y_lab: y轴的标签。
    legend_title: 图例的标题。
    legend_position: 图例的位置。您可以从“UL”–左上,“UR”–右上,“DL”–左下和“DR”–右下中选择一个位置。
    log2FC_cut: log2FC的截止值。
    FDR_cut: FDR的截止值。
    add_line: 一个逻辑值,表示是否添加虚线,默认值为TRUE。
    add_label: 一个逻辑值,表示是否添加基因标签,默认值为TRUE。
    label: 对应于标签的列名。
    label_number: 您想在图中显示多少基因标签。
    custom_label: 包含您感兴趣的基因名称的向量,您想要添加到图中。
    output: 一个逻辑值,表示是否保存图片,默认值为TRUE。
    filename: 如果output=TRUE,请设置一个文件名。
  • 代码演示
    data <- add_regulate(deg_data, log2FC_name="log2FoldChange",fdr_name = "padj",log2FC = 1, fdr = 0.05)
    ggvolcano(data, x = "log2FoldChange", y = "padj",label = "row", label_number = 10, output = FALSE)
    image
  • 火山图样式修改
p1 <- ggvolcano(data, x = "log2FoldChange", y = "padj",fills = c("red","green","blue"),colors = c("red","green","blue"),label = "row", label_number = 8, output = FALSE)p2 <- ggvolcano(data, x = "log2FoldChange", y = "padj",label = "row", label_number = 8, output = FALSE,legend_position="DR")+ggsci::scale_color_aaas()+ggsci::scale_fill_aaas()
p1|p2

image

2. 渐变色火山图:gradual_volcano

  • 方法参数解释:
    result: DEG结果数据。
    x: 对应于x轴的列名,默认为“log2FoldChange”。
    y: 对应于y轴的列名,默认为“padj”。
    pointSize: 点的大小。
    pointShape: 点的形状。
    fills: 包含点的填充颜色的向量。
    colors: 包含点的画笔颜色的向量。
    x_lab: x轴的标签。
    y_lab: y轴的标签。
    legend_title: 图例的标题。
    legend_position: 图例的位置。您可以从“UL”–左上,“UR”–右上,“DL”–左下和“DR”–右下中选择一个位置。
    log2FC_cut: log2FC的截止值。
    FDR_cut: FDR的截止值。
    add_line: 一个逻辑值,表示是否添加虚线,默认值为TRUE。
    add_label: 一个逻辑值,表示是否添加基因标签,默认值为TRUE。
    label: 对应于标签的列名。
    label_number: 您想在图中显示多少基因标签。
    custom_label: 包含您感兴趣的基因名称的向量,您想要添加到图中。
    output: 一个逻辑值,表示是否保存图片,默认值为TRUE。
    filename: 如果output=TRUE,请设置一个文件名。
  • 代码演示
gradual_volcano(deg_data, x = "log2FoldChange", y = "padj",label = "row", label_number = 10, output = FALSE,legend_title="")

image

  • 火山图样式修改

这里不能直接修改颜色了,需要引入RColorBrewer包,用来调整色彩。


p1 <- gradual_volcano(data, x = "log2FoldChange", y = "padj",fills = brewer.pal(5, "RdYlBu"),colors = brewer.pal(10, "RdYlBu"),label = "row", label_number = 10, output = FALSE,legend_title="")p2 <- gradual_volcano(data, x = "log2FoldChange", y = "padj",label = "row", label_number = 10, output = FALSE,legend_title="")+ggsci::scale_color_gsea()+ggsci::scale_fill_gsea()
p1|p2

image

3. GO通路火山图:term_volcano

参数和样式修改方法和上述两个方法类似,不再赘述,接下来展示基础使用方法:

data("term_data")term_volcano(deg_data, term_data,x = "log2FoldChange", y = "padj",label = "row", label_number = 10, output = FALSE,legend_background_fill = "green")

image

本文由博客一文多发平台 OpenWrite 发布!

http://www.lryc.cn/news/67247.html

相关文章:

  • chmod是什么?cron是什么?
  • 励志长篇小说《周兴和》书连载之三 十五岁时做父亲
  • 文件一直处于修改状态 git checkout 无法还原的问题解决方法
  • Julia入门-3、Julia包管理工具
  • 选择正确的 Azure 存储服务
  • 隐语团队研究成果再创佳绩,两篇论文分别被USENIX ATC‘23和IJCAI‘23接收!
  • 美团数据指标体系搭建实战
  • prometheus实战之五:飞书通知告警
  • 【华为OD机试真题】不含101的数(python版)100%通过率 超详细代码注释 代码解读
  • 基于AT89C52单片机的交通信号灯设计
  • chatGPT4.0-基于Python+Appium的APPUI关键字驱动自动化测试框架demo
  • C++模板进阶
  • 【人力资源管理】第4集 免费开源ERP: Odoo 16 Appraisal员工绩效评估 构建一体化企业人力资源管理
  • 「AI 孙燕姿」翻唱华语乐坛歌曲爆红全网,AI 翻唱将带来哪些影响?是否会有版权等问题?
  • 路径规划算法:基于灰狼优化的路径规划算法- 附代码
  • 推荐系统综述
  • SQLIST数据库编程
  • vue2中操作对象的方法
  • 左值引用、右值引用,std::move() 的汇编解释
  • LiangGaRy-学习笔记-Day11
  • 【异常解决】浏览器无法访问此网站ERR_UNSAFE_PORT/网页可能无法连接,或者它已永久性地移动到了新网址问题解决方案
  • Python函数的参数
  • 【Hive大数据】Hive分区表与分桶表使用详解
  • C#NPOI操作Excel详解
  • CSS中文字体 Unicode 编码表
  • 《微服务实战》 第四章 Spring Cloud Netflix 之 Eureka
  • 11. 深入理解并发编程-AQS与JMM
  • 深度解耦:使用Jetpack新技术Hilt实现依赖注入
  • C++ 构造函数-2
  • 网安笔记 08 key management