当前位置: 首页 > news >正文

R语言的入门学习

目录

  • 准备工作
  • 导入csv数据集
    • 选择前200行作为数据集
    • 展示数据集的前/后几N行
    • 宏观分析
    • 删除缺失值
    • 构建直方图
    • 导出为图片
  • R语言常见图像类型
    • 例1:散点图
    • 例2:散点矩阵图

准备工作

  • 安装教程: R语言和RStudio的下载安装(非常简便舒适)

导入csv数据集

  • 右上角导入数据集。
    在这里插入图片描述

在这里插入图片描述

选择前200行作为数据集

data <- BOOK_TEST[1:200,c(1,2,3)]

展示数据集的前/后几N行

head(data)
tail(data,10)

在这里插入图片描述

宏观分析

summary(data)

在这里插入图片描述

删除缺失值

  • 这个测试数据集中并没有缺失值。
data = na.omit(data)

构建直方图

  • 第三列数据是对书籍的打分。
hist(data$V3)

在这里插入图片描述

导出为图片

在这里插入图片描述

R语言常见图像类型

  • 散点图(Scatter plot)、折线图(Line plot)、条形图(Bar plot)、直方图(Histogram)、箱线图(Box plot)、饼图(Pie chart)、热力图(Heatmap)、散点矩阵图(Scatterplot matrix)

例1:散点图

# 创建示例数据
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 6, 8, 10)# 创建散点图
plot(x, y, main = "Scatter Plot", xlab = "X", ylab = "Y", pch = 16, col = "blue")

在这里插入图片描述

例2:散点矩阵图

  • 散点矩阵图(Scatterplot Matrix)是一种用于可视化多个变量之间关系的图表。它展示了数据集中多个变量两两之间的散点图,每个格子代表了两个变量之间的关系。散点矩阵图可以帮助我们观察和理解变量之间的相关性、分布情况以及可能存在的模式。
  • 散点矩阵图的主要作用和使用场景如下:
    • 变量关系探索:散点矩阵图可以帮助我们直观地观察多个变量之间的关系,特别是在变量较多时。通过观察散点图的分布和趋势,我们可以发现变量之间的线性或非线性关系,以及可能存在的异常值或离群点。
    • 相关性分析:散点矩阵图可以帮助我们评估变量之间的相关性。通过观察散点图中点的分布情况,我们可以判断变量之间的相关性强弱、正负相关以及可能存在的非线性关系。
    • 变量选择:散点矩阵图可以帮助我们在多个变量中选择与目标变量相关性较高的变量。通过观察散点图中与目标变量相关性较强的变量,我们可以选择最具有预测能力的变量进行进一步分析。
    • 数据预处理:散点矩阵图可以帮助我们发现数据中的异常值、缺失值或其他数据质量问题。通过观察散点图中的异常点或缺失值模式,我们可以进行相应的数据清洗和预处理操作。

总之,散点矩阵图是一种强大的数据可视化工具,适用于探索性数据分析、相关性分析和变量选择等场景。它可以帮助我们更好地理解数据集中多个变量之间的关系,从而支持数据分析和决策过程。

# 创建示例数据
data <- iris[, 1:4]# 创建散点矩阵图
pairs(data, main = "Scatterplot Matrix")

在这里插入图片描述

http://www.lryc.cn/news/235324.html

相关文章:

  • 【开源】基于Vue和SpringBoot的民宿预定管理系统
  • nacos集群部署
  • 9、传统计算机视觉 —— 边缘检测
  • Linux tc 使用
  • 从0开始学习JavaScript--JavaScript 数字与日期
  • 从关键新闻和最新技术看AI行业发展(2023.11.6-11.19第十期) |【WeThinkIn老实人报】
  • 计算机硬件的基本组成
  • 【算法-哈希表3】四数相加2 和 赎金信
  • wpf devexpress自定义编辑器
  • 文档向量化工具(一):Apache Tika介绍
  • 学习c#的第二十一天
  • Michael Jordan最新报告:去中心化机器学习中的契约、不确定性和激励
  • 3ds Max渲染用专业显卡还是游戏显卡?
  • airlearning-ue4安装的踩坑记录
  • uniapp优化h5项目-摇树优化,gzip压缩和删除console.log
  • Pycharm之配置python虚拟环境
  • 如何使用MybatisPlus进行数据分页显示
  • 代码随想录 Day49 单调栈01 LeetCode LeetCodeT739每日温度 T496 下一个最大元素I
  • 高可用--限流熔断降级
  • win10电脑无法联网,设置IPv4,点击属性无法打开,闪退
  • 【数据结构】邻接表与邻接矩阵的转换
  • VR智慧景区:VR赋能文旅产业,激活消费潜能
  • Spring Boot EasyPOI 使用指定模板导出Excel
  • postgresql:记录表膨胀引起的io问题的处理
  • Windows下安装RabbitMQ
  • 广州华锐互动VRAR:利用VR开展刑事案件公安取证培训,沉浸式体验提升实战能力
  • 消息消费过程
  • 使用Lychee搭建个人图片存储系统并进行远程访问设置实现公网访问本地私人图床
  • 12-2- DCGAN -简单网络-卷积网络
  • Redis持久化策略之RDB与AOF