当前位置: 首页 > news >正文

【Python读书数据,并计算数据的相关系数、方差,均方根误差】

为了处理Python中的读书数据(假设这里指的是一系列关于书籍阅读量或评分的数据),并计算这些数据的相关系数、方差以及均方根误差(RMSE),我们首先需要明确数据的结构。这里,我将假设我们有一组关于书籍的评分数据,并展示如何使用Python的numpyscipy库来计算这些统计量。

假设数据

假设我们有两列数据:一列是书籍的“预期评分”(由专家或算法给出),另一列是“实际评分”(由读者给出)。

import numpy as np# 假设数据
expected_scores = np.array([8, 9, 7, 8, 9, 7, 6, 8, 7, 9])
actual_scores = np.array([7, 8, 6, 8, 10, 7, 5, 7, 8, 8])

计算相关系数

相关系数(这里我们使用皮尔逊相关系数)衡量两个变量之间的线性关系强度和方向。

from scipy.stats import pearsonrcorr, _ = pearsonr(expected_scores, actual_scores)
print(f"相关系数: {corr}")

计算方差

方差是衡量数据分布离散程度的统计量。

variance_expected = np.var(expected_scores)
variance_actual = np.var(actual_scores)print(f"预期评分的方差: {variance_expected}")
print(f"实际评分的方差: {variance_actual}")

计算均方根误差(RMSE)

RMSE是衡量预测值与真实值之间差异的一种常用方法,特别是在回归问题中。

from sklearn.metrics import mean_squared_errorrmse = np.sqrt(mean_squared_error(expected_scores, actual_scores))
print(f"均方根误差(RMSE): {rmse}")

注意,这里使用了sklearn.metrics中的mean_squared_error函数来计算均方误差(MSE),然后取平方根得到RMSE。

完整代码

将上述所有部分组合在一起,我们得到以下完整的Python脚本:

import numpy as np
from scipy.stats import pearsonr
from sklearn.metrics import mean_squared_error# 假设数据
expected_scores = np.array([8, 9, 7, 8, 9, 7, 6, 8, 7, 9])
actual_scores = np.array([7, 8, 6, 8, 10, 7, 5, 7, 8, 8])# 计算相关系数
corr, _ = pearsonr(expected_scores, actual_scores)
print(f"相关系数: {corr}")# 计算方差
variance_expected = np.var(expected_scores)
variance_actual = np.var(actual_scores)
print(f"预期评分的方差: {variance_expected}")
print(f"实际评分的方差: {variance_actual}")# 计算均方根误差(RMSE)
rmse = np.sqrt(mean_squared_error(expected_scores, actual_scores))
print(f"均方根误差(RMSE): {rmse}")

这个脚本将输出预期评分和实际评分之间的相关系数、各自的方差,以及它们之间的RMSE。

http://www.lryc.cn/news/425100.html

相关文章:

  • 垃圾收集器G1ZGC详解
  • AI芯片:高性能卷积计算中的数据复用
  • gitlab修改默认访问端口
  • python——异常
  • 【人工智能】利用TensorFlow.js在浏览器中实现一个基本的情感分析系统
  • Python——扩展数据类型
  • JavaScript 详解——Vue基础
  • 机械行业数字化生产供应链产品解决方案(十二)
  • Git——命令集合
  • python 数据可视化折线图练习(下:代码演示)
  • 深入探索 Go 1.18 的 debug/buildinfo:构建信息的获取与应用
  • Nios II的BSP Editor
  • Android-自适用高度的ViewPager
  • 代码随想录day38|| 322零钱兑换 279完全平方数 139单词拆分
  • Cesium天空盒子(Skybox)制作(js代码)和显示
  • JAVA中的缓冲流BufferedInputStream
  • WindowContainerTransaction类详解(一)
  • 安装NFS扩展
  • 计算机网络——运输层(进程之间的通信、运输层端口,UDP与TCP、TCP详解)
  • 代码随想录算法训练营第一天 | 二分查找
  • python相关知识
  • Visual Studio 2022 LNK2001无法解析的外部符号 _wcscat_s 问题记录
  • Java高并发处理机制
  • 7 数据存储单位,整型、浮点型、字符型、布尔型数据类型,sizeof 运算符
  • 导游职业资格考试真题题库
  • 【Rust】使用开源项目搭建瓦片地图服务
  • 【面试宝典】mysql常见面试题总结(上)
  • 第1章 初识C语言
  • 【考研数学】定积分应用——旋转体体积的计算(一文以蔽之)
  • PHP移动端商城分销全平台全端同步使用