当前位置: 首页 > news >正文

Pandas实战100例 | 案例 26: 检测异常值

案例 26: 检测异常值

知识点讲解

在数据分析中,检测和处理异常值(或离群值)是一个重要的步骤。异常值可能会影响数据的整体分析。一种常用的方法是使用四分位数和四分位数间距(IQR)来识别异常值。

  • 四分位数和 IQR: 第一四分位数(Q1)是数据中所有数值的 25% 分位数,第三四分位数(Q3)是 75% 分位数。IQR 是 Q3 和 Q1 的差。通常,超出 Q1 - 1.5 * IQR 或 Q3 + 1.5 * IQR 的值被认为是异常值。
示例代码
# 准备数据和示例代码的运行结果,用于案例 26# 示例数据
data_outlier_detection = {'Values': [10, 12, 12, 14, 15, 15, 100]
}
df_outlier_detection = pd.DataFrame(data_outlier_detection)# 检测异常值
Q1 = df_outlier_detection['Values'].quantile(0.25)
Q3 = df_outlier_detection['Values'].quantile(0.75)
IQR = Q3 - Q1
outliers = df_outlier_detection[(df_outlier_detection['Values'] < (Q1 - 1.5 * IQR)) | (df_outlier_detection['Values'] > (Q3 + 1.5 * IQR))]df_outlier_detection, outliers

在这个示例中,我们使用 IQR 方法检测了异常值。

示例代码运行结果

原始 DataFrame (df_outlier_detection):

   Values
0      10
1      12
2      12
3      14
4      15
5      15
6     100

检测到的异常值 (outliers):

   Values
6     100

这个结果显示,值 100 是一个异常值。异常值检测对于理解数据集和进行准确的统计分析至关重要。

http://www.lryc.cn/news/279035.html

相关文章:

  • C语言学习NO.11-字符函数strlen,strlen函数的使用,与三种strlen函数的模拟实现
  • Vue3+ts获取props的值并且定义props值的类型的方法。
  • EasyExcel 不使用科学计数发并以千分位展示
  • 【Python机器学习】SVM——调参
  • 网络传输(TCP)
  • MFC模拟消息发送,自定义以及系统消息
  • 并发,并行,线程与UI操作
  • react 6种方式编写样式
  • 计算机找不到msvcr100.dll的多种解决方法分享,轻松解决dll问题
  • 系分笔记数据库反规范化、SQL语句和大数据
  • php实现支付宝商户转账
  • 并发编程(十一)
  • vue3 指令详解
  • 数据科学竞赛平台推荐
  • 安全防御之安全审计技术
  • C#多窗口那些事儿
  • 记一次 Redis 数据库迁移
  • 小学信息科技Python课程第2课:坐标与画笔
  • BP神经网络(公式推导+举例应用)
  • Word不同部分(分节)设置页眉和页码的使用指南——附案例操作
  • Ubuntu按转发HDF5
  • HCIP OSPF实验
  • Linux上如何一键安装软件?yum源是什么?Linux如何配置yum源?
  • Egg框架搭建后台服务【1】
  • Unity的Camera类——视觉掌控与深度解析(下)
  • 【模型评估 06】超参数调优
  • Matlab 字符识别OCR实验
  • Docker Compose 部署 jenkins
  • QT:使用QStyle实现QMenu的滚动效果
  • 双指针问题——求只包含两个元素的最长连续子序列(子数组)