当前位置: 首页 > news >正文

变压器寿命预测(python代码,Logistic Regression模型预测效果一般,可以做对比实验)

1.数据来源官网:Data for: Root cause analysis improved with machine learning for failure analysis in power transformers - Mendeley Data

 点Download All 10kb即可下载数据

2.下载下来后是这样

每一列的介绍:

Hydrogen 氢气;

Oxygen 氧气;

Nitrogen 氮气

Methane 甲烷

Carbon Monoxide (CO) 一氧化碳 (CO)

Carbon Dioxide (CO2) 二氧化碳 (CO2)

Ethylene 乙烯

Ethane 乙烷

Acetylene 乙炔

Dissolved Gas Ratio (DBDS) 溶解气体比率

(DBDS) Power Factor 功率因数

Interfacial Voltage (Interfacial V) 界面电压

(Interfacial V) Dielectric Rigidity 介电刚度

Water Content 水分含量

Health Index 健康指数

Life Expectation 寿命预期

3.本次项目的代码流程

  1. 导入所需的库和模块,包括NumPy、Pandas、Matplotlib、Seaborn等。

  2. 读取数据:从名为"Health index.csv"的CSV文件中读取数据,并对数据进行基本的信息查看和描述统计分析。

  3. 定义了一个名为check的函数,用于检查数据中的缺失值情况,并展示了缺失值的统计信息。

  4. 使用数据可视化工具绘制了箱线图,以检查数据中的异常值。

  5. 根据某些特定条件,找到了数据中一些异常值所在的行。

  6. 绘制了特征之间的相关性热力图,以查看特征之间的线性关系。

  7. 绘制了数据集中各个特征的直方图,用于查看其分布情况。

  8. 使用StandardScaler对数据进行标准化,使特征具有相似的尺度。

  9. 对特定特征进行散点图的绘制,以查看它们与目标变量的关系。

  10. 进行线性回归模型的训练和评估,包括训练集和测试集的划分、模型拟合、预测和性能指标的计算。

  11. 绘制了实际健康指数与预测健康指数的散点图,以可视化模型的性能。

  12. 定义了一个名为Model_Input的字典,包含了特定输入值。

  13. 创建一个包含新输入数据的DataFrame,并将其与原数据合并。

  14. 使用训练好的线性回归模型对新输入数据进行健康指数的预测。

  15. 绘制了实际健康指数与预测健康指数的散点图,以展示模型对新输入数据的预测。

代码的主要过程是加载、探索和分析数据,然后使用线性回归模型对健康指数进行预测,并展示结果的可视化。

4.效果视频

变压器寿命预测(python代码,逻辑回归模型预测效果一般,可以做对比实验)_哔哩哔哩_bilibili 

测试集预测效果图

测试集

 

5.对代码感兴趣的可以关注最后一行

import numpy as np  # 导入NumPy库,用于处理数值计算
import pandas as pd  # 导入Pandas库,用于数据处理和CSV文件的输入/输出操作
import os  # 导入操作系统模块,用于文件路径操作import pandas as pd  # 导入Pandas库
# import pandas_profiling
import numpy as np  # 导入NumPy库
import matplotlib.pyplot as plt  # 导入Matplotlib库,用于绘图
import warnings  # 导入警告模块,用于警告管理
warnings.simplefilter(action='ignore')  # 忽略警告信息
plt.style.use('seaborn')  # 设置绘图风格为Seaborn
import seaborn as sns  # 导入Seaborn库,用于数据可视化
from sklearn.linear_model import LogisticRegression, LinearRegression  # 导入Scikit-Learn中的线性和逻辑回归模型
from sklearn.preprocessing import StandardScaler  # 导入数据标准化模块
from sklearn import preprocessing  # 导入预处理模块
from sklearn.model_selection import train_test_split  # 导入数据集划分模块
from sklearn.linear_model import LinearRegression  # 导入线性回归模型
from sklearn import metrics  # 导入评价指标模块
from sklearn.model_selection import KFold  # 导入K折交叉验证模块
from sklearn.model_selection import cross_val_score  # 导入交叉验证模块#数据集和代码压缩包:https://mbd.pub/o/bread/ZJ6Wkplp

http://www.lryc.cn/news/167226.html

相关文章:

  • 微信小程序-增加隐私协议弹窗
  • 分布式事务解决方案之可靠消息最终一致性
  • ROS学习笔记(四)---使用 VScode 启动launch文件运行多个节点
  • 编译Redis时报错: jemalloc/jemalloc.h: No such file or directory
  • LLM 05-大模型法律
  • 1-5 AUTOSAR数据交换文件ARXML
  • 学习尚硅谷HTML+CSS总结
  • 自己设计CPU学习之路——基于《Xilinx FPGA应用开发》
  • 数据结构与算法:树
  • Spark 【Spark SQL(一)DataFrame的创建、保存与基本操作】
  • 026-从零搭建微服务-文件服务(二)
  • Jenkins 页面部分显示Http状态403 被禁止
  • ajax day4
  • 8.Spring EL与ExpressionParser
  • Go和Java实现迭代器模式
  • 如何在 Vue.js 和 Nuxt.js 之间做出选择?
  • (二十三)大数据实战——Flume数据采集之采集数据聚合案例实战
  • Linux: network: dhcp: mtu 这个里面也有关于网卡的MTU设置;
  • Android中使用图片水印,并且能够在线下载字体并应用于水印
  • HTTP文件服务
  • nginx配置获取客户端的真实ip
  • 1990-2022上市公司董监高学历工资特征信息数据/上市公司高管信息数据
  • Java程序连接 Mysql 超时问题 - 数据包过大,导致超时,# 配置网络超时时间 socketTimeout: 1800000
  • c++分层最短路(洛谷飞行路线)acwing版
  • Python bs4 BeautifulSoup库使用记录
  • Jmeter系列-插件安装(5)
  • spring aop源码解析
  • 使用Unity的Input.GetAxis(““)控制物体移动、旋转
  • 【CSS】画个三角形或圆形或环
  • AI项目六:基于YOLOV5的CPU版本部署openvino