当前位置: 首页 > news >正文

【Python】如何训练模型并保存本地和加载模型


这个年纪的我们
爱情跟不上分开的节奏
这个年纪的我们
更珍惜难得的自由
这个年纪的我们
比起从前更容易感动
这个年纪的我们
徘徊在理想与现实之中
                     🎵 齐一《这个年纪》


逻辑回归是一种常用的分类算法,能够根据输入特征预测目标变量的类别。本文将介绍如何利用 Pandas 预处理数据并使用 scikit-learn 训练逻辑回归模型,保存模型文件到本地,然后加载模型进行预测。

准备工作

首先,确保你已经安装了 Pandas 和 scikit-learn:

pip install pandas scikit-learn

1. 数据准备

我们使用一个示例数据集,或者你可以用自己的数据进行测试。这里,我们将生成一个虚拟数据集:

import pandas as pd
import numpy as np# 生成虚拟数据集
np.random.seed(42)
data = pd.DataFrame({'feature1': np.random.rand(100),'feature2': np.random.rand(100),'target': np.random.randint(0, 2, size=100)
})

2. 数据预处理

逻辑回归模型只接受数值型数据,所以如果有非数值的列需要编码成数值。我们这里假设数据已经是数值型,只需拆分特征和目标列即可:

# 特征和目标列的分离
X = data[['feature1', 'feature2']]
y = data['target']

3. 训练逻辑回归模型

我们将使用 scikit-learn 的 LogisticRegression 进行模型训练。首先,将数据拆分成训练集和测试集,然后训练模型:

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression# 将数据划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 创建并训练逻辑回归模型
model = LogisticRegression()
model.fit(X_train, y_train)

4. 保存模型到本地

训练好的模型可以用 joblib 或 pickle 库进行序列化保存。这里使用 joblib:

import joblib# 保存模型到文件
joblib.dump(model, 'logistic_regression_model.pkl')

5. 加载模型并进行预测

模型被保存为 .pkl 文件后,可以随时加载并使用它进行新的预测:

# 从文件中加载模型
model_loaded = joblib.load('logistic_regression_model.pkl')# 使用加载的模型进行预测
predictions = model_loaded.predict(X_test)
print(predictions)

6. 总结

本文展示了如何用 Pandas 预处理数据、使用 scikit-learn 训练逻辑回归模型,并将模型保存到本地。然后我们又演示了如何加载保存的模型并进行预测。通过这种方式,可以在数据科学项目中重用已训练的模型,节省重复训练的时间。

注意事项
确保在训练和测试数据的预处理中使用相同的操作,以保持特征的一致性。
由于模型会保存训练时的数据类型和形状,因此保持数据格式不变是重要的。

http://www.lryc.cn/news/346162.html

相关文章:

  • 浅谈如何利用 AI 提高内容生产效率?|TodayAI
  • 毕业论文答辩PPT怎么做?推荐3个ai工具帮你一键生成答辩ppt
  • 力扣 5-11
  • redisson 使用脚本实现判断元素不在队列中则插入的原子操作
  • LLaMA详细解读
  • 纯血鸿蒙APP实战开发——页面间共享组件实例的案例
  • 华为机考入门python3--(22)牛客22- 汽水瓶
  • Xilinx 千兆以太网TEMAC IP核简介
  • 激光测径仪在胶管生产中扮演着什么角色?
  • 数据结构与算法===递归
  • 面试官:BIO、NIO 和 AIO 有什么区别?
  • HTML:元素属性详解及代码示例
  • 【Flask 系统教程 5】视图进阶
  • 代码训练LeetCode(17)存在重复元素
  • 运营模型—归因分析(Attribution Analysis)
  • 我必须要吹一波MATLAB 2024a,太牛逼了!|福利:附安装教程及下载地址
  • XMLHttpRequest与Axios详解
  • 【区块链】智能合约简介
  • 上海市计算机学会竞赛平台2024年1月月赛丙组成绩等第
  • 【算法入门教育赛2】C.曼哈顿种类 C++题解与代码
  • Electron使用 SQLite
  • 怎样的跨网软件,可以实现网间数据的安全收发?
  • Sora惊艳亮相:AI技术掀起创作革命,影视产业迎来新风貌!
  • Mac电脑安装打开APP显示问题已损坏 问题解决
  • AI 数据观 | TapData Cloud + MongoDB Atlas:大模型与 RAG 技术有机结合,落地实时工单处理智能化解决方案
  • Vulnhub靶机随笔-Hacksudo_Aliens
  • 抖店选品都怎么选品?什么样的产品更吸引人,更具有购买力?
  • 将来会是Python、Java、Golang三足鼎立吗?
  • Java入门基础学习笔记16——运算符
  • golang中三种线程安全的MAP