当前位置: 首页 > news >正文

组队学习——支持向量机

本次学习支持向量机部分数据如下所示

IDmasswidthheightcolor_scorefruit_namekind

 其中ID:1-59是对应训练集和验证集的数据,60-67是对应测试集的数据,其中水果类别一共有四类包括apple、lemon、orange、mandarin。要求根据1-59的数据集的自变量(mass、width、height、color_score)和因变量(kind),去预测60-67的数据水果种类

一、导入支持向量机和其他的库

import numpy as np
from scipy import stats
from sklearn.model_selection import train_test_split
import pandas as pd  
from sklearn import svm  
from sklearn.metrics import accuracy_score

二、读取数据

# 设置文件路径  
file_path = 'E:\\Jupyter Workspace\\数学建模\\多分类水果数据.csv'  
# 使用 pandas 的 read_csv 函数读取 CSV 文件,注意查看csv文件的编码,默认不填为utf-8编码
data = pd.read_csv(file_path,encoding='gbk')  
# 显示数据的前几行来验证读取是否成功  
print(data.head())
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
pd.set_option('display.width', 300) # 设置打印宽度(**重要**)
print(data.isnull().any())

三、划分数据

# 选择第二列到最后一列,第一列相当于序号列可以忽略
X = data.iloc[0:59, 1:5]   # [:)左闭右开Y = data.iloc[0:59, 6]# 划分数据集为训练集和验证集
X_train, X_valid, Y_train, Y_valid = train_test_split(X, Y, test_size=0.2, random_state=42)

 四、RBF核函数

# RBF 核函数
rbf_model = svm.SVC(kernel='rbf', gamma='auto')
rbf_model.fit(X_train, Y_train)
rbf_pred = rbf_model.predict(X_valid)
print("RBF Kernel Accuracy:", accuracy_score(Y_valid, rbf_pred))

 五、线性核函数

# 线性核函数
linear_model = svm.SVC(kernel='linear')
linear_model.fit(X_train, Y_train)
linear_pred = linear_model.predict(X_valid)
print("Linear Kernel Accuracy:", accuracy_score(Y_valid, linear_pred))

六、多项式核函数

# 多项式核函数
poly_model = svm.SVC(kernel='poly', degree=3)
poly_model.fit(X_train, Y_train)
poly_pred = poly_model.predict(X_valid)
print("Polynomial Kernel Accuracy:", accuracy_score(Y_valid, poly_pred))

七、Sigmoid核函数

# Sigmoid 核函数
sigmoid_model = svm.SVC(kernel='sigmoid')
sigmoid_model.fit(X_train, Y_train)
sigmoid_pred = sigmoid_model.predict(X_valid)
print("Sigmoid Kernel Accuracy:", accuracy_score(Y_valid, sigmoid_pred))

其他 

结合相关资料比较一下哪种核函数更适合该题数据,说明理由,同时给出测试集的对应预测结果

test_X = data.iloc[59:, 1:5]
# print(test_X)
test_Y = data.iloc[59:, 6]
# print(test_Y)#举例:若为xxx核函数
#预测数据
xxx_pred_test = xxx_model.predict(test_X)
print(xxx_pred_test)

拓展:尝试用以下指标衡量支持向量机(SVR)的预测效果

● MSE(均方误差): 预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
● RMSE(均方根误差):为 MSE 的平方根,取值越小,模型准确度越高。
● MAE(平均绝对误差): 绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
● MAPE(平均绝对百分比误差): 是 MAE 的变形,它是一个百分比值。取值越小,模型准确度越高。
● R²: 将预测值跟只使用均值的情况下相比,结果越靠近 1 模型准确度越高。

http://www.lryc.cn/news/404886.html

相关文章:

  • 【数据中心】数据中心的IP封堵防护:构建网络防火墙的基石
  • LangChain的使用详解
  • Modbus转BACnet/IP网关快速对接Modbus协议设备与BA系统
  • 万字长文之分库分表里无分库分表键如何查询【后端面试题 | 中间件 | 数据库 | MySQL | 分库分表 | 其他查询】
  • 如何查看jvm资源占用情况
  • 科研绘图系列:R语言TCGA分组饼图(multiple pie charts)
  • ReadAgent,一款具有要点记忆的人工智能阅读代理
  • 构建智能:利用Gradle项目属性控制构建行为
  • 如何通过smtp设置使ONLYOFFICE协作空间服务器可以发送注册邀请邮件
  • SQL labs靶场-SQL注入入门
  • HarmonyOS应用开发者高级认证,Next版本发布后最新题库 - 单选题序号4
  • 使用LSTM完成时间序列预测
  • 《数据结构:顺序实现二叉树》
  • 【HarmonyOS】HarmonyOS NEXT学习日记:六、渲染控制、样式结构重用
  • 【防火墙】防火墙NAT、智能选路综合实验
  • VUE之---slot插槽
  • linux、windows、macos,命令终端清屏
  • 【RaspberryPi】树莓派Matlab/Simulink支持包安装与使用
  • 嵌入式人工智能(10-基于树莓派4B的DS1302实时时钟RTC)
  • C++ | Leetcode C++题解之第275题H指数II
  • 编写DockerFile
  • TCP并发服务器多线程
  • 技术速递|C# 13:探索最新的预览功能
  • Python设计模式:巧用元类创建单例模式!
  • 构建自主可控的工业操作系统,筑牢我国工业安全堡垒
  • WPF串口通讯程序
  • 汽车技术智能化程度不断提升,线束可靠性如何设计?
  • 实现Nginx的反向代理和负载均衡
  • 【算法】子集
  • Web前端:HTML篇(一)