当前位置: 首页 > news >正文

【Python机器学习】支持向量机——手写数字识别问题

基于SVM的数字识别步骤:

1、收集数据:提供的文本文件

2、准备数据:基于二值图像构造向量

3、分析数据:对图像向量进行目测

4、训练算法:采用两种不同的核函数,并对径向基核函数采用不同的设置来运行SMO算法

5、测试算法:编写一个函数来测试不同的核函数并计算错误率

6、使用算法:一个图像识别的完整应用还需要一些图像处理的知识。

构建一个系统去测试手写数字上的分类器:

def img2vector(filename):returnVect=zeros((1,1024))fr=open(filename)for i in range(32):lineStr=fr.readline()for j in range(32):returnVect[0,32*i+j]=int(lineStr[j])return returnVectdef loadImages(dirName):from os import listdirhwLabels=[]trainingFileList=listdir(dirName)m=len(trainingFileList)trainingMat=zeros((m,1024))for i in range(m):fileNameStr=trainingFileList[i]fileStr=fileNameStr.split('.')[0]classNumStr=int(fileStr.split('_')[0])if classNumStr==9:hwLabels.append(-1)else:hwLabels.append(1)trainingMat[i,:]=img2vector('%s/%s'%(dirName,fileNameStr))return trainingMat,hwLabelsdef testDigits(kTup=('rbf',10)):dataArr,labelArr=loadImages('trainingDigits')b,alphas=svm_11.smoP(dataArr,labelArr,200,0.0001,10000,kTup)dataMat=mat(dataArr)labelMat=mat(labelArr).transpose()svInd=nonzero(alphas.A>0)[0]sVs=dataMat[svInd]labelSV=labelMat[svInd]print('there are %d Support Vectors' % shape(sVs)[0])m,n=shape(dataMat)errorCount=0for i in range(m):kernelEval=svm_11.kernelTrans(sVs,dataMat[i,:],kTup)predict=kernelEval.T*multiply(labelSV,alphas[svInd])+bif sign(predict)!=sign(labelArr[i]):errorCount=errorCount+1print('训练集错误率:',(float(errorCount)/m))dataArr,labelArr=loadImages()errorCount = 0dataMat=mat(dataArr)labelMat=mat(labelArr).transpose('testDigits')m,n=shape(dataMat)for i in range(m):kernelEval = svm_11.kernelTrans(sVs, dataMat[i, :], kTup)predict = kernelEval.T * multiply(labelSV, alphas[svInd]) + bif sign(predict) != sign(labelArr[i]):errorCount = errorCount + 1print('测试集错误率:', (float(errorCount) / m))testDigits()

函数loadImages()是作为k近邻算法中的一部分出现的。它已经被重构为自身的一个函数。其中最大的区别在于,支持向量机中类别标签为-1和+1,,因此,一旦碰到数字9,则输出类别标签-1,否则输出+1,。本质上,支持向量机是一个二类分类器,其分类结果不是+1就是-1。

testDigits()和testRbf()几乎一样,区别在于它调用了loadImages()函数来获得类别标签和数据。kTup是输入参数。

上述代码运行结果:

http://www.lryc.cn/news/414542.html

相关文章:

  • 学习笔记-Cookie、Session、JWT
  • 题海战术,面试必胜秘诀
  • 设计模式详解(十九)——命令模式
  • 实战:MySQL数据同步神器之Canal
  • 5.6软件工程-运维
  • 在JavaScript中如何确保构造函数只被new调用
  • 【数据结构算法经典题目刨析(c语言)】反转链表(图文详解)
  • 机器学习之争:Python vs R,谁更胜一筹?
  • Vulnhub靶机:JANGOW_ 1.0.1
  • Python脚本实现USB自动复制文件
  • 【C++学习第19天】最小生成树(对应无向图)
  • 第一个 Flask 项目
  • 利用 Angular 发挥环境的力量
  • Vue3+TypeScript+printjs 实现标签批量打印功能
  • 微信文件如何直接打印及打印功能在哪里设置?
  • dataX -20240804-master分支
  • 【网络】传输层
  • 学生管理系统之更新和删除、筛选
  • 教您一键批量下载拼多多批发图片信息,节省时间
  • 基于微信小程序的微课堂笔记的设计与实现(源码+论文+部署讲解等)
  • 去噪扩散恢复模型
  • Stable Diffusion 官方模型V1.5版本下载
  • 【算法】双指针-OJ题详解1
  • 29 两个任务切换(1)
  • 正则表达式概述
  • 【C语言】Top K问题【建小堆】
  • Rust 程序设计语言学习——并发编程
  • 联邦学习研究综述【联邦学习】
  • 深入理解Python中的列表推导式
  • Android 实现左侧导航栏:NavigationView是什么?NavigationView和Navigation搭配使用