当前位置: 首页 > news >正文

机器学习——手写数字识别

0、:前言

  • 这篇文章能够帮助你从数据到模型的整个过程实现
  • 不过至于安装第三方库等基础问题,本文不涉及,因为确实不难,搜一搜一大把
  • 本此实验运行环境为jupyter,当然通过pycharm也是可行的

1、数据:

  • 手写数字共5000组数组
  • 其中一共有0-9,10组数据,每一组中有500张对应的手写数字的图片
  • 数据资料:
    链接:https://pan.baidu.com/s/1gTi-0xjDjbVUK_p_AzkZrw
    提取码:1234

2、数据预处理:

  • 拿到数据后把数据解压到和代码同一级的目录当中
  • 这部分重点是把图片数据转换为可以输入模型的二维数组型数据
  • 用到的函数解答:
    • plt.imshow()函数是matplotlib库中的一个函数,它用于显示图像。这个函数接受一个二维或三维的数组作为输入,表示图像的数据。然后,它将数组的值映射到颜色空间,以显示图像。在plt.imshow()函数中,cmap是一个参数,代表色彩映射(colormap)。在图像处理中,我们通常将图像表示为一个二维数组,数组的每个元素代表图像的一个像素。每个像素的值通常是一个介于0和255之间的整数,表示该像素的灰度级别。然而,我们通常不能直接看到这些数字,因为它们在视觉上可能没有明显的差别。相反,我们通常将每个像素的值映射到一个连续的色彩空间,这样我们就可以在屏幕上显示图像了。有许多不同的colormap可以选择,比如:‘gray’:灰度colormap、‘hot’:红色到白色的热图colormap、‘cool’:蓝色到绿色的colormap、‘Jet’:从蓝色到红色的colormap、‘hsv’:HSV色彩空间的colormap。
  • 代码
# 尝试从文件中读一个数据出来
img = plt.imread('./手写数字识别/0/0_1.bmp')
display(img.shape) # img是一个二维数组
plt.imshow(img,cmap='gray')

在这里插入图片描述

3、实现:

  • 代码
# 批量导入5000个图片数据
data = [] # 分类模型输入数据
target = [] # 分类模型输出数据for i in range(10):for j in range(1,501):img = plt.imread(f'./手写数字识别/{i}/{i}_{j}.bmp')data.append(img)target.append(i)
# 此时data和target作为列表数据运算起来非常耗内存,所以先转为数组形式的数据方便处理,然后再改变维度
data = np.array(data).reshape(5000, -1)
target = np.array(target).reshape(5000, -1)
print('data的形状:',data.shape,'target的形状:',target.shape)# 数据划分为训练集和测试集
from sklearn.model_selection import train_test_splitx_train, x_test, y_train, y_test = train_test_split(data,target,test_size=0.2) # 20%的测试集# 导入模型
from sklearn.neighbors import KNeighborsClassifierknn = KNeighborsClassifier()# 训练数据
knn.fit(x_train,y_train)# 查看模型得分,如果是pycharm就把下面代码放到print中
knn.score(x_test,y_test)
  • 该模型最终结果为0.93
  • 对结果进行可视化
# 随机挑选10个测试值画图查看预测结果
choice = np.random.randint(1,1000,10).tolist()
# 设置画布大小
plt.figure(figsize=(5*10,2*10))for i in range(10):# 画子图re = plt.subplot(2,5,i+1)re.imshow(x_test[choice[i]].reshape(28,-1),cmap='gray')re.set_title(f'real:{y_test[choice[i]][0]},\npredict:{y_pred[choice[i]]}',fontsize=40,color = 'k' if y_test[choice[i]][0] == y_pred[choice[i]] else 'r')

在这里插入图片描述


4、补充:

  • 如果在划分了数据集之后,要显示test当中的一个图片,应该先把图片数据变回原来的维度,然后再显示
    在这里插入图片描述
  • 关于如何改变数组维度的问题
    在这里插入图片描述
http://www.lryc.cn/news/151917.html

相关文章:

  • 【日积月累】后端刷题日志
  • Matlab在编码中增加CRC和交织功能
  • Css 设置从上到下的渐变色: 0到70%为yellow,然后线性地变成透明。
  • git在windows上安装
  • 快速上手GIT命令,现学也能登堂入室
  • 二进制安全虚拟机Protostar靶场 安装,基础知识讲解,破解STACK ZERO
  • python实现的一些方法,可以直接拿来用的那种
  • 通过HTTP进行并发的数据抓取
  • 《论文阅读21》Equivariant Multi-View Networks
  • 【数据结构】| 并查集及其优化实现
  • 最新ChatGPT程序源码+AI系统+详细图文部署教程/支持GPT4.0/支持Midjourney绘画/Prompt知识库
  • 自动驾驶和辅助驾驶系统的概念性架构(一)
  • 【两周学会FPGA】从0到1学习紫光同创FPGA开发|盘古PGL22G开发板学习之数码管静态显示(四)
  • 【洛谷】P3853 路标设置
  • 探索图像数据中的隐藏信息:语义实体识别和关系抽取的奇妙之旅
  • Gradle问题处理
  • 架构:C4 Model
  • 数据结构学习系列之顺序表的两种修改方式
  • React:props说明
  • Can‘t connect to local MySQL server through socket ‘/tmp/mysql.sock‘
  • C++的单例模式
  • Spring Boot 中 Nacos 配置中心使用实战
  • 学生管理系统VueAjax版本
  • 迭代器模式简介
  • 四方定理c++题解
  • ZDH-权限模块
  • 漏洞修复:在应用程序中发现不必要的 Http 响应头
  • 什么是mkp勒索病毒,中了mkp勒索病毒怎么办?勒索病毒解密数据恢复
  • db2迁移至oracle
  • webpack学习使用