当前位置: 首页 > news >正文

python与深度学习(十六):CNN和宝可梦模型二

目录

  • 1. 说明
  • 2. 宝可梦模型的CNN模型测试
    • 2.1 导入相关库
    • 2.2 加载模型
    • 2.3 设置保存图片的路径
    • 2.4 加载图片
    • 2.5 数据处理和归一化
    • 2.6 对图片进行预测
    • 2.7 显示图片
  • 3. 完整代码和显示结果
  • 4. 多张图片进行测试的完整代码以及结果

1. 说明

本篇文章是对上篇文章宝可梦模型训练的模型进行测试。首先是将训练好的模型进行重新加载,然后采用opencv对图片进行加载,最后将加载好的图片输送给模型并且显示结果。

2. 宝可梦模型的CNN模型测试

2.1 导入相关库

在这里导入需要的第三方库如cv2,如果没有,则需要自行下载,自行下载时候一般建议镜像源,这样下载的快。

import tensorflow as tf
from PIL import ImageFont, Image, ImageDraw
from tensorflow import keras
import cv2, os, sys
import numpy as np
label = ['妙蛙种子', '小火龙', '超梦', '皮卡丘', '杰尼龟']

2.2 加载模型

把训练好的模型也加载进来,这里不用加载数据,因为数据是自制的。

network = keras.models.load_model('my_bkm.h5')
network.summary()

2.3 设置保存图片的路径

将数据集的某个数据以图片的形式进行保存,便于测试的可视化,这里在之前已经分了测试集,因此设置图片路径即可。
在这里设置图片存储的位置,便于将图片进行存储。

path = os.path.join(sys.path[0], 'test.png')

上述代码是将test文件夹里面的test.png进行测试,如果想测试其它的只需改为x.jpg即可。
在这里插入图片描述

2.4 加载图片

采用cv2对图片进行加载,用opencv库也就是cv2读取图片的时候,图片是三通道的,而训练的模型是三通道的,因此不只用取单通道,而是三通道,这里和之前的灰度图不同。

image = cv2.imread(path)
img = image.copy()
img = cv2.resize(img, (96, 96))
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

2.5 数据处理和归一化

将输入网络的图片进行数据处理转换到0-1之间,然后进行归一化处理。
归一化后加快了梯度下降求最优解的速度,也即加快训练网络的收敛性。

def normalize(x):img_mean = tf.constant([0.485, 0.456, 0.406])img_std = tf.constant([0.229, 0.224, 0.225])x = (x - img_mean) / img_stdreturn xdef preprocess(x):x = tf.expand_dims(x, axis=0)x = tf.cast(x, dtype=tf.float32) / 255.# x = normalize(x)return x

2.6 对图片进行预测

将图片输入给训练好我的模型并且进行预测。
因为是五分类,所以预测的结果是5个概率值,所以需要进行处理,np.argmax()是得到概率值最大值的序号,也就是预测的数字。

result = network(img)
result = tf.nn.softmax(result)
print(result)
index = tf.argmax(result, axis=-1)
print(label[int(index)])

2.7 显示图片

对预测的图片进行显示,把预测的数字显示在图片上。
下面5行代码分别是创建窗口,设定窗口大小,显示图片,停留图片,清除内存。

cv2.namedWindow('img', 0)
cv2.resizeWindow('img', 500, 500)   # 自己设定窗口图片的大小
#cv2.putText(image, label[int(index)], (166, 54), cv2.FONT_HERSHEY_SCRIPT_SIMPLEX, 1.2, (255, 0, 0), 2)
cv2.imshow('img', image)
cv2.waitKey()
cv2.destroyAllWindows()

3. 完整代码和显示结果

以下是完整的代码和图片显示结果。

import tensorflow as tf
from PIL import ImageFont, Image, ImageDraw
from tensorflow import keras
import cv2, os, sys
import numpy as np
label = ['妙蛙种子', '小火龙', '超梦', '皮卡丘', '杰尼龟']network = keras.models.load_model('my_bkm.h5')
network.summary()
path = os.path.join(sys.path[0], 'test.png')
image = cv2.imread(path)
img = image.copy()
img = cv2.resize(img, (96, 96))
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)def show_chinese(img,text,pos):img_pil = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))font = ImageFont.truetype(font='msyh.ttc', size=36)draw = ImageDraw.Draw(img_pil)draw.text(pos, text, font=font, fill=(255, 0, 0))  # PIL中RGB=(255,0,0)表示红色img_cv = np.array(img_pil)                         # PIL图片转换为numpyimg = cv2.cvtColor(img_cv, cv2.COLOR_RGB2BGR)      # PIL格式转换为OpenCV的BGR格式return imgdef normalize(x):img_mean = tf.constant([0.485, 0.456, 0.406])img_std = tf.constant([0.229, 0.224, 0.225])x = (x - img_mean) / img_stdreturn xdef preprocess(x):x = tf.expand_dims(x, axis=0)x = tf.cast(x, dtype=tf.float32) / 255.# x = normalize(x)return ximg = preprocess(img)# img= tf.cast(img, dtype=tf.uint8)result = network(img)
result = tf.nn.softmax(result)
print(result)
index = tf.argmax(result, axis=-1)
print(label[int(index)])# # 显示
image = show_chinese(image, label[int(index)], (356, 54))
cv2.namedWindow('img', 0)
cv2.resizeWindow('img', 500, 500)   # 自己设定窗口图片的大小
#cv2.putText(image, label[int(index)], (166, 54), cv2.FONT_HERSHEY_SCRIPT_SIMPLEX, 1.2, (255, 0, 0), 2)
cv2.imshow('img', image)
cv2.waitKey()
cv2.destroyAllWindows()
tf.Tensor([[1.1600139e-09 2.5695030e-05 8.4645586e-15 9.9997413e-01 6.6168944e-08]], shape=(1, 5), dtype=float32)
皮卡丘

A

4. 多张图片进行测试的完整代码以及结果

为了测试更多的图片,引入循环进行多次测试,效果更好。

import tensorflow as tf
from PIL import ImageFont, Image, ImageDraw
from tensorflow import keras
import cv2, os, sys
import numpy as np
label = ['妙蛙种子', '小火龙', '超梦', '皮卡丘', '杰尼龟']
def show_chinese(img,text,pos):img_pil = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))font = ImageFont.truetype(font='msyh.ttc', size=36)draw = ImageDraw.Draw(img_pil)draw.text(pos, text, font=font, fill=(255, 0, 0))  # PIL中RGB=(255,0,0)表示红色img_cv = np.array(img_pil)                         # PIL图片转换为numpyimg = cv2.cvtColor(img_cv, cv2.COLOR_RGB2BGR)      # PIL格式转换为OpenCV的BGR格式return imgdef normalize(x):img_mean = tf.constant([0.485, 0.456, 0.406])img_std = tf.constant([0.229, 0.224, 0.225])x = (x - img_mean) / img_stdreturn xdef preprocess(x):x = tf.expand_dims(x, axis=0)x = tf.cast(x, dtype=tf.float32) / 255.# x = normalize(x)return xnetwork = keras.models.load_model('my_bkm.h5')
network.summary()
prepicture = int(input("input the number of test picture :"))
for i in range(prepicture):path1 = input("input the test picture path:")path = os.path.join(sys.path[0], path1)image = cv2.imread(path)img = image.copy()img = cv2.resize(img, (96, 96))img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)img = preprocess(img)# img= tf.cast(img, dtype=tf.uint8)result = network(img)result = tf.nn.softmax(result)print(result)index = tf.argmax(result, axis=-1)print(label[int(index)])# # 显示image = show_chinese(image, label[int(index)], (356, 54))cv2.namedWindow('img', 0)cv2.resizeWindow('img', 500, 500)   # 自己设定窗口图片的大小#cv2.putText(image, label[int(index)], (166, 54), cv2.FONT_HERSHEY_SCRIPT_SIMPLEX, 1.2, (255, 0, 0), 2)cv2.imshow('img', image)cv2.waitKey()cv2.destroyAllWindows()
input the number of test picture :2
input the test picture path:1.png
tf.Tensor([[9.9998260e-01 1.2735860e-07 4.3719947e-06 3.5391193e-07 1.2507204e-05]], shape=(1, 5), dtype=float32)
妙蛙种子

在这里插入图片描述

input the test picture path:4.png
tf.Tensor([[1.6705857e-11 9.9999821e-01 2.3859246e-12 1.7547414e-06 3.2666370e-09]], shape=(1, 5), dtype=float32)
小火龙

在这里插入图片描述

http://www.lryc.cn/news/109210.html

相关文章:

  • PTA 1030 Travel Plan
  • MFC、Qt、WPF?该用哪个?
  • 使用logback记录日志
  • 企业工程项目管理系统源码(三控:进度组织、质量安全、预算资金成本、二平台:招采、设计管理) em
  • 【安装】XMind2022XMind2020安装教程(资源)
  • Windows下QT Creator安装MinGW 32bit编译器
  • Emacs之解决键值绑定冲突问题(一百二十三)
  • 瞄准产业应用,大模型加持的深兰科技AI虚拟数字人落地业务场景
  • 【网络基础进阶之路】基于MGRE多点协议的实战详解
  • Spark、RDD、Hive 、Hadoop-Hive 和传统关系型数据库区别
  • [运维]python 启用http 文件服务
  • electron-builder 打包 exe 异常错误集锦
  • 14-5_Qt 5.9 C++开发指南_基于HTTP 协议的网络应用程序
  • Kotlin委托
  • 分布式协议与算法——CAP理论、ACID理论、BASE理论
  • 接口测试 Jmeter 接口测试 —— 请求 Headers 与传参方式
  • 【redis】redis部署1主2从3哨兵demo搭建示例
  • C++数据结构之平衡二叉搜索树(一)——AVL的实现(zig-zag/左右双旋/3+4重构)
  • 免疫疗法勘察兵——DC细胞
  • Django实现音乐网站 ⑷
  • 2023年华数杯数学建模C题思路 - 母亲身心健康对婴儿成长的影响
  • openGauss学习笔记-30 openGauss 高级数据管理-别名
  • C#实现多线程局域网扫描器的思路与具体代码
  • Redis秒杀:一人一单问题及初步解决
  • python 数据分析面试题:求分组排第n名的记录数据
  • eclipse常用快捷键
  • 什么是OCR?OCR技术详解
  • 【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了
  • SQL分类及通用语法数据类型
  • 亿欧智库:2023中国功效型护肤产品成分解析研究报告(附下载