当前位置：首页 > news >正文

深度学习21天 —— 卷积神经网络（CNN）：识别验证码（第12天）

news 2025/7/4 17:46:11

一、前期准备

1.1 标签数字化

number   = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
alphabet = ['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z']
char_set       = number + alphabet
char_set_len   = len(char_set)
label_name_len = len(all_label_names[0])# 将字符串数字化
def text2vec(text):vector = np.zeros([label_name_len, char_set_len])for i, c in enumerate(text):idx = char_set.index(c)vector[i][idx] = 1.0return vectorall_labels = [text2vec(i) for i in all_label_names]

text 为 all_label_names 即标签名称的值，假设标签是 677g3，则一次输入进函数 text2vec：6、7、7、g、3

enumerate(text) 返回了text的索引和值给 i 和 c ，idx 为在 char_set 里找到的 c的索引值，所以新构建了一个全0 的二维数组，行数为标签的长度，列数为字符集合 char_set 的长度，转化结果即为，每i行的对应标签名称的第i个值对应的索引为1，其余为0

1.2 加载数据

AUTOTUNE = tf.data.experimental.AUTOTUNEpath_ds  = tf.data.Dataset.from_tensor_slices(all_image_paths)
image_ds = path_ds.map(load_and_preprocess_image, num_parallel_calls=AUTOTUNE)
label_ds = tf.data.Dataset.from_tensor_slices(all_labels)image_label_ds = tf.data.Dataset.zip((image_ds, label_ds))
image_label_ds

tf.data.Dataset.from_tensor_slices_方如一的博客-CSDN博客

与 prefetch（）使用类似，Dataset.map() 也可以利用多 GPU 资源，并行化地对数据项进行变换，从而提高效率。以前节的 MNIST 数据集为例，假设用于训练的计算机具有 2 核的 CPU，我们希望充分利用多核心的优势对数据进行并行化变换（比如前节的旋转 90 度函数 rot90 ），可以使用以下代码：
如代码：

1mnist_dataset = mnist_dataset.map(map_func=rot90, num_parallel_calls=2)

参考：TensorFlow 2.0 常用模块3：tf.data 流水线加速_zk_one的博客-CSDN博客

1.3 配置数据

prefetch() 功能详细介绍:CPU正在准备数据时，加速器处于空闲状态。相反，当加速器正在训练模型时，CPU处于空闲状态。因此，训练所用的时间是CPU预处理时间和加速器训练时间的总和。prefetch() 将训练步骤的预处理和模型执行过程重叠到一起。当加速器正在执行第N个训练步时，CPU正在准备第N+1步的数据。这样做不仅可以最大限度地缩短训练的单步用时（而不是总用时)，而且可以缩短提取和转换数据所需的时间。如果不使用prefetch() , CPU和GPU/TPU在大部分时间都处于空闲状态:

BATCH_SIZE = 16train_ds = train_ds.batch(BATCH_SIZE)
train_ds = train_ds.prefetch(buffer_size=AUTOTUNE)val_ds = val_ds.batch(BATCH_SIZE)
val_ds = val_ds.prefetch(buffer_size=AUTOTUNE)
val_ds

二、其他

2.1 损失函数 categorical_crossentropy

model.compile(optimizer="adam",loss='categorical_crossentropy',metrics=['accuracy'])

根据公式我们可以发现，因为yi,要么是0，要么是1。而当yi等于0时，结果就是0，当且仅当yi等于1时，才会有结果。也就是说categorical_crossentropy只专注与一个结果，因而它一般配合softmax做单标签分类。

详情参考：损失函数：categorical_crossentropy_Stealers的博客-CSDN博客_categorical_crossentropy

2.2 plt.legend(loc=' ')

plt.legend(loc=' ')：设置图例的位置

plt.plot()，plt.scatter()，plt.legend函数的用法介绍_Sunny.T的博客-CSDN博客_plt.legend

plt.legend(loc='lower right')
plt.legend(loc='upper right')

2.3 history.history

plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])

history：历史查看命令，可用来绘制训练过程中的损失和准确率

查看全文

http://www.lryc.cn/news/359584.html

利用 Docker 简化Redis部署：快速搭建Redis服务

【Java】还有人不懂继承？25 个 Case 包教包会

Qt实现窗口失去焦点抖动功能

Flink 数据源

在本地电脑中如何用命令操作远程服务器上的数据库

uniApp子组件监听数据的变化的方法之一

Python容器化技术的15个Docker实践

QT天气预报项目（写在简历上）

从零到一建设数据中台 - 数据可视化

一步步实现知乎热榜采集：Scala与Sttp库的应用

Windows和Linux系统部署Docker(2)

PyCharm中快速搭建Python虚拟环境的指南

C++模板元编程

Lambda表达式与函数式接口

Java字符串String详解

互联网政务应用安全管理规定：使用安全连接方式访问

安全测试用例及解析（Word原件，直接套用检测）

github将默认分支main改为master

java.lang.NoClassDefFoundError: org/dom4j/io/SAXReader

读后感：《SQL数据分析实战》运营SQL实用手册

建设人工智能平台,主流GPU卡选型分析

RTSPtoWebRTC、RTSPtoWeb ( 自HTML播放)：页面中预览摄像机视频，无插件的播放方式，适合局域网使用，无需流媒体服务器

C语言| 三个整数从小到大排序

C语言基础编程题目解析：探索逻辑与算法的奥秘

jmeter基础入门练习题