当前位置：首页 > news >正文

python3+TensorFlow 2.x（六）自编码器

news 2025/8/8 10:40:52

自动编码器

自动编码器（Autoencoder）是一种无监督学习算法，主要用于数据降维、特征学习和数据生成等任务。它由编码器和解码器组成，目标是将输入数据压缩为低维表示（编码），然后再从这个低维表示重构原始数据。自动编码器被广泛应用于图像去噪、特征提取和生成模型等场景。

实现

MNIST 数据集重构

import tensorflow as tf
from tensorflow.keras import layers, models
import matplotlib.pyplot as plt# 加载 MNIST 数据集
(train_images, _), (test_images, _) = tf.keras.datasets.mnist.load_data()# 归一化数据，将像素值缩放到 [0, 1]
train_images = train_images / 255.0
test_images = test_images / 255.0# 将数据的形状调整为 (batch_size, 28, 28, 1)，因为 CNN 等网络需要 4D 输入
train_images = train_images.reshape((train_images.shape[0], 28, 28, 1))
test_images = test_images.reshape((test_images.shape[0], 28, 28, 1))# 使用 tf.data.Dataset 将数据分成批次
train_dataset = tf.data.Dataset.from_tensor_slices(train_images).batch(64)# 构建自动编码器
def build_autoencoder():# 编码器encoder_input = layers.Input(shape=(28, 28, 1))# 编码层：使用卷积层和池化层提取特征x = layers.Conv2D(32, (3, 3), activation='relu', padding='same')(encoder_input)x = layers.MaxPooling2D((2, 2), padding='same')(x)x = layers.Conv2D(64, (3, 3), activation='relu', padding='same')(x)encoded = layers.MaxPooling2D((2, 2), padding='same')(x)# 解码器x = layers.Conv2D(64, (3, 3), activation='relu', padding='same')(encoded)x = layers.UpSampling2D((2, 2))(x)x = layers.Conv2D(32, (3, 3), activation='relu', padding='same')(x)x = layers.UpSampling2D((2, 2))(x)decoded = layers.Conv2D(1, (3, 3), activation='sigmoid', padding='same')(x)# 自动编码器模型autoencoder = models.Model(encoder_input, decoded)return autoencoder# 构建自动编码器模型
autoencoder = build_autoencoder()# 编译模型
autoencoder.compile(optimizer='adam', loss='binary_crossentropy')# 训练模型
autoencoder.fit(train_images, train_images, epochs=10, batch_size=64, validation_data=(test_images, test_images))# 使用训练好的模型对测试集进行预测
decoded_images = autoencoder.predict(test_images)# 显示原始图像和重建图像
n = 10  # 展示 10 张图像
plt.figure(figsize=(20, 4))
for i in range(n):# 显示原始图像ax = plt.subplot(2, n, i + 1)plt.imshow(test_images[i].reshape(28, 28), cmap='gray')plt.axis('off')# 显示重建图像ax = plt.subplot(2, n, i + 1 + n)plt.imshow(decoded_images[i].reshape(28, 28), cmap='gray')plt.axis('off')plt.show()