当前位置：首页 > news >正文

【零基础学AI】第21讲：TensorFlow基础 - 神经网络搭建入门

news 2025/7/4 8:30:48

在这里插入图片描述

本节课你将学到

理解什么是TensorFlow，为什么要用它
掌握TensorFlow安装和基本操作
学会搭建第一个神经网络
完成手写数字识别项目

开始之前

环境要求

Python 3.8+
至少4GB内存
网络连接（用于下载数据集）

前置知识

第1-8讲：Python基础和开发环境
基本的数学概念（加减乘除即可）

什么是TensorFlow？

用最简单的话解释

想象你要盖房子：

传统编程：你需要自己制作每一块砖头、每一根钢筋
TensorFlow：就像一个预制构件工厂，砖头、钢筋、水泥都给你准备好了，你只需要按图纸组装

TensorFlow就是Google开发的"AI积木工厂"，它提供了：

🧱 基础积木：各种数学运算函数
🔧 组装工具：神经网络层、优化器
📏 测量工具：损失函数、评估指标
🏭 生产线：自动训练和优化

为什么选择TensorFlow？

简单易用：像搭积木一样构建神经网络
功能强大：支持从简单分类到复杂的图像识别
社区庞大：遇到问题容易找到解决方案
工业级：Google、Netflix等大公司都在用

TensorFlow安装

安装步骤

# 方法1：使用pip安装（推荐）
pip install tensorflow# 方法2：如果上面很慢，使用国内镜像
pip install tensorflow -i https://pypi.tuna.tsinghua.edu.cn/simple/# 验证安装
python -c "import tensorflow as tf; print('TensorFlow版本:', tf.__version__)"

验证安装

import tensorflow as tf# 检查版本
print("TensorFlow版本:", tf.__version__)# 检查是否支持GPU（有GPU会显示GPU信息，没有也正常）
print("GPU可用:", len(tf.config.list_physical_devices('GPU')) > 0)# 简单测试
hello = tf.constant("Hello, TensorFlow!")
print(hello.numpy().decode())

预期输出：

TensorFlow版本: 2.x.x
GPU可用: False  # 没有GPU也没关系
Hello, TensorFlow!

TensorFlow核心概念

1. 张量（Tensor）- 数据容器

张量就是多维数组，就像不同形状的盒子：

import tensorflow as tf
import numpy as np# 0维张量（标量）- 一个数字
scalar = tf.constant(42)
print("标量:", scalar)# 1维张量（向量）- 一行数字
vector = tf.constant([1, 2, 3, 4])
print("向量:", vector)# 2维张量（矩阵）- 表格
matrix = tf.constant([[1, 2], [3, 4]])
print("矩阵:")
print(matrix)# 3维张量 - 立体数据（比如彩色图片）
tensor_3d = tf.constant([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print("3维张量形状:", tensor_3d.shape)

2. 计算图 - 操作流程

TensorFlow会自动记录你的操作，就像记录菜谱步骤：

# 定义变量（可以改变的数）
x = tf.Variable(3.0, name="x")
y = tf.Variable(4.0, name="y")# 定义计算（TensorFlow会记录这些步骤）
z = x * x + y * y  # z = x² + y²print("x =", x.numpy())
print("y =", y.numpy()) 
print("z = x² + y² =", z.numpy())

3. 自动微分 - 神经网络的关键

神经网络需要不断调整参数，TensorFlow可以自动计算如何调整：

# 使用GradientTape记录操作
x = tf.Variable(2.0)with tf.GradientTape() as tape:y = x * x * x  # y = x³# 自动计算导数（斜率）
dy_dx = tape.gradient(y, x)
print(f"当x={x.numpy()}时，y=x³的导数是：{dy_dx.numpy()}")
print("手工计算：3*2²=12，验证正确！")

第一个神经网络

问题：预测房价

假设我们要根据房屋面积预测房价，这是一个最简单的神经网络：

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False# 1. 准备数据
# 假设房价 = 面积 * 2 + 一些随机噪声
np.random.seed(42)  # 固定随机种子，确保结果可重现
areas = np.random.uniform(50, 200, 100)  # 100个面积数据，50-200平米
prices = areas * 2 + np.random.normal(0, 10, 100)  # 价格=面积*2+噪声# 数据标准化（重要！神经网络喜欢小数字）
areas_norm = (areas - areas.mean()) / areas.std()
prices_norm = (prices - prices.mean()) / prices.std()print("数据准备完成！")
print(f"面积范围：{areas.min():.1f} - {areas.max():.1f} 平米")
print(f"价格范围：{prices.min():.1f} - {prices.max():.1f} 万元")

# 2. 构建神经网络
# 最简单的神经网络：只有一层，一个神经元
model = tf.keras.Sequential([tf.keras.layers.Dense(1, input_shape=[1], name='price_predictor')
])# 编译模型（设置学习规则）
model.compile(optimizer='adam',      # 优化器：adam是最常用的loss='mse',           # 损失函数：均方误差metrics=['mae']       # 评估指标：平均绝对误差
)# 查看模型结构
print("模型结构：")
model.summary()

# 3. 训练模型
print("开始训练...")
history = model.fit(areas_norm, prices_norm,  # 训练数据epochs=100,               # 训练轮数verbose=0                 # 不显示训练过程（避免刷屏）
)print("训练完成！")# 4. 评估效果
test_area = np.array([100])  # 测试：100平米的房子
test_area_norm = (test_area - areas.mean()) / areas.std()
predicted_price_norm = model.predict(test_area_norm, verbose=0)# 反标准化得到实际价格
predicted_price = predicted_price_norm * prices.std() + prices.mean()print(f"预测结果：100平米的房子价格约为 {predicted_price[0][0]:.1f} 万元")
print(f"理论价格：100 * 2 = 200万元")
print(f"预测误差：{abs(predicted_price[0][0] - 200):.1f} 万元")

可视化结果

# 绘制训练过程
plt.figure(figsize=(12, 4))# 损失变化
plt.subplot(1, 2, 1)
plt.plot(history.history['loss'])
plt.title('训练损失变化')
plt.xlabel('训练轮数')
plt.ylabel('损失值')
plt.grid(True)# 预测效果
plt.subplot(1, 2, 2)
plt.scatter(areas, prices, alpha=0.6, label='真实数据')# 画预测线
test_areas = np.linspace(50, 200, 100)
test_areas_norm = (test_areas - areas.mean()) / areas.std()
predicted_prices_norm = model.predict(test_areas_norm, verbose=0)
predicted_prices = predicted_prices_norm * prices.std() + prices.mean()plt.plot(test_areas, predicted_prices, 'r-', linewidth=2, label='神经网络预测')
plt.xlabel('面积 (平米)')
plt.ylabel('价格 (万元)')
plt.title('房价预测效果')
plt.legend()
plt.grid(True)plt.tight_layout()
plt.show()print("图表已显示！红线是神经网络学到的规律")

完整项目：手写数字识别

现在我们来做一个更有趣的项目：让计算机识别手写数字！

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt# 1. 加载MNIST数据集（手写数字数据）
print("正在下载MNIST数据集...")
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()print("数据加载完成！")
print(f"训练图片数量: {len(x_train)}")
print(f"测试图片数量: {len(x_test)}")
print(f"图片尺寸: {x_train[0].shape}")# 查看几个样本
plt.figure(figsize=(10, 2))
for i in range(5):plt.subplot(1, 5, i+1)plt.imshow(x_train[i], cmap='gray')plt.title(f'标签: {y_train[i]}')plt.axis('off')
plt.suptitle('手写数字样本')
plt.show()

# 2. 数据预处理
# 标准化像素值到0-1范围
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0# 将28x28的图片展平成784维向量
x_train_flat = x_train.reshape(60000, 784)
x_test_flat = x_test.reshape(10000, 784)print("数据预处理完成！")
print(f"训练数据形状: {x_train_flat.shape}")
print(f"测试数据形状: {x_test_flat.shape}")

# 3. 构建神经网络
model = tf.keras.Sequential([# 输入层：784个神经元（对应784个像素）tf.keras.layers.Dense(128, activation='relu', input_shape=(784,)),# 隐藏层：128个神经元，使用ReLU激活函数tf.keras.layers.Dense(64, activation='relu'),# 输出层：10个神经元（对应0-9十个数字）tf.keras.layers.Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',  # 多分类问题的损失函数metrics=['accuracy']
)# 查看模型结构
print("神经网络结构：")
model.summary()

# 4. 训练模型
print("开始训练神经网络...")
history = model.fit(x_train_flat, y_train,epochs=10,                    # 训练10轮batch_size=128,              # 每次处理128个样本validation_split=0.1,        # 10%的数据用于验证verbose=1                    # 显示训练进度
)print("训练完成！")

# 5. 评估模型
test_loss, test_accuracy = model.evaluate(x_test_flat, y_test, verbose=0)
print(f"测试准确率: {test_accuracy:.4f} ({test_accuracy*100:.2f}%)")# 预测几个测试样本
predictions = model.predict(x_test_flat[:5], verbose=0)
predicted_labels = np.argmax(predictions, axis=1)print("\n预测结果：")
for i in range(5):print(f"图片{i+1}: 真实标签={y_test[i]}, 预测标签={predicted_labels[i]}, "f"置信度={predictions[i][predicted_labels[i]]:.4f}")

# 6. 可视化结果
plt.figure(figsize=(15, 5))# 训练历史
plt.subplot(1, 3, 1)
plt.plot(history.history['accuracy'], label='训练准确率')
plt.plot(history.history['val_accuracy'], label='验证准确率')
plt.title('模型准确率')
plt.xlabel('训练轮数')
plt.ylabel('准确率')
plt.legend()
plt.grid(True)plt.subplot(1, 3, 2)
plt.plot(history.history['loss'], label='训练损失')
plt.plot(history.history['val_loss'], label='验证损失')
plt.title('模型损失')
plt.xlabel('训练轮数')
plt.ylabel('损失值')
plt.legend()
plt.grid(True)# 预测结果展示
plt.subplot(1, 3, 3)
# 显示一个预测示例
sample_idx = 0
plt.imshow(x_test[sample_idx], cmap='gray')
plt.title(f'真实: {y_test[sample_idx]}, 预测: {predicted_labels[sample_idx]}')
plt.axis('off')plt.tight_layout()
plt.show()print("🎉 恭喜！你已经成功训练了一个手写数字识别神经网络！")

运行效果

预期输出

数据加载完成！
训练图片数量: 60000
测试图片数量: 10000
图片尺寸: (28, 28)神经网络结构：
Model: "sequential_1"
_________________________________________________________________Layer (type)                Output Shape              Param #   
=================================================================dense_1 (Dense)             (None, 128)               100480    dense_2 (Dense)             (None, 64)                8256      dense_3 (Dense)             (None, 10)                650       
=================================================================
Total params: 109,386
Trainable params: 109,386
Non-trainable params: 0训练完成！
测试准确率: 0.9751 (97.51%)预测结果：
图片1: 真实标签=7, 预测标签=7, 置信度=0.9999
图片2: 真实标签=2, 预测标签=2, 置信度=0.9995
...

生成的文件

模型训练过程可视化图表
手写数字样本展示
预测结果对比

常见问题解答

Q1: 安装TensorFlow时出错

错误信息： ERROR: Failed building wheel for tensorflow

解决方法：

# 方法1：升级pip
pip install --upgrade pip# 方法2：使用conda安装
conda install tensorflow# 方法3：安装CPU版本
pip install tensorflow-cpu

Q2: 训练很慢怎么办？

解决方法：

减少训练轮数（epochs）：从10改为5
减少数据量：只用前1000个样本训练
使用更小的网络：减少神经元数量

Q3: 准确率不高怎么办？

可能原因和解决方法：

训练轮数太少：增加epochs
网络太简单：增加更多层或神经元
学习率不合适：尝试不同的优化器

Q4: 内存不够怎么办？

解决方法：

# 减少batch_size
model.fit(x_train, y_train, batch_size=32)  # 从128改为32# 或者使用更少的数据
x_train_small = x_train[:10000]  # 只用前10000个样本

课后练习

基础练习

修改神经网络结构，尝试不同数量的神经元
改变训练轮数，观察准确率变化
使用自己手写的数字测试模型

进阶练习

尝试识别时装图片（Fashion-MNIST数据集）
添加更多隐藏层，观察效果变化
使用不同的激活函数（如tanh、sigmoid）

挑战练习

实现一个简单的绘图界面，让用户画数字并识别
比较不同优化器的效果（SGD vs Adam）
分析模型预测错误的样本，找出共同特点

总结

这节课我们学会了：

TensorFlow基础概念：理解张量、计算图、自动微分
神经网络构建：使用Sequential模型搭建网络
模型训练流程：编译→训练→评估→预测
实际项目经验：完成了手写数字识别

下节课预告： 我们将学习PyTorch，对比两个主流深度学习框架的差异，并用PyTorch实现图像分类器。

技术支持

如遇问题，请检查：

Python版本是否3.8+
TensorFlow是否正确安装
网络连接是否正常（下载数据集需要）
内存是否足够（建议4GB+）

记住：每个AI专家都是从第一个神经网络开始的！你已经迈出了重要的一步！ 🚀

查看全文

http://www.lryc.cn/news/579435.html

从生活实例看：点积、内积和矩阵乘法如何玩转机器学习

【maven仓库搜索下载工作流程】

后端 Maven打包 JAR 文件、前端打包dist文件、通过后端服务访问前端页面、Nginx安装与部署

办公文档批量打印器 Word、PPT、Excel、PDF、图片和文本，它都支持批量打印。

Flask 遇到了 AttributeError: ‘Babel‘ object has no attribute ‘localeselector‘ 怎么解决

TinyWebserver学习(8)-定时器

在 Jetson Orin 开发套件上使用 Hardware Encoder / Decoder 构建 FFmpeg

仿真软件介绍 COMSOL Multiphysics 或 ANSYS Fluent 等 MATLAB OpenFOAM，和在化学上的应用实例

2025年6月一区-田忌赛马优化算法Tianji’s horse racing optimization-附Matlab免费代码

Springboot3整合ehcache3缓存--XML配置和编程式配置

【PyCharm 2025.1.2配置debug】

【vmware虚拟机使用】开始安装centos7操作系统

Navicat Premium 12连接Oracle时提示oracle library is not loaded的问题解决

分布式部署下如何做接口防抖---使用分布式锁

macOS 26正式发布，全新Liquid Glass设计语言亮相

GitHub 解码指南：用 AI 赋能，五步快速掌握任意开源项目

MySQL 8.0 OCP 1Z0-908 题目解析(20)

MVC 架构设计模式

【Linux仓库】进程优先级及进程调度【进程·肆】

小黑黑日常积累大模型prompt句式2:【以段落的形式输出，不分点列举】【如果没有相关内容则不输出】【可读性强】【输出格式规范】

Java学习第八部分——泛型

git 中删除提交历史

代码随想录算法训练营第四十五天|动态规划part12

Fiddler中文版抓包工具在后端API调试与Mock中的巧用

应用在核电行业的虚拟现实解决方案

Laravel8中调取腾讯云文字识别OCR

本节课你将学到

开始之前

环境要求

前置知识

什么是TensorFlow？

用最简单的话解释

为什么选择TensorFlow？

TensorFlow安装

安装步骤

验证安装

TensorFlow核心概念

1. 张量（Tensor）- 数据容器

2. 计算图 - 操作流程

3. 自动微分 - 神经网络的关键

第一个神经网络

问题：预测房价

可视化结果

完整项目：手写数字识别

运行效果

预期输出

生成的文件

常见问题解答

Q1: 安装TensorFlow时出错

Q2: 训练很慢怎么办？

Q3: 准确率不高怎么办？

Q4: 内存不够怎么办？

课后练习

基础练习

进阶练习

挑战练习

总结

技术支持

相关文章：