当前位置: 首页 > article >正文

02 Deep learning神经网络的编程基础 逻辑回归--吴恩达

逻辑回归

逻辑回归是一种用于解决二分类任务(如预测是否是猫咪等)的统计学习方法。尽管名称中包含“回归”,但其本质是通过线性回归的变体输出概率值,并使用Sigmoid函数将线性结果映射到[0,1]区间。

以猫咪预测为例

假设单个样本/单张图片为( x \mathbf{x} x y \mathbf{y} y),特征向量X = x \mathbf{x} x,则 y ^ \hat{y} y^即为X的预测值, y ^ \hat{y} y^=P(y= y \mathbf{y} y/ x \mathbf{x} x), y ^ \hat{y} y^∈(0,1)。
假设特征权重参数为 w \mathbf{w} w,是一个nx维的向量,则有:
y ^ \hat{y} y^= σ \sigma σ w ⊤ w^\top w x \mathcal{x} x+ b \mathcal{b} b
z \mathcal{z} z = w ⊤ w^\top w x \mathcal{x} x+ b \mathcal{b} b
y ^ \hat{y} y^= σ ( z ) \sigma(z) σz

Sigmoid函数

Sigmoid函数是一种常用的S型激活函数,数学表达式为:
σ ( z ) = 1 1 + e − z \sigma(z) = \frac{1}{1 + e^{-z}} σ(z)=1+ez1
在这里插入图片描述
机器学习便是学习参数 x \mathcal{x} x b \mathcal{b} b,使得 y ^ \hat{y} y^尽可能接近实际值 y \mathcal{y} y

符号惯例介绍

定义一个额外特征向量 x 0 \mathcal{x_0} x0 =1,
y ^ \hat{y} y^= σ \sigma σ( θ T \theta^{T} θT x \mathcal{x} x ),其中 θ 0 \theta_0 θ0充当 b \mathcal{b} b,其余 θ 1 \theta_1 θ1 θ n x \theta_{nx} θnx充当 w \mathbf{w} w

核心特性
  1. 输出范围:$ (0,1) $,适合概率映射
  2. 单调性:全程可导且导数最大值为$ 0.25 (出现在 (出现在 (出现在x=0$处)
  3. 导数特性 σ ′ ( x ) = σ ( x ) ( 1 − σ ( x ) ) \sigma'(x) = \sigma(x)(1 - \sigma(x)) σ(x)=σ(x)(1σ(x)),便于梯度计算
Python实现
import numpy as npdef sigmoid(x):return 1 / (1 + np.exp(-x))# 支持向量化计算
print(sigmoid(np.array([-1.0, 0.0, 1.0])))  # 输出:[0.2689, 0.5, 0.7311]
典型应用
  1. 逻辑回归中的概率转换
  2. 神经网络隐藏层的激活函数
  3. 强化学习中的动作选择概率
局限说明
  • 深层网络易出现梯度消失(导数值随网络深度指数衰减)
  • 输出不以零为中心可能影响优化效率
  • 现多被ReLU系列函数替代用于隐藏层
http://www.lryc.cn/news/2402451.html

相关文章:

  • Android Native 内存泄漏检测全解析:从原理到工具的深度实践
  • React---扩展补充
  • HTML 中 class 属性介绍、用法
  • MySQL的并发事务问题及事务隔离级别
  • ProfiNet 分布式 IO 在某污水处理厂的应用
  • vue2使用笔记、vue2和vue3的区别
  • Vue2数组数字字段求和技巧 数字求和方法
  • vue2 , el-select 多选树结构,可重名
  • Excel处理控件Aspose.Cells教程:使用 C# 从 Excel 进行邮件合并
  • Jenkins | Jenkins构建成功服务进程关闭问题
  • 模块化架构下的前端调试体系建设:WebDebugX 与多工具协同的工程实践
  • EXCEL通过DAX Studio获取端口号连接PowerBI
  • PostgreSQL 技术峰会,为您打造深度交流优质平台
  • 使用 OpenCV (C++) 进行人脸边缘提取
  • C# 委托UI控件更新例子,何时需要使用委托
  • 大模型数据流处理实战:Vue+NDJSON的Markdown安全渲染架构
  • python项目如何创建docker环境
  • Eureka 高可用集群搭建实战:服务注册与发现的底层原理与避坑指南
  • PyTorch--池化层(4)
  • GPU加速与非加速的深度学习张量计算对比Demo,使用PyTorch展示关键差异
  • Vue中的自定义事件
  • 2025年大模型平台落地实践研究报告|附75页PDF文件下载
  • PPTAGENT:让PPT生成更智能
  • Kotlin 中 companion object 扩展函数和普通函数区别
  • 《汇编语言》第13章 int指令
  • Redis实战-基于redis和lua脚本实现分布式锁以及Redission源码解析【万字长文】
  • Ubuntu崩溃修复方案
  • 计算机网络 : 应用层自定义协议与序列化
  • Python Day42 学习(日志Day9复习)
  • CMake在VS中使用远程调试