当前位置: 首页 > news >正文

数据挖掘 3.5 支持向量机——边界和正则化

3.5 Margin and Regularization
3.5 边界和正则化

边界和正则化

  • 求一个点距离线性分类器的距离
  • 支持向量机的另一个视角
    • SVM(支持向量机)优化问题的两种等价形式
      • 无约束优化问题 (Unconstrained Optimization Problem)
      • 有约束优化问题 (Constrained Optimization Problem)
      • 对应关系

求一个点距离线性分类器的距离

考虑一个线性分类器,其分界面为:

f(x)=wTx+b=0对于所有在边界上的 xf(\mathbf{x}) = \mathbf{w}^T \mathbf{x} + b = 0 \quad \text{对于所有在边界上的} \ \mathbf{x} f(x)=wTx+b=0对于所有在边界上的 x

向量 w\mathbf{w}w 垂直于线性判别式

在这里插入图片描述

证明过程
假设在边界上有两个点 x(1)\mathbf{x}^{(1)}x(1)x(2)\mathbf{x}^{(2)}x(2)

f(x(1))=wTx(1)+b=0(1)f(\mathbf{x}^{(1)}) = \mathbf{w}^T \mathbf{x}^{(1)} + b = 0 \tag{1} f(x(1))=wTx(1)+b=0(1)

f(x(2))=wTx(2)+b=0(2)f(\mathbf{x}^{(2)}) = \mathbf{w}^T \mathbf{x}^{(2)} + b = 0 \tag{2} f(x(2))=wTx(2)+b=0(2)

用式 (2) 减去式 (1):

wT(x(2)−x(1))=0\mathbf{w}^T \left( \mathbf{x}^{(2)} - \mathbf{x}^{(1)} \right) = 0 wT(x(2)x(1))=0由此可得: w⊥(x(2)−x(1))\mathbf{w} \perp \left( \mathbf{x}^{(2)} - \mathbf{x}^{(1)} \right)w(x(2)x(1))

权重向量 W 与边界上的任意两个点的连线方向垂直。

求距离margin

x(s)\mathbf{x}^{(s)}x(s) 是特征空间中的一个点,它在边界上的投影为 x(p)\mathbf{x}^{(p)}x(p)

f(x(p))=wTx(p)+b=0(3)f(\mathbf{x}^{(p)}) = \mathbf{w}^T \mathbf{x}^{(p)} + b = 0 \tag{3} f(x(p))=wTx(p)+b=0(3)
在这里插入图片描述

根据向量计算, x(s)=x(p)+rw^(4)\mathbf{x}^{(s)} = \mathbf{x}^{(p)} + r \hat{\mathbf{w}}\tag{4}x(s)=x(p)+rw^(4)

w^\hat{\mathbf{w}}w^w\mathbf{w}w的方向向量,长度为1,

w^=w∥w∥(5)\hat{\mathbf{w}}=\frac{\mathbf{w}}{\|\mathbf{w}\|}\tag{5}w^=ww(5)

求训练数据点 x(s)\mathbf{x}^{(s)}x(s)的标签值, f(x(s))=wTx(s)+bf(\mathbf{x}^{(s)}) = \mathbf{w}^T \mathbf{x}^{(s)} + bf(x(s))=wTx(s)+b, 将(4)代入,
f(x(s))=wT(x(p)+rw^)+bf(x(s))=wTx(p)+rwTw^+bf(\mathbf{x}^{(s)})= \mathbf{w}^T \left( \mathbf{x}^{(p)} + r \hat{\mathbf{w}} \right) + b\\ \\ f(\mathbf{x}^{(s)})= \mathbf{w}^T \mathbf{x}^{(p)} + r \mathbf{w}^T \hat{\mathbf{w}} + b\\ f(x(s))=wT(x(p)+rw^)+bf(x(s))=wTx(p)+rwTw^+b将(5)代入,
f(x(s))=wTx(p)+b+rwTw∥w∥f(\mathbf{x}^{(s)})= \mathbf{w}^T \mathbf{x}^{(p)} + b + r \, \mathbf{w}^T \frac{\mathbf{w}}{\|\mathbf{w}\|} f(x(s))=wTx(p)+b+rwTww
代入(3),

f(x(s))=0+rwTw∥w∥f(x(s))=0+rwTw∥w∥f(x(s))=0+r∥w∥f(x(s))=r∥w∥f(\mathbf{x}^{(s)})=0+r \, \mathbf{w}^T \frac{\mathbf{w}}{\|\mathbf{w}\|}\\ f(\mathbf{x}^{(s)})= 0+r \frac{\mathbf{w}^T\mathbf{w}}{\|\mathbf{w}\|}\\ f(\mathbf{x}^{(s)})=0 + r \|\mathbf{w}\| \\f(\mathbf{x}^{(s)})= r \|\mathbf{w}\| f(x(s))=0+rwTwwf(x(s))=0+rwwTwf(x(s))=0+rwf(x(s))=rw

由此,

r=f(x(s))∥w∥r = \frac{f(\mathbf{x}^{(s)})}{\|\mathbf{w}\|} r=wf(x(s))

解释rrr 表示点 x(s)\mathbf{x}^{(s)}x(s) 到边界的有符号距离,w\mathbf{w}w 是法向量,w^\hat{\mathbf{w}}w^ 是单位法向量。

举一个实例

rrr 的距离是如何计算出来的?

在这里插入图片描述

r=f(x(s))∥w∥=4+2∗2+312+22=115≈4.92r = \frac{f(\mathbf{x}^{(s)})}{\|\mathbf{w}\|} = \frac{4+2*2+3}{\sqrt{1^2+2^2}} = \frac{11}{\sqrt{5}}\approx4.92 r=wf(x(s))=12+224+22+3=5114.92

支持向量机的另一个视角

在这里插入图片描述

Hinge Loss: l(f(x),y)=max⁡(0,1−yf(x))l(f(x), y) = \max(0, 1 - y f(x))l(f(x),y)=max(0,1yf(x))

基于链式损失函数限制:
y⋅f(x)≥1y \cdot f(x) \geq 1yf(x)1

对于正类(y=+1y=+1y=+1):
f(x)≥1f(x) \geq 1f(x)1

对于负类(y=−1y=-1y=1):
f(x)≤−1f(x) \leq -1f(x)1

恰好在间隔边界上的支持向量满足:
y⋅f(x)=1y \cdot f(x) = 1yf(x)=1

因此正类支持向量:
f(x(s))=1f(x^{(s)}) = 1f(x(s))=1

代入得到:
r=f(x(s))∥w∥r = \frac{f(\mathbf{x}^{(s)})}{\|\mathbf{w}\|} r=wf(x(s))

r=1∥w∥r = \frac{1}{\lVert \mathbf{w} \rVert} r=w1

SVM(支持向量机)优化问题的两种等价形式

无约束优化问题 (Unconstrained Optimization Problem)

min⁡w12w⊤w+CN∑i=1Nmax⁡⁣{0,1−yif(xi;w)}\min_{w}\;\; \frac{1}{2} w^{\top} w \;+\; \frac{C}{N}\sum_{i=1}^{N} \max\!\{0,\; 1 - y_i\, f(x_i; w)\} wmin21ww+NCi=1Nmax{0,1yif(xi;w)}

有约束优化问题 (Constrained Optimization Problem)

min⁡w,ξ12w⊤w+CN∑i=1Nξis.t.yif(xi;w)≥1−ξi,i=1,…,N,ξi≥0.\begin{aligned} \min_{w,\,\xi}\;\; & \frac{1}{2}\, w^{\top} w \;+\; \frac{C}{N}\sum_{i=1}^{N} \xi_i \\ \text{s.t.}\;\; & y_i\, f(x_i; w) \;\ge\; 1 - \xi_i,\quad i=1,\dots,N,\\ & \xi_i \;\ge\; 0. \end{aligned} w,ξmins.t.21ww+NCi=1Nξiyif(xi;w)1ξi,i=1,,N,ξi0.

对应关系

ξi=max⁡{0,1−yif(xi;w)}\xi_i \;=\; \max\{0,\; 1 - y_i\, f(x_i; w)\} ξi=max{0,1yif(xi;w)}

Note: 边距最大化 = 正则化

http://www.lryc.cn/news/624220.html

相关文章:

  • C++ const
  • CSDN转PDF【无水印且免费!!!】
  • 计算机网络:2、TCP和UDP
  • 代码随想录刷题Day36
  • 时序数据库 Apache IoTDB:从边缘到云端Apache IoTDB 全链路数据管理能力、部署流程与安全特性解读
  • RH134 管理网络安全知识点
  • 前端处理导出PDF。Vue导出pdf
  • 备份数据库数据的时候,使用全局锁会影响业务,那有什么其他方式可以避免?
  • Redis---持久化策略
  • 如何用企业微信AI 破解金融服务难题?
  • easyexcel fastexcel 官方文档 easyexcel合并单元格
  • linux:告别SSH断线烦恼,Screen命令核心使用指南
  • 前端上传excel并解析成json
  • 实现自学习系统,输入excel文件,能学习后进行相应回答
  • AI 对话高效输入指令攻略(五):AI+PicDoc文生图表工具:解锁高效图表创作新范式
  • 实战测试:多模态AI在文档解析、图表分析中的准确率对比
  • 2025年8月更新!Windows 7 旗舰版 (32位+64位 轻度优化+离线驱动)
  • 【温室气体数据集】全球总碳柱观测网络 TCCON
  • 基于NLP的文本生成系统设计与实现(LW+源码+讲解+部署)
  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-59,(知识点:谐振电路,谐振频率,串联谐振,并联谐振)
  • 【WSL2笔记10】WSL-Ubuntu 环境下 ComfyUI 本地部署性能最大化指南
  • 【Mac】【Minecraft】关于如何在Mac上搭建基岩版MC服务器的方法
  • SIGKDD-2023《Complementary Classifier Induced Partial Label Learning》
  • 如何用github记录mit6s081-2020-labs学习过程
  • 【网络运维】Playbook项目实战:基于 Ansible Playbook 一键部署 LNMP 架构服务器
  • Tmux Xftp及Xshell的服务器使用方法
  • Tomcat Context的核心机制
  • 【GPT入门】第47课 LlamaFacotory 合并原模型与LoRA模型
  • Navicat 无法登录时找回 SQL 文件的方法
  • Zephyr 中的 bt_le_per_adv_set_data 函数的介绍和应用方法