超平面(Hyperplane)是什么?
参考:【漫话机器学习系列】253.超平面(Hyperplane)
一句话解释超平面(Hyperplane)
超平面就是高维空间中的“直线”或“平面”。比如:
- 在2D空间(平面),超平面是一条直线(如
y = ax + b
)。 - 在3D空间,超平面是一个平面(如
z = ax + by + c
)。 - 在更高维度(如100维),超平面就是一个“看不见的平面”,数学上定义为所有满足
w₁x₁ + w₂x₂ + ... + wₙxₙ + b = 0
的点的集合。
通俗理解
想象你是一个高维空间的切西瓜师傅:
- 2D空间(平面):用一刀切西瓜,切口是一条直线(超平面=直线)。
- 3D空间:用一刀切西瓜,切口是一个平面(超平面=平面)。
- 100维空间:用一刀切西瓜,切口是一个超平面(人类无法直观想象,但数学存在)。
为什么机器学习用超平面?
在分类问题中,超平面是决策边界,线性模型(如SVM、逻辑回归)的决策边界就是超平面。
例如:用“工资”和“年龄”预测是否贷款违约,决策边界可能是:
0.5×工资 + 0.3×年龄 - 10 = 0
(一条斜线)。
决策边界是机器学习模型在特征空间中画的一条“分界线”,用于区分不同类别。比如:
- 判断“是否批准贷款”时,模型会根据“收入”和“信用分”画一条线:线的一边批贷款,另一边拒绝。
- 判断“猫 vs 狗”图片时,模型可能在像素空间画一个复杂边界,区分两种动物。
1. 线性决策边界
- 形状:直线(2D)、平面(3D)、超平面(高维)。
- 对应模型:逻辑回归、线性SVM、线性判别分析(LDA)。
2. 非线性决策边界
- 形状:曲线、环形、不规则形状。
- 对应模型:决策树、神经网络、带核函数的SVM。
超平面 vs. 非线性边界
超平面(线性) | 非线性边界 | |
---|---|---|
例子 | 一刀切西瓜 | 用勺子挖球形的西瓜肉 |
模型 | 逻辑回归、线性SVM | 神经网络、带核函数的SVM |
特点 | 简单、可解释 | 复杂、拟合能力强 |
数学定义
在n维空间中,超平面的方程是:
- w 是法向量(决定超平面的方向)。
- b 是截距(决定超平面的位置)。
总结
- 低维中的超平面:直线(2D)、平面(3D)。
- 高维中的超平面:看不见但算得出的“广义平面”。
- 机器学习中的作用:线性模型的决策边界。