当前位置: 首页 > news >正文

PRML笔记4-绪论中推断和决策小结

推断阶段使用训练数据学习后验概率p(Ck∣x)p(\mathcal{C_k}|\boldsymbol{x})p(Ckx)的模型;在决策阶段使用后验概率进行最优的分类;亦或是同时解决推断和决策问题,简单的学习一个函数f(x)f(\boldsymbol{x})f(x),将输入x\boldsymbol{x}x直接映射为决策,这是函数f(x)f(\boldsymbol{x})f(x)被称为判别函数
有三种不同的方法来解决决策问题,按照复杂度从高到低,分别为:

  1. 对于每一个类别Ck\mathcal{C_k}Ck独立地确定类别条件密度p(x∣Ck)p(\boldsymbol{x}|\mathcal{C_k})p(xCk),随后推断先验类别的概率p(Ck)p(\mathcal{C_k})p(Ck),最后使用贝叶斯定理求出类别的后验概率p(Ck∣x)=p(x∣Ck)p(Ck)p(x)p(\mathcal{C_k}|\boldsymbol{x})=\frac{p(\boldsymbol{x}|\mathcal{C_k})p(\mathcal{C_k})}{p(\boldsymbol{x})}p(Ckx)=p(x)p(xCk)p(Ck)。其中的p(x)p(\boldsymbol{x})p(x)我们从直观上无法理解其概率,但是转换为全概率公式可表示为:∑kp(x∣Ck)p(Ck)\sum_{\mathcal{k}}p(\boldsymbol{x}|\mathcal{C_k})p(\mathcal{C_k})kp(xCk)p(Ck),这样就可以通过数据集得出了。也可以直接对p(x,Ck)p(\boldsymbol{x},\mathcal{C_k})p(x,Ck)进行建模,这种方法叫做生成式模型,这种模型可以人工生成输入空间(x\boldsymbol{x}xCk\mathcal{C_k}Ck的空间)的数据点。
  2. 直接对类别的后验概率p(Ck∣x)p(\mathcal{C_k}|\boldsymbol{x})p(Ckx)建模,随后通过模型对x\boldsymbol{x}x进行分类,这种方法叫判别式模型
  3. 与概率无关,直接使用一个判别函数f(x)f(\boldsymbol{x})f(x),该函数可以将输入x\boldsymbol{x}x映射为对应的类别Ck\mathcal{C_k}Ck
    方法1需要大量的训练数据,但是它对于检测模型中具有低概率的新数据点很有用。如果我们指向进行分类决策,使用方法2和方法3是更好的选择。然而,使用方法3我们未接触后验概率p(Ck∣x)p(\mathcal{C_k}|\boldsymbol{x})p(Ckx),使用后验概率有很多优势,比如:
    a) 最小化风险。如果损失矩阵中的元素时时刻刻都被修改,知道后验概率的话,只需要调整最小风险决策准则即可。
    b) 拒绝选项。 如果给定被拒绝数据点所占比例,后验概率可以让我们确定最小化误差分类和最小化期望损失的拒绝标准。
    c) 补偿类先验概率。 数据集类别分布不平衡的补偿问题。
    d) 组合模型。 将复杂应用拆解为多个小问题,每个子问题都可以通过一个独立的模型解决,因为分布以类别Ck\mathcal{C_k}Ck为条件时满足独立性。因此p(xI,xB∣Ck)=p(xI∣Ck)p(xB∣Ck)p(\boldsymbol{x_I},\boldsymbol{x_B}|\mathcal{C_k})=p(\boldsymbol{x_I}|\mathcal{C_k})p(\boldsymbol{x_B}|\mathcal{C_k})p(xI,xBCk)=p(xICk)p(xBCk),这时我们可以将后验概率表示为:
    p(Ck∣xI,xB)∝p(xI,xB∣Ck)p(Ck)∝p(xI∣Ck)p(xB∣Ck)p(Ck)∝p(Ck∣xI)p(xI)p(Ck∣xB)p(xB)p(Ck)p(Ck)p(Ck)∝p(Ck∣xI)p(xI)p(Ck∣xB)p(xB)p(Ck)∝p(Ck∣xI)p(Ck∣xB)p(Ck)\begin{aligned} p(\mathcal{C_k}|\boldsymbol{x_I},\boldsymbol{x_B})&\propto p(\boldsymbol{x_I},\boldsymbol{x_B}|\mathcal{C_k})p(\mathcal{C_k})\\ &\propto p(\boldsymbol{x_I}|\mathcal{C_k})p(\boldsymbol{x_B}|\mathcal{C_k})p(\mathcal{C_k})\\ &\propto \frac{p(\mathcal{C_k}|\boldsymbol{x_I})p(\boldsymbol{x_I})p(\mathcal{C_k}|\boldsymbol{x_B})p(\boldsymbol{x_B})p(\mathcal{C_k})}{p(\mathcal{C_k})p(\mathcal{C_k})}\\ &\propto \frac{p(\mathcal{C_k}|\boldsymbol{x_I})p(\boldsymbol{x_I})p(\mathcal{C_k}|\boldsymbol{x_B})p(\boldsymbol{x_B})}{p(\mathcal{C_k})}\\ &\propto \frac{p(\mathcal{C_k}|\boldsymbol{x_I})p(\mathcal{C_k}|\boldsymbol{x_B})}{p(\mathcal{C_k})} \end{aligned} p(CkxI,xB)p(xI,xBCk)p(Ck)p(xICk)p(xBCk)p(Ck)p(Ck)p(Ck)p(CkxI)p(xI)p(CkxB)p(xB)p(Ck)p(Ck)p(CkxI)p(xI)p(CkxB)p(xB)p(Ck)p(CkxI)p(CkxB)其中的p(Ck)p(\mathcal{C_k})p(Ck)可以通过估计每个类别的数据点所占的比例得到。
http://www.lryc.cn/news/20167.html

相关文章:

  • DSPE-PEG-Streptavidin;Streptavidin-PEG-DSPE;磷脂聚乙二醇链霉亲和素,科研用试剂
  • Java中的Stream
  • 【数据库】关系数据理论
  • 初阶C语言——结构体【详解】
  • 盘点:9款身份和访问管理工具
  • Linux下的进程地址空间
  • Web Spider Ast-Hook 浏览器内存漫游 - 数据检索
  • 开源启智,筑梦未来!第四届OpenI/O启智开发者大会开幕
  • CS144-Lab6
  • 最好的个人品牌策略是什么样的
  • 第四届国际步态识别竞赛HID2023已经启动,欢迎报名
  • 「2」指针进阶——详解
  • 计网笔记 网络层(端到端的服务)
  • [蓝桥杯 2018 省 B] 日志统计——双指针算法
  • SpringMVC请求转发和重定向
  • 如何建立项目标准化评价体系?【锦狸】
  • Vue基础入门讲义(二)-语法基础
  • 应广单片机用8位乘法器实现16位乘法运算
  • Android中使用GRPC简明教程
  • 【Linux】使用U盘自动化安装Linux(VMware虚拟机)
  • 内网渗透(五十七)之域控安全和跨域攻击-基于服务账户的非约束委派攻击
  • gitlab 安装到项目上传一篇解决
  • Verilog 逻辑与()、按位与()、逻辑或(||)、按位或(|)、等于(==)、全等(===)的区别
  • 剑指 Offer 22. 链表中倒数第k个节点
  • 数据结构预算法之买卖股票的最好时机(三)动态规划
  • 【数通网络交换基础梳理2】三层设备、网关、ARP表、VLAN、路由表及跨网段路由下一跳转发原理
  • Java-排序链表问题
  • c++之二叉树【进阶版】
  • 【数据库】 SQLServer
  • Linux 4.19 内核中 spinlock 概览