当前位置: 首页 > article >正文

生成模型+两种机器学习范式

生成模型:从数据分布到样本创造

生成模型(Generative Model) 是机器学习中一类能够学习数据整体概率分布,并生成新样本的模型。其核心目标是建模输入数据 x 和标签 y 的联合概率分布 P(x,y),即回答 “数据是如何产生的”。

生成模型的核心能力
  1. 数据生成:通过学习数据分布,生成与训练集相似的新样本(如图像生成、文本生成)。
  2. 概率推断:计算数据的联合概率,用于异常检测、密度估计等任务。
  3. 因果建模:探索数据间的因果关系(如通过因果结构生成符合逻辑的样本)。
典型生成模型举例
  • 变分自编码器(VAE):通过隐变量建模数据分布,将样本编码为潜在向量后解码生成新样本。
  • 生成对抗网络(GAN):通过生成器与判别器的对抗训练,使生成样本接近真实数据分布。
  • 自回归模型(如 GPT 系列):基于序列数据的历史信息,预测下一个 token 的概率分布,逐步生成完整序列。

两种机器学习范式:生成式 vs. 判别式

机器学习的核心范式可分为生成式(Generative) 和判别式(Discriminative),二者在建模目标、应用场景上有本质区别:

一、生成式学习(Generative Learning)
  • 建模目标:学习联合概率分布 P(x,y),即 “输入 x 和标签 y 同时出现的概率”。
  • 核心逻辑:先理解数据如何生成,再通过生成过程进行预测。
  • 数学表达:P(y∣x)=P(x)P(x,y)​,通过联合概率和边缘概率推导条件概率。
  • 典型算法:隐马尔可夫模型(HMM)、朴素贝叶斯、VAE、GAN。
  • 应用场景
    • 样本生成(如图像、文本、语音合成);
    • 小样本学习(通过生成模型扩充数据);
    • 无监督 / 半监督学习(探索数据分布)。
二、判别式学习(Discriminative Learning)
  • 建模目标:直接学习条件概率分布 P(y∣x) 或决策函数 f(x),即 “给定输入 x,预测标签 y 的概率”。
  • 核心逻辑:不关心数据生成过程,只关注不同类别间的边界和区分特征。
  • 数学表达:直接建模输入到输出的映射关系,无需计算联合概率。
  • 典型算法:逻辑回归、支持向量机(SVM)、决策树、神经网络(如 CNN、RNN)。
  • 应用场景
    • 分类与回归(如图像分类、房价预测);
    • 目标检测、语义分割等需要精准判别边界的任务;
    • 实时预测(模型推理速度通常更快)。

http://www.lryc.cn/news/2404699.html

相关文章:

  • 【学习笔记】Python金融基础
  • 在Linux查看电脑的GPU型号
  • A Execllent Software Project Review and Solutions
  • windows命令行面板升级Git版本
  • Langgraph实战--自定义embeding
  • 大故障,阿里云核心域名疑似被劫持
  • 什么是「镜像」?(Docker Image)
  • SQLMesh实战:用虚拟数据环境和自动化测试重新定义数据工程
  • 服务器健康摩尔斯电码:深度解读S0-S5状态指示灯
  • 设计模式基础概念(行为模式):模板方法模式 (Template Method)
  • 传统业务对接AI-AI编程框架-Rasa的业务应用实战(番外篇2)-- Rasa 训练数据文件的清理
  • LVDS的几个关键电压概念
  • 2023年ASOC SCI2区TOP,随机跟随蚁群优化算法RFACO,深度解析+性能实测
  • DLL动态库实现文件遍历功能(Windows编程)
  • Java Map完全指南:从基础到高级应用
  • jvm 垃圾收集算法 详解
  • [特殊字符] 深入理解 Linux 内核进程管理:架构、核心函数与调度机制
  • Nginx Stream 层连接数限流实战ngx_stream_limit_conn_module
  • Spring Boot 定时任务的使用
  • Flutter:下拉框选择
  • SpringAI(GA):Nacos2下的分布式MCP
  • AC68U刷梅林384/386版本后不能 降级回380,升降级解决办法
  • [AI绘画]sd学习记录(二)文生图参数进阶
  • CRM管理系统中的客户分类与标签管理技巧:提升转化率的核心策略
  • 怎么解决cesium加载模型太黑,程序崩溃,不显示,位置不对模型太大,Cesium加载gltf/glb模型后变暗
  • 【AI系列】BM25 与向量检索
  • windows10搭建nfs服务器
  • simulink这边重新第二次仿真时,直接UE5崩溃,然后simulink没有响应
  • react 常见的闭包陷阱深入解析
  • 【CATIA的二次开发22】关于抽象对象Document概念详细总结