当前位置: 首页 > news >正文

机器学习和数据挖掘02-Gaussian Naive Bayes

概念

贝叶斯定理:
贝叶斯定理是概率中的基本定理,描述了如何根据更多证据或信息更新假设的概率。在分类的上下文中,它用于计算给定特征集的类别的后验概率。

特征独立性假设:
高斯朴素贝叶斯中的“朴素”假设是,给定类别标签,特征之间是相互独立的。这个简化假设在现实场景中通常并不完全准确,但它简化了计算过程,在实践中仍然可以表现良好。

高斯分布:
高斯朴素贝叶斯假设每个类别中的连续特征遵循高斯(正态)分布。这意味着在给定类别的情况下,特征的似然性被建模为一个由均值和标准差确定的正态分布。

参数估计:
要使用高斯朴素贝叶斯算法,需要为每个类别估计参数。对于每个类别中的每个特征,你需要基于训练数据估计均值和标准差。

分类:
对于具有特征值的新数据点,算法使用贝叶斯定理计算每个类别的后验概率。具有最高后验概率的类别被预测为数据点的最终类别标签。

公式

在这里插入图片描述
在这里插入图片描述

代码实现

from sklearn.datasets import load_iris
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import cross_val_score, StratifiedKFold
import numpy as np# Load example dataset (you can replace this with your own data)
data = load_iris()
X = data.data
y = data.target# Create a Gaussian Naive Bayes model
gnb_model = GaussianNB()# Create a StratifiedKFold cross-validation object
cvKFold = StratifiedKFold(n_splits=10, shuffle=True, random_state=0)# Perform cross-validation using cross_val_score
scores = cross_val_score(gnb_model, X, y, cv=cvKFold)# Print the cross-validation scores
print("Cross-validation scores:", scores)
print("Mean CV score:", np.mean(scores))
http://www.lryc.cn/news/158172.html

相关文章:

  • 【面试题精讲】Java Stream排序的实现方式
  • 浅谈Spring
  • Java 复习笔记 - 面向对象进阶篇
  • 微信小程序中识别html标签的方法
  • 02_常见网络层协议的头结构
  • ChatGLM学习
  • Flink之Watermark
  • 二轮平衡小车3:PID速度环
  • C语言之练习题
  • 没钱,没人,没经验?传统制造型企业如何用无代码实现转型
  • CentOS ARM 部署 kubernetes v1.24.6
  • LeetCode 725. Split Linked List in Parts【链表】中等
  • 云计算中的负载均衡技术,确保资源的平衡分配
  • 探索 SOCKS5 代理在跨境电商中的网络安全应用
  • 全网独家:编译CentOS6.10系统的openssl-1.1.1多版本并存的rpm安装包
  • 【go】异步任务解决方案Asynq实战
  • 掌握 Android 自动化测试框架 UiAutomator UiAutomator2
  • c#抽象类(abstract)
  • 语义分割实践思考记录(个人备忘录)
  • Zebec Protocol 成非洲利比亚展会合作伙伴,并将向第三世界国家布局
  • 随机流-RandomAccessFile
  • 单例和静态类
  • PMP-项目风险管理的重要性
  • 学习的心得
  • Python网络爬虫中这七个li标签下面的属性值,不是固定的,怎样才能拿到他们的值呢?...
  • 白鲸开源 DataOps 平台加速数据分析和大模型构建
  • (其他) 剑指 Offer 65. 不用加减乘除做加法 ——【Leetcode每日一题】
  • RestTemplate 的用法
  • postgresql-使用plpgsql批量插入用户测试数据
  • 通过Siri打造智能爬虫助手:捕获与解析结构化数据