当前位置：首页 > news >正文

基于支持向量机的垃圾邮件分类，使用SVM+flask+vue

news 2025/7/15 1:51:48

sms-classify

基于支持向量机的垃圾邮件分类，使用SVM+flask+vue
数据集和源码地址

数据集 SMS Spam Collection Data Set 来源于 UCI。样例被分为非垃圾邮件（86.6%）和垃圾邮件（13.4%），数据格式如下：

ham Go until jurong point, crazy.. Available only in bugis n great world la e buffet... 
ham	Ok lar... Joking wif u oni...
spam	Free entry in 2 a wkly comp to win FA Cup final tkts 21st May 2005. 
ham	U dun say so early hor... U c already then say...

代码结构

- client: 前端实现
- server: 后端实现- models: svm model- sms_classify.py: 垃圾邮件分类实现- SMSSpamCollection: 数据集- app.py 系统实现
- svm.py: 支持向量机算法实现
- svm_test.py：算法test

性能评估

综合比较了垃圾邮件分类任务在支持向量机、朴素贝叶斯、最近邻、决策树算法下的性能，
评估指标包括accuracy、precision、recall、f1-score等。

从accuracy来看，支持向量机的accuracy为98%，是所有测试算法中最高的，可以看出
垃圾邮件分类任务适合使用支持向量机来做。

各算法表现具体如下表：

支持向量机：

             precision    recall  f1-score   support0       0.98      1.00      0.99       4821       1.00      0.86      0.92        76accuracy                           0.98       558macro avg       0.99      0.93      0.96       558
weighted avg       0.98      0.98      0.98       558

支持向量机的accuracy有 98.029%。

贝叶斯算法：

         precision    recall  f1-score   support0       0.94      1.00      0.97       4821       1.00      0.62      0.76        76accuracy                           0.95       558macro avg       0.97      0.81      0.87       558
weighted avg       0.95      0.95      0.94       558

贝叶斯算法的accuracy只有 94.803%。

最近邻算法：

     precision    recall  f1-score   support0       0.97      0.99      0.98       4821       0.93      0.83      0.88        76accuracy                           0.97       558macro avg       0.95      0.91      0.93       558
weighted avg       0.97      0.97      0.97       558

最近邻算法的accuracy为 96.774%。

决策树算法：

       precision    recall  f1-score   support0       0.97      0.98      0.98       4821       0.88      0.79      0.83        76accuracy                           0.96       558macro avg       0.92      0.89      0.90       558
weighted avg       0.96      0.96      0.96       558

决策树算法的accuracy为 95.699%。

如何运行

首先安装必要的包

# 创建虚拟环境
python -m venv env
# 激活虚拟环境
source env/bin/activate
# 安装依赖包
pip install -r requirements.txt

运行SVM算法实现

# 确保安装 matplotlib 和 numpy
python3 svm_test.py

运行垃圾邮件分类

~ cd server/models/
~ python3 sms_classify.py

运行垃圾邮件分类系统

server端

# 确保安装必要的包
# 启动flask
python app.py

client端

# 确保安装node & npm
npm install
npm run server

查看全文

http://www.lryc.cn/news/376486.html

目标检测数据集 - 零售食品LOGO检测数据集下载「包含VOC、COCO、YOLO三种格式」

47.PyCharm P版突然无法启动

「动态规划」如何求粉刷房子的最少花费？

代码随想录算法训练营DAY41｜背包问题二维、背包问题一维、416. 分割等和子集

gitlab2024最新版安装

2022C语言二级真题

智慧购房：链家网上海在售楼盘数据解析与模型构建

二进制数转字符串

WINDOWS系统jdk和maven明明安装了cmd里却无法使用相关命令

基于EasyAnimate模型的视频生成最佳实践

linux最大线程数限制及打开最大文件数

MyBatis系列七: 一级缓存，二级缓存，EnCache缓存

C++迈向精通：函数指针对象与函数对象

类和对象知识点

【FAS】《Survey on face anti-spoofing in face recognition》

【Unity】RPG2D龙城纷争（一）搭建项目、导入框架、前期开发准备

多目标跟踪中检测器和跟踪器如何协同工作的

kali系统几个开机启动项的区别

【自撰写】【国际象棋入门】第5课常见开局战术组合（一）

高考志愿填报选专业，女孩就业率最好的专业有哪些？

STM32CubeIDE对STM32F072进行ADC配置及使用

Leetcode Hot 100 刷题记录 - Day 1

k8s学习--Kruise Rollouts 基本使用

PHP框架详解 - CakePHP框架

el-cascader 支持多层级，多选（可自定义限制数量），保留最后一级

leetcode498 对角线遍历