当前位置: 首页 > news >正文

AI模型训练的初步整理

明天会有人来给我们讲AI方面的课,我也一直想整理一下这方面的知识,今天也趁着这个机会做一下功课,算是预习。

首先,AI的模型训练可以分为:
增量学习(Incremental Learning)
增量学习允许模型在新数据到来时进行更新,而不需要重新训练整个模型。这种方法适用于那些需要持续适应新数据的场景。然而,并不是所有的机器学习模型都支持增量学习。一些模型,如支持向量机(SVM)和决策树,可以通过特定的策略实现增量更新,但其他模型,尤其是深度学习模型,通常较难直接进行增量更新。

在线学习(Online Learning)
在线学习是一种特殊的增量学习方法,它允许模型在接收新数据时实时更新。在线学习算法能够处理数据流,并在每个时间步根据新接收的数据调整模型参数。这种方法适用于数据持续生成且需要实时响应的应用。

模型微调(Fine-tuning)
在深度学习中,模型微调是一种常用的技术,它涉及在预训练模型的基础上使用新数据进行训练。通常,你会冻结预训练模型的大部分层,并只更新顶层或特定层的权重。这种方法允许模型保留在大量数据上学到的通用特征,同时学习新数据集中的特定特征。

重训练(Retraining)
如果模型不支持增量学习或在线学习,你可能需要使用新数据和原始数据重新训练整个模型。这通常是最直接的方法,但也可能非常耗时,尤其是在数据集很大或模型很复杂的情况下。

迁移学习(Transfer Learning)
迁移学习类似于模型微调,但更侧重于将从一个任务学到的知识迁移到另一个相关任务上。这通常涉及使用在大规模数据集上预训练的模型,并在特定任务的小数据集上进行微调。

AI模型训练大致包含一下几步:
数据的收集
这一块不用说,肯定是要用到网络爬虫技术。
数据的清洗与整理
Pandas用于数据的清洗与整理,下面是一个以新闻为例的整理好的数据样本。

新闻ID分类标签预处理后的新闻内容
1体育足球世界杯决赛将在本周末举行,两支强队将争夺冠军。
2政治国家领导人会见了来访的外国元首,双方就贸易问题进行了深入讨论。
3娱乐著名歌手发布了新专辑,其中的主打歌曲已经在各大音乐平台上线。

特征提取
特征向量是机器学习可以理解和使用的数值。
下面是一个简单的特征向量的例子:
新闻1特征向量: [1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
不同的模型训练,对向量数据的格式要求不同。
模型训练
常用的库就是PyTorch
评估和优化
相关的知识点包括:

  • 准确率
  • 召回率
  • F1分数
  • 混淆矩阵

回到我之前博客中提到的笔记系统,我打算使用增量学习的模型,构建自己的知识库。当笔记数据更新时,会有队列任务去提取笔记数据,对笔记数据进行清洗,然后提取特征,生成向量数据,然后再进行模型训练…哈哈,梦醒了。

欢迎大家留言区交流。还望路过的大佬多多指教。

2024.2.23
重庆.渝北

http://www.lryc.cn/news/304863.html

相关文章:

  • 【Java从入门到精通】Java Number Math 类
  • SQL字符集
  • openssl 生成nginx自签名的证书
  • adb push 使用
  • 【Docker】构建pytest-playwright镜像并验证
  • 算法沉淀——穷举、暴搜、深搜、回溯、剪枝综合练习四(leetcode真题剖析)
  • 如何在java中使用 Excel 动态函数生成依赖列表
  • 07 MyBatis之高级映射 + 懒加载(延迟加载)+缓存
  • MT8791迅鲲900T联发科5G安卓核心板规格参数_MTK平台方案定制
  • java:Java中的数组详解
  • Modern C++ std::visit从实践到原理
  • 谷歌gemma2b windows本地cpu gpu部署,pytorch框架,模型文件百度网盘下载
  • 数据结构-查找与排序
  • 【前端素材】推荐优质后台管理系统Qovex平台模板(附源码)
  • MATLAB环境下基于短时傅里叶变换和Rényi熵的脑电信号和语音信号分析
  • Go语言调用身份证实名认证API方法-标准版身份证实名认证接口
  • 数据库增删改查
  • 10.CSS3的calc函数
  • echrts 全国地图、各省市地图json文件下载
  • 如何使用1688.item_search_shop API获取阿里巴巴店铺商品信息
  • PLC_博图系列☞基本指令“取反RLO”
  • docker安装PostGIS扩展
  • LabVIEW开发FPGA的高速并行视觉检测系统
  • P5734 【深基6.例6】文字处理软件 - Java
  • 关于设备连接有人云的使用及modbus rtu协议,服务器端TCP调试设置
  • 开源图表库Echarts 简介与基本使用
  • 变更ip后怎么查现在的代理ip地址?代理IP在网络请求中有哪些优势?
  • C#浮点运算出错问题
  • WPF 控件禁用时,显示悬浮提示
  • 在 Windows 上使用 VC++ 编译 OpenSSL 源码的步骤