当前位置: 首页 > news >正文

提示工程(Prompt Engineering)、微调(Fine-tuning) 和 嵌入(Embedding)

主要参考资料:
还没搞懂嵌入(Embedding)、微调(Fine-tuning)和提示工程(Prompt Engineering)?: https://blog.csdn.net/DynmicResource/article/details/133638079
B站Up主Nenly同学《60分钟速通LORA训练!》

目录

  • 提示工程(Prompt Engineering)
  • 微调(Fine-tuning)
    • LoRA微调
  • 嵌入(Embedding)

提示工程(Prompt Engineering)

如果没有良好的提示设计和基础技术,模型很可能产生幻觉或编造答案,其危险在于,模型往往会产生非常有说服力和看似合理的答案,因此必须非常小心地设计安全缓解措施和地面模型的事实答案,所以提示工程应运而生。

微调(Fine-tuning)

微调通过训练比提示(prompt)中更多的示例来改进小样本学习,让您在大量任务中取得更好的结果。对模型进行微调后,您将不再需要在提示(prompt)中提供示例。这样可以节省成本并实现更低延迟的请求。
下面是Nvidia Inception大会上的两张图。微调大致可以分为参数优化微调(Parameter Efficient Fine Tuning)和全量微调(Fine Tuning),典型的就是LoRA方法和SFT。
在这里插入图片描述
在这里插入图片描述

LoRA微调

模型权重:在深度学习中,模型的权重(Weights)是指神经网络中的参数。这些参数用于调整和学习模型的行为。而参数的存储方式就是矩阵。

LoRA做了两件事:
(1)"冻结"了原来的权重,在旁边另起了一个单独的“微调权重”来进行训练。
在这里插入图片描述

(2)“降本增效”。主要参考资料里的微软论文研究发现,微调前2行2列的效果与等于计算全部行列(LoRA有两个转换器,一个是把“满秩”转换为“低秩”,方便微调,另一个再将“低秩”转换为“满秩”。矩阵的“秩”是线性代数的一个概念,描述了这个矩阵的信息丰富度和多样性。)

嵌入(Embedding)

http://www.lryc.cn/news/305574.html

相关文章:

  • 【Flink精讲】Flink 内存管理
  • 正则化概念及使用
  • 让程序员设计B端界面,好比武大郎招聘:向我看齐。不忍直视!
  • 使用python构建Android,探索跨平台应用开发Kivy框架
  • 08 Redis之集群的搭建和复制原理+哨兵机制+CAP定理+Raft算法
  • *MYSQL--索引--内部原理
  • docker安装kafka和kafka-console-ui
  • Linux:gitlab创建组,创建用户,创建项目
  • 相机选型介绍
  • SQL创建数据库
  • 读书笔记-增强型分析:AI驱动的数据分析、业务决策与案例实践
  • NXP实战笔记(十):S32K3xx基于RTD-SDK在S32DS上配置CAN通信
  • 纳斯达克大屏-投放需要知道的几个条件-大舍传媒
  • python-可视化篇-简单-条形图输出主要省份GDP排名情况
  • Sora - 探索AI视频模型的无限可能-官方报告解读与思考
  • 算法提升——LeetCode第385场周赛总结
  • 【README 小技巧】在项目README.md 中展示发布到maven 仓库版本
  • R语言【ClusterR】——KMeans_rcpp()
  • 7-liunx服务器规范
  • java序列化之Jackson
  • 服务区智慧公厕
  • mysql数据库 - 统诉
  • Python入门必学:单引号、双引号与三引号的差异与应用
  • spring缓存的使用
  • 交换整数的二进制奇偶位
  • 在做了frp的实验室服务器不同端口间传输文件
  • 数据结构链表力扣例题AC(3)——代码以及思路记录
  • C++初阶:容器适配器priority_queue常用接口详解及模拟实现、仿函数介绍
  • 提取淘宝店铺联系方式的爬虫工具
  • Eureka服务搭建