当前位置: 首页 > news >正文

大语言模型(LLM)技术名词表(一)

  1. LLMs on a Phone:指在手机设备上运行的大型语言模型。

  2. Scalable Personal AI:指用户可以在个人设备上对AI模型进行微调的技术。

  3. Responsible Release:发布AI模型时考虑社会、法律和伦理影响的做法。

  4. Multimodality:AI模型能处理和理解文本、图像、声音等多种类型数据的能力。

  5. LLaMA:Meta公司开发的大型语言模型,社区泄露后引发创新和开发。

  6. RLHF (Reinforcement Learning from Human Feedback):通过人类反馈训练AI模型的方法。

  7. LoRA (Low Rank Adaptation):一种通过低秩分解降低更新矩阵大小的模型微调技术。

  8. Chinchilla:可能指提高大规模语言模型效率的技术或模型结构。

  9. Stable Diffusion:一个开源图像生成AI项目,使用生成对抗网络(GANs)产生高分辨率图像。

  10. Dall-E:OpenAI开发的根据文本描述生成图像的AI模型。

  11. Fine-tuning:在预训练模型基础上进一步训练优化特定任务性能的过程。

  12. Stackable:指微调方法可堆叠应用,逐一叠加不同微调以提升模型表现。

  13. Low rank:指矩阵中非零奇异值数量较少,微调时改变部分参数,保持结构大体不变。

  14. Full-rank updates:更新模型所有参数的方法。

  15. Datasets and tasks:机器学习模型训练所需的数据样本集合和模型需要完成的特定问题。

  16. Distillation:一种模型压缩技术,训练小型神经网络模仿大型网络行为。

  17. Model weights:连接神经网络神经元的参数,训练中学习得到,用于预测。

  18. ULM (Universal Language Model):设计处理、理解、生成不同任务和领域内文本的模型。

  19. Instruction Tuning:优化语言模型以更好理解并执行自然语言指令的过程。

  20. Conversation Tuned:优化语言模型以提高进行自然语言对话的能力。

  21. Alpaca:斯坦福大学发布的项目,对LLaMA模型进行指令调整。

  22. alpaca-lora:GitHub代码库,使用低秩微调技术在RTX 4090上数小时内训练模型。

  23. Quantization:减少模型权重位数,以减小模型大小并加速推理的过程。

  24. Vicuna:发布与Bard功能相当的13B参数模型的跨大学合作项目。

  25. GPT-4-powered eval:使用GPT-4模型评估技术,对其他模型输出进行定性比较。

  26. ChatGPT API:提供外部开发者和应用程序访问ChatGPT功能的接口。

  27. GPT4All:Nomic创建的模型及生态系统项目。

  28. μ-parameterization (Micro-parameterization):模型规模优化方法,提高性能。

  29. Parameter Efficient Fine Tuning (PEFT):参数高效微调技术,用较少可学习参数有效微调模型。

  30. LLaMA-Adapter:使用PEFT技术,对LLaMA模型添加指令调整和多模态能力,快速训练。

  31. ScienceQA:针对多模态科学问答的基准测试,评估模型性能。

  32. Koala:加州大学伯克利分校发布的对话模型,使用公开数据训练。

  33. Pythia-12B:12B参数的语言模型,用于LLaMA之外的实验和开发。

  34. ChatGPT:OpenAI发行的基于GPT架构的大型对话式语言模型。

  35. Data quality scales better than data size:优质数据对模型影响大于数据量增加的原则。

http://www.lryc.cn/news/309093.html

相关文章:

  • C++ 快速排序快速选择
  • 雅马哈伺服器TS-S系列说明具体详情内容可参看PDF目录内容
  • SpringBoot底层原理
  • 【golang】25、图片操作
  • kswapd0挖矿病毒攻击记录
  • 如何使用 takeUntil RxJS 操作符来声明性地管理订阅
  • 在Centos中用Docker部署oracle-12c
  • JS进阶——高级技巧
  • TG-ADMIN 权限管理系统
  • 十五届蓝桥杯第三期模拟赛题单(C++、java、Python)
  • 嵌入式驱动学习第一周——git的使用
  • 界面控件DevExpress .NET MAUI v23.2新版亮点 - 拥有全新的彩色主题
  • 大语言模型LLM Pro+中Pro+(Prompting)的意义
  • React 中,children 属性
  • 多行业万能预约门店小程序源码系统 支持多门店预约小程序 带完整的安装代码包以及搭建教程
  • Node.js 中 fs 模块文件操作的应用教程
  • 一些常用到的git命令
  • spring boot3解决跨域的几种方式
  • 【Spring】19 @Autowired注解使用详解
  • Educational Codeforces Round 132 (Rated for Div. 2) E. XOR Tree(启发式合并+贪心)
  • JavaScript 基本数据类型的详解
  • DDR5内存相比DDR4内存的优势和区别?选择哪一个服务器内存配置能避免丢包和延迟高?
  • 篮球游戏中的挑战精神与怄气心理:扣篮被帽后的再度冲击
  • JavaScript高级程序设计
  • 初阶数据结构:栈与队列
  • Houdini学习笔记
  • 电销机器人识别客户情绪状态
  • AI推介-大语言模型LLMs论文速览(arXiv方向):2024.02.25-2024.03.01
  • Cesium插件系列——3dtiles压平
  • APS面试审核准备的常规问题