当前位置: 首页 > news >正文

【IntermLM2】学习笔记

微调方式
在大模型的下游应用中,可以有两种微调方式

  1. 增量续训
    即无监督的方式,让模型学习一些新知识,比如某些垂直领域的新知识
    使用的数据有:书籍,文章,代码等
  2. 有监督微调
    为了让模型学会理解指令进行对话,或者注入少量的领域知识
    使用的数据为高质量的对话和问答的数据
    全量参数微调
    部分参数微调 (lora等)

扩展上下文长度
必要性:
1. 检索增强生成(RAG)需要检索的时候返回很长的上下文
2. Agent应用时,用户的历史对话数据很长

LLaMA的transformer的更新

  1. 将 LayerNorm (Ba et al., 2016) 替换为 RMSNorm (Zhang & Sennrich, 2019)
  2. 将激活函数设置为 SwiGLU (Shazeer, 2020)
http://www.lryc.cn/news/329901.html

相关文章:

  • 【二叉树】Leetcode 230. 二叉搜索树中第K小的元素【中等】
  • JS中常用的几种事件
  • Android WebView的使用与后退键处理
  • 【备忘录】Docker 2375远程端口安全漏洞解决
  • 343. 整数拆分(力扣LeetCode)
  • Spring面试题系列-3
  • 【比特币】比特币的奥秘、禁令的深层逻辑与风云变幻
  • 【情感分析概述】
  • 【御控物联】JavaScript JSON结构转换(12):对象To数组——键值互换属性重组
  • 5.6 物联网RK3399项目开发实录-Android开发之U-Boot 编译及使用(wulianjishu666)
  • Python版【植物大战僵尸 +源码】
  • 【明道云】如何让用户可以新增但不能修改记录
  • GPT-1原理-Improving Language Understanding by Generative Pre-Training
  • web3.0入门及学习路径
  • MATLAB 自定义中值滤波(54)
  • harmonyOS的客户端存贮
  • 安科瑞智慧安全用电综合解决方案
  • Web 前端性能优化之二:图像优化
  • android——枚举enum
  • Day54:WEB攻防-XSS跨站Cookie盗取表单劫持网络钓鱼溯源分析项目平台框架
  • 2024年MathorCup数学建模思路C题思路分享
  • HCIP作业
  • 如何向sql中插入数据-接上一篇《MySQL数据库的下载和安装以及命令行语法学习》续
  • 简单的HTML
  • 2024最新 maven 高级用法 (概念自己百度)
  • 【C++】每日一题 12 整数转罗马数字
  • C++学习建议
  • python实现泊松回归
  • 软件测试-进阶篇
  • Google人才选拔的独特视角