当前位置: 首页 > news >正文

中国开源 AI 大模型之光-InternLM2

        今天给大家带来 AI 大模型领域的国产之光 - InternLM2,在10B量级开源大模型领域取得了全球 Top 3 的成绩,仅次于 Meta 发布的 Llama-3,在国内则是第一名的存在!

图片

简介

    InternLM2是由上海人工智能实验室和商汤科技联合研发的一款大型语言模型(LLM),它在多个基准测试中展现出卓越的性能,尤其在长文本处理和开放式主观评估方面。以下是InternLM2的几个关键特点:

  1. 长文本处理能力:InternLM2特别设计了长上下文处理能力,能够处理长达200k个令牌的文本,这使得它在处理长篇幅内容时表现出色。

  2. 开源和免费商用:InternLM2模型及其全链条开源工具体系面向公众全面开源,并且可以免费商用,这促进了其在学术和工业界的广泛应用。

  3. 多阶段训练:模型的训练包括预训练、监督微调(SFT)和基于人类反馈的强化学习(RLHF)。这些阶段确保了模型在遵循指令和符合人类价值观方面的性能。

  4. 技术创新:InternLM2采用了分组查询注意力(GQA)技术来减少长序列推断时的内存占用,并通过位置编码外推技术进一步提升了模型的上下文长度处理能力。

  5. 性能提升:通过条件在线RLHF(COOL RLHF)技术,InternLM2能够协调多样但可能冲突的偏好,并通过多轮Proximal Policy Optimization(PPO)来减少奖励作弊问题。

  6. 社区贡献:InternLM2的贡献不仅在于其高性能,还在于提供了全面的数据准备指南和创新的RLHF训练技术,为社区提供了深入理解和进一步研究的基础。

  7. 模型规模:InternLM2发布了不同规模的模型,包括18亿、70亿和200亿参数的版本,以适应不同的研究和应用需求。

分类

图片

按照模型大小分类

7B:为轻量级的研究和应用提供了一个轻便但性能不俗的模型

20B:模型的综合性能更为强劲,可有效支持更加复杂的使用场景

按照模型命名分类

InternLM2-Base:高质量和具有很强可塑性的模型基座,是模型进行深度领域适配的高质量起点

InternLM2:在Base基础上,在多个能力方向进行了强化,在评测中成绩优异,同时保持了很好的通用语言能力,是我们推荐的在大部分应用中考虑选用的优秀基座

InternLM2-Chat:在Base基础上,经过SFT和RLHF,面向对话交互进行了优化,具有很好的指令遵循,共情聊天和调用工具等能力

技术生态

图片

训练&评测数据

图片

模型微调

图片

模型评测

图片

模型部署

图片

AI 智能体

图片

    接下来的文章将详细讲解如何用 internLM2 训练我们自己的 chatGPT,感兴趣的可以点赞收藏关注!

http://www.lryc.cn/news/349981.html

相关文章:

  • 【嵌入式开发】Arduino人机界面及接口技术:独立按键接口,矩阵按键接口,模拟量按键接口(基础知识介绍)
  • element ui Tree树形控件
  • AI 绘画神器 Fooocus 图生图:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取、所需模型下载
  • yolov8 模型架构轻量化 | 极致降参数量
  • uniapp 小程序低功耗蓝牙配网 ble配网 物联网
  • 服务器防火墙有什么用防护策略
  • 27.哀家要长脑子了!
  • Redis实战—验证码登录注册
  • 对话机器人技术解说
  • 红黑树底层封装map、set C++
  • 压力给到 Google,OpenAI 发布 GPT-4o 来了
  • 【SpringSecurity源码】过滤器链加载流程
  • 第9章.Keil5-MDK软件简介
  • mysql中utf8字符集中文字节长度统计如何统计到2个字节一个汉字
  • 如何实现Linux双网卡同时连接内网和外网的配置?
  • ASCLL码表以及字符的相加减
  • 一键修复所有dll缺失,教大家解决丢失的dll文件
  • wsl2安装rancher并导入和创建k8s集群
  • 内网环境ubuntu设置静态ip、DNS、路由,不影响网络访问
  • 学习前端第三十七天(静态属性静态方法、类检查、错误处理)
  • 全网最全的基于电机控制的38类simulink仿真全家桶----新手大礼包
  • Python使用asyncio包实现异步编程
  • 获取文件夹下的vue文件形成组件,require.context
  • 2024软件测试必问的常见面试题1000问!
  • C++列表实现
  • 论文合集整理推荐2024.5.15
  • JavaScript的跳转传参方式
  • 非阻塞模式下的读写操作
  • Google Ads谷歌广告账户被封停怎么办?
  • AI大模型探索之路-训练篇23:ChatGLM3微调实战-基于P-Tuning V2技术的实践指南