当前位置: 首页 > news >正文

大模型的实践应用11-“书生”通用大模型的搭建与模型代码详细介绍,以及快速使用方法

大家好,我是微学AI,今天给大家介绍一下大模型的实践应用11-“书生”通用大模型的搭建与模型代码详细介绍,以及快速使用方法。“书生” 通用大模型是上海人工智能实验室研制的大模型,并且已经开源了“书生·浦语”大模型70亿参数的轻量级版本InternLM-7B。InternLM-7B模型主要是基于transformers架构中的解码器开发改造的,架构中运用RMSNorm归一化方法、RotaryEmbedding(旋转位置嵌入)方法、注意力机制与解码器层的改造搭建起来的。该模型利用数以万亿计的高质量数据tokens进行训练,并且以建立一个强大的知识库,为用户灵活地构建自己的工作流提供了一个通用的工具集。

一、“书生”通用大模型

2023年7月6日,上海人工智能实验室(上海AI实验室)与商汤科技联合多家高校发布全新升级的“书生通用大模型体系”。于此同时,上海AI实验室正式开源了“书生·浦语”大模型70亿参数的轻量级版本InternLM-7B, 并推出首个面向大模型研发与应用的全链条开源体系,贯穿数据、预训练、微调、部署和评测五大环节。 InternLM-7B向学术研究完全开放,同时支持免费商用。
在这里插入图片描述

二、InternLM-7B模型评估

InternLM-7B模型使用开源评估工具 OpenCompass 进行了全面的评估。评价包括五个能力维度: 学科能力、语言能力、知识能力、推理能力和理解能力。下面是与 LLaMA-7B、Baichuan-7B、ChatGLM2-6B、Alpaca-7B、Vicuna-7B进行了比较评估,结果如下:

Dat
http://www.lryc.cn/news/250554.html

相关文章:

  • 【开发PaaS】基于Postgresql的开发平台Supabase
  • 前端开启gzip优化页面加载速度
  • 用Java写一个俄罗斯方块
  • 应用于智慧金融的AI边缘计算盒子+AI算法软硬一体化方案
  • 目标检测——Faster R-CNN算法解读
  • Wireshark (一)安装入门 —— 软件介绍
  • Web框架与Django路由层
  • 什么是CAS, 什么是AQS
  • 蓝桥杯每日一题2023.12.1
  • 正则表达式从放弃到入门(1):“正则表达式”是什么?
  • SQL解惑 - 谜题2
  • FWT+高维前缀和:Gym - 103202M
  • 【C++】string类的接口综合运用
  • 分布式ID生成框架Leaf升级踩坑
  • 常用的设计模式
  • git的相关实用命令
  • 【使用`model.status`来获取gurobi求解过程中的模型状态】
  • 【UGUI】Unity教程:实现物品的拖拽功能
  • 【奇淫技巧】两数交换
  • Java核心知识点整理大全26-笔记
  • “上云”还是“下云”?探云计算的下一站未来!
  • Linux中top命令输出日志分析?
  • 执行栈和执行上下文
  • 7、单片机与W25Q128(FLASH)的通讯(SPI)实验(STM32F407)
  • stream流和方法引用
  • Redis——某马点评day01——短信登录
  • AES加密技术:原理与应用
  • Unity中PlayerPrefs在PC上存储位置总结
  • 消融实验:深度学习的关键分析工具
  • Redis缓存——Spring Cache入门学习