当前位置: 首页 > news >正文

[nlp] chathome—家居装修垂类大语言模型的开发和评估

ChatHome: Development and Evaluation of a Domain-Specific LanguageModel for Home Renovation

ChatHome: 家居装修垂类大语言模型的开发和评估

1、摘要:

        我们的方法包括两个步骤:首先,使用广泛的家庭装修数据集(包括专业文章、标准文档和网络内容)对通用模型进行后预训练。其次,使用基于家庭装修的提示生成的问答对数据集实现指令调整策略。

        本研究旨在证明预训练后对大型语言模型进行微调可以提高它们在特定领域的性能。在增强特定领域的能力的同时,我们还关注模型的一般能力的变化,并进行详细的评估,这将在后续章节中详细描述。
        总之,有两个主要的贡献。
• 我们建立了ChatHome,这是一个经过微调的专注于家居装修领域的大模型。
• 我们引入了一个领域数据集,并对在通用和垂域数据集进行了全面的实验,来验证我们模型的有效性。

2、数据构建

pretrain corpus

训练的语料库

国家标准、书籍、网站、通用数据

26.6M tokens from the domain corpus and 276.6M tokens from the general corpus.

1比11

http://www.lryc.cn/news/195735.html

相关文章:

  • http(下)
  • Python学习基础笔记七十二——IDE集成开发环境
  • [MQ]Win平台RocketMQ安装启动
  • vscode工程屏蔽不使用的文件夹或文件的方法
  • 黑马JVM总结(三十四)
  • [linux]vncserver常用终端命令合集
  • 亚马逊、eBay,速卖通,国际站买家账号支付异常问题解决方法
  • Constitutional AI
  • TDengine 资深研发整理:基于 SpringBoot 多语言实现 API 返回消息国际化
  • 数据结构-冒泡排序Java实现
  • 完整教程:Java+Vue+Websocket实现OSS文件上传进度条功能
  • 【微服务 SpringCloud】实用篇 · 服务拆分和远程调用
  • Linux 下I/O操作
  • C#内映射lua表
  • android studio检测不到真机
  • 【Eclipse】设置自动提示
  • 单片机TDL的功能、应用与技术特点 | 百能云芯
  • 解决笔记本无线网络5G比2.4还慢的奇怪问题
  • GitHub Action 通过SSH 自动部署到云服务器上
  • 【AOP系列】7.数据校验
  • 黑马JVM总结(三十七)
  • 企业如何通过媒体宣传扩大自身影响力
  • 处理vue直接引入图片地址时显示不出来的问题 src=“[object Module]“
  • vue3 v-md-editor markdown编辑器(VMdEditor)和预览组件(VMdPreview )的使用
  • java正则表达式 及应用场景爬虫,捕获分组非捕获分组
  • 基于 Debian 稳定分支发行版的Zephix 7 发布
  • MBR20100CT-ASEMI肖特基MBR20100CT参数、规格、尺寸
  • 修炼k8s+flink+hdfs+dlink(五:安装dockers,cri-docker,harbor仓库)
  • github: kex_exchange_identification: Connection closed by remote host
  • AWS香港Web3方案日,防御云安全实践案例受关注