当前位置: 首页 > news >正文

[论文笔记] chatgpt系列 2.6 DeepSpeed-chat 数据集

一、FT数据集 & Reward model数据集

Deepspeed-chat 源代码的数据集:

  1. Dahoas/rm-static: 这是一个用于强化学习的静态环境数据集,包含了一个机器人在一个固定环境中的运动轨迹。该数据集旨在用于评估强化学习算法在静态环境下的表现。

  2. Dahoas/full-hh-rlhf: 这是一个用于深度强化学习的数据集,包含了一个机器人在一个动态环境中的运动轨迹。该数据集旨在用于评估深度强化学习算法在动态环境下的表现。

  3. 多轮对话数据集 Dahoas/synthetic-instruct-gptj-pairwise: 这是一个用于自然语言处理的数据集,包含了两个人之间的对话。该数据集旨在用于评估自然语言处理模型在对话生成任务中的表现。     

  4. yitingxie/rlhf-reward-datasets: 这是一个用于强化学习的数据集,包含了多个机器人在不同环境中的运动轨迹和奖励信号。该数据集旨在用于评估强化学习算法在多智能体系统中的表现。

 二、换成自定义数据集

wikitext2、ptb、c4

http://www.lryc.cn/news/104429.html

相关文章:

  • 探究SAM和眼球追踪技术在自动医学图像分割的应用(2023+GazeSAM: What You See is What You Segment)
  • excle中的条件求和SUMIF
  • python-网络爬虫.Request
  • 时序预测 | MATLAB实现GRNN广义回归神经网络时间序列预测(多指标,多图)
  • 如何看待低级爬虫与高级爬虫?
  • 3.分支与循环
  • 面试之多线程案例(四)
  • 抄写Linux源码(Day1:获取并运行 Linux0.11)
  • 大数据_Hadoop_Parquet数据格式详解
  • Docker的安装和部署
  • FPGA项目实现:秒表设计
  • Postgresql源码(109)并行框架实例与分析
  • ES派生类的prototype方法中,不能访问super的解决方案
  • 使用adb通过电脑给安卓设备安装apk文件
  • 113、单例Bean是单例模式吗?
  • RabbitMQ 集群部署
  • 2023年【零声教育】13代C/C++Linux服务器开发高级架构师课程体系分析
  • iOS开发-实现热门话题标签tag显示控件
  • linux系统磁盘性能监视工具iostat
  • BT#蓝牙 - Link Policy Settings
  • c++ | 动态链接库 | 小结
  • 如何使用Flask-SQLAlchemy来管理数据库连接和操作数据?
  • 麒麟-飞腾Kylin-V4桌面arm64系统静态编译QT
  • CentOS 项目发出一篇奇怪的博文
  • 【Mybatis-Plus】or拼接
  • SpringBoot项目部署在Windows与Centos上
  • 网站服务器出错的原因分析和解决方法
  • 电影推荐系统】系统初步搭建及离线个性化推荐
  • Redis 集群 (cluster)
  • 《吐血整理》进阶系列教程-拿捏Fiddler抓包教程(19)-Fiddler精选插件扩展安装,将你的Fiddler武装到牙齿