当前位置: 首页 > news >正文

神经语言程式(NLP)项目的15 个开源训练数据集

一个聊天机器人需要大量的训练数据,以便在无需人工干预的情况下快速解决用户的询问。然而,聊天机器人开发的主要瓶颈是获取现实的、面向任务的对话数据来训练这些基于机器学习的系统。

我们整理了训练聊天机器人所需的对话数据集,包括问答数据客户支持数据对话数据多语言数据

用于聊天机器人训练的问答数据集

问题-答案数据集:该语料库包括维基百科文章、从中手动生成的事实问题以及这些问题的手动生成的答案,用于学术研究。

WikiQA 语料库:一组公开可用的问题和句子对,为开放域问答研究而收集和注释。为了反映一般用户的真实信息需求,他们使用Bing查询日志作为问题来源。每个问题都链接到可能有答案的维基百科页面。

雅虎语言数据:此页面包含来自雅虎雅虎问答的手动策划的 QA 数据集。

TREC QA Collection:TREC 自 1999 年以来就有了问答轨道。在每个轨道中,任务都被定义为系统要检索包含开放域、封闭类问题答案的小文本片段。

http://www.lryc.cn/news/298558.html

相关文章:

  • H5 红色文字抖动网址发布页/引导页源码
  • MacOS - 菜单栏上显示『音量』
  • 深入理解常见的设计模式
  • 服务器解析漏洞及任意文件下载
  • ES6扩展运算符——三个点(...)用法详解
  • 限制资源使用
  • 结合Next项目实际认识webpack.splitChunks
  • 【Tauri】(2):使用Tauri应用开发,使用开源的Chatgpt-web应用做前端,使用rust 的candle做后端,本地运行小模型桌面应用
  • C#where T :通用的泛型约束(generic constraint)语法
  • vue使用Mars3d弹框嵌套video视频/实时视频(m3u8)使用hls.js
  • Python爬虫之Ajax数据爬取基本原理
  • osg操控器和键盘切换操控器学习
  • LeetCode1143. Longest Common Subsequence——动态规划
  • 利用Windows10漏洞破解密码(保姆级教学)
  • apk反编译修改教程系列---简单修改apk默认横竖屏显示 手机端与电脑端同步演示【十一】
  • 2301: 不定方程解的个数
  • vue3学习——封装菜单栏
  • 深度学习的进展及其在各领域的应用
  • blender怎么保存窗口布局,怎么设置默认输出文件夹
  • 【开源】基于JAVA+Vue+SpringBoot的实验室耗材管理系统
  • 【ES】--Elasticsearch的分词器详解
  • 【算法】{画决策树 + dfs + 递归 + 回溯 + 剪枝} 解决排列、子集问题(C++)
  • sqlserver 存储过程
  • C语言什么是悬空指针?
  • AES加密后的密码可以破解吗
  • vue3学习——路由进度条
  • VMware虚拟机安装Windows系统教程
  • vue3学习——router-view 过渡动画
  • 从HSE攻击事件漫谈针对勒索攻击防御的两大误区
  • 设计模式(结构型模式)外观模式