当前位置: 首页 > news >正文

如何让人机对话更自然?

来源:投稿 作者:顾相欢
编辑:学姐

AAAI-2022|定制对话的人设和知识背景

原文标题:

Call for Customized Conversation: Customized Conversation Grounding Persona and Knowledge

原文链接:

https://arxiv.org/abs/2112.08619

一、Introduction

人类在对话时,考虑到的除了知识信息,还与人设信息有关。比如你向一个素食主义者推荐餐厅的时候,总归不会说哪家炸鸡店好吃。根据这一点,在人机对话中结合先验知识和人设信息是非常重要的。

(下图第二种回答是不是比第一种更自然?)

二、FoCus Dataset

在本项目中,作者构建了一个新的数据集,叫做FoCus。

将对话的情景设定为谈论一些地标,与其相关的知识有地标的历史、艺术设计、建筑结构、作用、旅游业和地质信息。会话代理就要根据人设来告知用户不同方面的地标信息。

1、Dataset Creation

地标信息来自于维基百科上5316个页面,每个页面内容超过8000字,涵盖了历史、旅游、建筑等多方面信息。同时,数据集中还包含27170个有关于人设的语句,这些语句中含有地标的关键词。

在创建人设时,我们先用五个句子描述角色的背景。随后在给定的维基百科页面上提取关键字,结合关键字创作角色语句。

在创建对话集时,标注者以人机交替角色的形式进行多轮对话,回答时要标记他们用了有关于人设或是知识的句子。而且我们发现,来自单人建立的数据质量更高,因为提出问题的人比其他人更清楚自己要得到怎样的回答。

2、Dataset Analysis

机器说的语句(141.13)比人类说的语句 (40.94)要长的多,因为它用到了很多专业知识。

机器语句可以被分为三类:告知、确认、建议。“告知”只有知识信息,没有人设信息。“确认”复述了用户的偏好并表达赞同。“建议”提出了用户可能喜欢的额外信息。

三、Model

本对话模型由检索模块和对话模块构成,检索模块根据问题寻找相应的知识信息,对话模块根据知识信息、人设信息和过去的对话生成回复。

检索模块计算问题与可能的知识信息之间的TF-IDF分数,将范围缩小到维基百科的五个段落之间。

对话模块由上下文相关、人设预测、知识信息预测和语言建模组成。它先生成当前对话轮次的上下文相关表示,然后模型在给定上下文相关表示的情况下学习使用哪个人设语句和知识信息。

四、Experiments

使用到的Baseline语言模型有:transfromer decoder、transfromer encoder-decoder、GPT-2\BART。

自动评估指标:ppl、BLUE、ROUGE-1-F、ROUGE-2-F,准确率Acc

人工评估指标:

五、Conclusion

本文介绍的数据集能够结合人设信息和维基百科页面中的知识信息,它的表达更自然也更难被机器模仿。FoCus数据集可以帮助构建更多更像人类的智能体,使用该数据集训练的模型可以在未来使对话代理更有吸引力,同时有更渊博的知识。

关注下方《学姐带你玩AI》🚀🚀🚀

带你了解更多人工智能前沿资讯

论文解读视频代码数据集回复“500”免费领

码字不易,欢迎大家点赞评论收藏!

http://www.lryc.cn/news/18767.html

相关文章:

  • Python每日一练(20230224)
  • 【Linux】-- Shell的运行原理、Linux当中的权限
  • MOS管选型参数:VGS(th)
  • 二.线性表之顺序表
  • ElasticSearch - SpringBoot整合ElasticSearch实现文档的增删改
  • JavaScript 库
  • 云解析DNS为什么要配置默认线路?
  • Linux命令之awk
  • 实战-缓存数据一致+binlog初始+cannel监听+数据迁移,数据一致性架构设计
  • nginx配置中proxy_pass反向代理502的bug
  • JavaScript 两种方案打开文件对话框
  • Pycharm远程服务器常见问题
  • 内容团队如何快速出稿
  • es-08索引的批量操作
  • 诈金花的概率
  • ESP32设备驱动-MLX90393磁场传感器驱动
  • Java面试题-Spring框架
  • 【计算机物理模拟】-力矩、转动惯量和角速度之间的关系
  • async和await用法理解和快速上手 , 同步任务和异步任务顺序安排和轻松理解 , js代码执行顺序表面知道
  • Linux下java服务占用cpu过高如何处理
  • ros下用kinectv2运行orbslam2
  • MVP简单模型搭建【架构】
  • 若依ruoyi框架实现目录树与查询页面联动
  • Laravel框架学习笔记——Laravel环境配置及安装(Ubuntu20.04为例)
  • 模拟百度翻译-课后程序(JAVA基础案例教程-黑马程序员编著-第六章-课后作业)
  • 自然语言处理(NLP)之求近义词和类比词<MXNet中GloVe和FastText的模型使用>
  • 2023年CDGA考试-第13章-数据质量(含答案)
  • ASEMI高压MOS管ASE65R330参数,ASE65R330图片
  • LeetCode动态规划经典题目(九):子序列、子数组问题
  • 如何利用有限的数据发表更多的SCI论文?——利用ArcGIS探究环境和生态因子对水体、土壤和大气污染物的影响