当前位置: 首页 > article >正文

阿里 新零售领域的多模态知识图谱的建设与应用

在这里插入图片描述
原文出处 datafun talk 作者 阿里高级算法工程师徐国海 由本知乎号根据阅读整理

公众号 系统之神与我同在

1.知识图谱简介:

知识图谱(Knowledge Graph)是对现实世界中的实体、概念及其之间关系的刻画和描述,知识图谱的经典结构是三元组,三元组的内容包括实体、类型、属性、关系等等。一个简单的知识图谱示例如下:

在这里插入图片描述
知识图谱的典型应用包括:搜索推荐、智能问答、决策分析、智能创作等等。从应用种类来看,分为:

·原图应用:查询图谱后获取相关信息,结果基本满足应用需求。例如:搜索、推荐、问答等等。
·算法赋能:从图谱上获取信息后,作为下游任务模型的输入,联合建模完成应用需求。例如:决策分析、智能创作、认知计算

其应用形态包括以下几种:

·业务应用:自营业务 + 数据 + 算法(e.g., 阿里的商品知识图谱)
·知识中台:平台/第三方业务 + 数据 + 服务(e.g., 百度的知识图谱)
·解决方案,算法 + 工具化 + 实施(e.g., 阿里云、华为云)

2.领域知识图谱建设与应用
新零售场景下的业务问题主要是:如何有效连接用户和商品。用户通过搜索、与客服对话来获得商品信息。其核心问题是:1.需要从用户问题推理用户诉求,2.需要回答用户对商品具体信息的咨询,3.推荐商品时给出解释性推荐理由,促进成交转化。

在这里插入图片描述
在这里插入图片描述
为了解决上述问题,需要以用户和商品为基础,构建以POI为中心的领域知识图谱:
在这里插入图片描述
一个POI知识图谱的技术路径举例如下:
在这里插入图片描述
POI知识图谱的关键技术在于:

1.短语挖掘:通过远程监督获取种子短语,Wide and Deep 特征 + 随机森林分类器,Viterbi句子解码 + EM 框架,BERT MLM语言模型过滤(可选)。
在这里插入图片描述
其技术特色为:1.不需要人工标注,2.跨多个行业通用,3.挖掘的短语准确率高。
在这里插入图片描述
2.实体识别:远程监督:基于词典回标;引入外部知识:Lexicon自动短语挖掘和属性PV类型;使用CNN-CRF / FLAT-CRF、BERT-BILSTM-CRF;
在这里插入图片描述
其技术特色为:1. 利用远程监督降低标注量、2.2. 引入外部知识提升准确率。
在这里插入图片描述
**3.关系抽取:**采用BILSTM + GCN + CNN / BERT + FC + softmax + Entity + 分隔符(Knowledge) / K-BERT + ConceptNET + HowNET
在这里插入图片描述
其技术特色为:1.远程监督降低标注量、2. 引入外部知识提高效果(实体知识、边界信息、三元组知识库)

在这里插入图片描述
应用思路:

在这里插入图片描述
实际应用——导购推荐:基于领域知识优化粗召阶段

在这里插入图片描述
实际应用——卖点生成
在这里插入图片描述
3. 多模态知识图谱建设与应用

直播场景的业务问题:在直播场景,通过丰富的信息和多样化的模态,让用户快速认知商品,激发兴趣。例如打造以虚拟人为主的智能直播间和真人直播的智能助理。
在这里插入图片描述
目标:面向直播场景,构建以内容为中心,包含商品丰富的素材且具有不同模态表达的多模态知识图谱Multi-modal Knowledge Graph (MKG)。

核心要素:Concepts: 商品Aspect,Modals: 文本、图像、视频。

MKG的关键技术路径:

·文本知识挖掘
·图片处理
·多模态融合
在这里插入图片描述

关键技术:图文匹配

多模态预训练 & 预测:
在这里插入图片描述
pre-training阶段的输入格式:
在这里插入图片描述
Finetune阶段:
在这里插入图片描述
MKG的知识沉淀:在这里插入图片描述
MKG的应用:虚拟主播-图文剧本生成

依靠MKG生成剧本,并搭配相应的图片。

在这里插入图片描述
MKG的应用:虚拟主播-短视频生成

包括规划路径、组织图片、生成剧本。
在这里插入图片描述
MKG的应用:智能辅播-商品展示
在这里插入图片描述

http://www.lryc.cn/news/2413989.html

相关文章:

  • 二进制0和负0的补码反码源码
  • JS压缩谁最强?对比5款JS代码压缩工具
  • 系统分析师——论文篇(三)
  • ESP8266 WebServer③-基于AsyncElegantOTA.h网页OTA升级
  • javascript高仿热血传奇游戏
  • 802.1D第一版出炉
  • Android开发-android:gravity和android:layout_Gravity属性的用法
  • 测试工具整理(3)——单元测试
  • 计算机网络的组成及通信子网和资源子网的划分
  • Java使用XDOC实现word,pdf等格式的生成及转换
  • 简单认识NHibrenate
  • OpenCV的copyTo()函数讲解及应用
  • ASP.Net学习心得
  • 用 Gmail 的 SMTP 发送邮件
  • 启动应用程序出现msflxgrd.ocx找不到问题解决
  • 鸿蒙原生应用元服务-访问控制(权限)开发工作流程相关
  • main.js_vue
  • 又一个好用的嵌入式设计框架
  • C#上下文菜单(右键菜单)ContextMenuStrip用法总结
  • 基于STC12C5A60S2系列1T 8051单片机的TM1637键盘数码管模块的数码管显示与TM1637芯片连接的按键的按键值的功能
  • JAX-WS 介绍 【转载】
  • 东方航空航班如何值机?
  • location.hash属性介绍
  • 键盘打字指法规范(附图解)
  • 什么是webservice
  • 数据中心日常运维主要工作内容具体包括哪些方面呢?
  • Windows系统缺少丢失mscoree.dll文件如何解决的?
  • 如何扩容C盘?6种扩展C盘方法!
  • process.waitfor()超时配置
  • Structs2学习(三)