当前位置: 首页 > news >正文

文本摘要简介

        文本摘要是从一段长文本中提取出最重要的信息,并生成一个简短而有意义的摘要。这个过程可以分为两种主要方法:         

        抽取式摘要(Extractive Summarization):从原文中直接提取出关键句子或段落,组成摘要。这种方法不会改变原文的内容,只是选择了最能代表文章主题的部分。

  • 无监督:Lead,Centroid,Cluster,TextRank
  • 有监督:R2N2,NeuralSum,SummaRuNNer,BertSum

        生成式摘要(Abstractive Summarization):这种方法通过理解原文内容,然后用自己的语言生成一个简短的总结。生成式摘要可能包含与原文不同的词语或句子结构,但它依然能够传达原文的核心信息。

        Seq2seq经典架构:优点——不限于原文自由生成摘要、摘要展示了文本的关键信息;缺点——容易产生重复
        PGN(Pointer-Generator Network)架构:使用生成概率进行取舍,要么从词汇表生成一个单词,要么从原文本复制一个单词,相对减少了摘要重复问题

  评估方法:

  • BLEU(Bilingual evaluation understudy):主要计算精确度
  • ROUGE(Recall-Oriented Understudy for Gisting Evaluation:基于召回率,评价标准——ROUGE-N和ROUGE-L
http://www.lryc.cn/news/426278.html

相关文章:

  • 3.MySQL面试题之Redis 和 Mysql 如何保证数据一致性?
  • 浅谈TCP协议、UDP协议
  • SQL业务题: 从不订购的客户
  • 怎么直接在PDF上修改内容?随心编辑PDF内容
  • 聊天室项目测试报告
  • 语音识别(实时语音转录)——funasr的详细部署和使用教程(包括实时语音转录)
  • 【网络编程】TCP机械臂测试
  • 笔记:在WPF中如何注册控件级全局事件和应用程序级全局事件
  • 【Linux系列】telnet使用入门
  • 音视频相关知识
  • 数据结构--第七天
  • 代码随想录Day34:62.不同路径、63.不同路径II、343.整数拆分、96.不同的二叉搜索树
  • 【信息学奥赛一本通】1008:计算(a+b)/c的值
  • 使用 jstat 进行 Java 应用程序性能监控
  • Prompt指令调优大揭秘
  • C语言中的⽂件操作
  • 黑马前端——days14_js
  • 【自动驾驶】ROS中参数服务器通信(c++)
  • 零基础5分钟上手亚马逊云科技核心云开发知识 - 网络基础
  • Unity Recttransform操作
  • MIT线性代数P5
  • patroni+etcd开启SSL认证(三个节点证书一致 使用openssl命令)
  • Eureka入门指南:微服务注册与发现的基础概念
  • Linux:动态库和静态库
  • 8.13网络编程
  • 蚂蚁AL1 15.6T 创新科技的新典范
  • 2024年【汽车驾驶员(技师)】考试报名及汽车驾驶员(技师)试题及解析
  • 2024年【甘肃省安全员C证】报名考试及甘肃省安全员C证考试总结
  • RabbitMQ 双机系统偶尔丢失消息问题排查
  • Python 环境搭建指南 超详细