当前位置: 首页 > news >正文

数学模型,如何计算概率?

既然是数学模型,那应该如何计算呢?

最简单的方法,当然就是用统计学的方法去计算了,简单说来,就是靠输入的上下文进行统计,计算出后续词语的概率,比如「你吃了晚饭了吗」,「你吃了」后面按照概率,名词如「饭」或「晚饭」等概率更高,而不太可能是动词,如「睡」「睡觉」。

这是语言模型的第一阶段,模型也被称为是统计语言模型(Statistical Language Model,SLM),其基本思想是基于马尔可夫假设建立词语测模型,根据最近的上下文预测下一个词。

后续语言模型的发展又迭代了三个版本。

第二阶段是神经网络语言模型(Neural Language Model,NLM),是一个用神经网络来训练模型,学习单词之间的关联性和概率关系。它能够利用大量的数据进行深度学习,从而捕捉到词汇之间更加复杂的关系。NLM 模型采用的是分层的结构,把输入的文本数据空间投射到高维的语义空间中并进行学习。通过不断地更新神经网络模型参数,NLM 的神经网络逐渐学会了文本数据的语义并能够生成连贯自然、语义准确的文本。

与前面提到的 SLM 相比,由于深度神经网络的学习能力更强,NLM 在学习语言模型时具有更好的泛化能力和适应性。比如能生成更长的文本等。但 NLM 相对来说也比较依赖更大的数据集,并且需要花很多人力在数据标注上。

第三阶段是预训练语言模型(Pre-trained Language Model,PLM),是一种使用大量文本数据来训练的自然语言处理模型。相对 NLM 来说,PLM 使用无监督学习方法,因此不需要先标注数据或注明文本类型等信息。各位可能听过的 Transformer 架构就是一种预训练语言模型。

http://www.lryc.cn/news/66757.html

相关文章:

  • 【Ehcache技术专题】「入门到精通」带你一起从零基础进行分析和开发Ehcache框架的实战指南(Spring整合ehcache)
  • 合肥市2023年度高校毕业生“双千培养工程”培训项目学员招募公告
  • 重写Properties类,实现对properties文件的有序读写,数据追加,解决中文乱码
  • 态势感知与信质、信量
  • 20230508----重返学习-call()与bind()重写-JS中数据类型检测汇总-装箱与拆箱-类的多种继承方案
  • Node.js对ES6 及更高版本的支持
  • 【华为OD机试2023】工作安排 100% C++ Java Python
  • 面试题Spring - 关于Spring的25个经典问题和答案
  • C++学习day--10 条件判断、分支
  • 和月薪5W的聊过后,才发现自己一直在打杂···
  • SSM框架学习-AOP通知类型
  • 微信小程序原生开发功能合集十四:登录健权及注册功能实现
  • 【Java零基础入门篇】第 ⑤ 期 - 抽象类和接口(二)
  • Halcon 集合运算(差集difference、交集intersection、并集union2、打散connection与 合集 union1)
  • Allegro约束规则设计
  • PyQt5桌面应用开发(11):摸鱼也要讲基本法之桌面精灵
  • Talk预告 | 大连理工大学IIAU Lab在读博士生严彬:走向通用实例感知
  • 2023-05-04 LeetCode每日一题(摘水果)
  • [工具]Pytorch-lightning的使用
  • 互联网摸鱼日报(2023-05-09)
  • MySQL常见的存储引擎
  • 迅为i.MX6ULL开发板生成 KEY 文件,并安装
  • 常见舆情监测系统的分类和特点
  • 联合群美叶彦文:坚持,只要有一口气,能坚持多久,就坚持多久
  • 动态规划的学习
  • 计算机网络:HTTPS
  • 数据库系列-什么是 JDBC?它的作用是什么?
  • C++学习day--08 数组和字符串
  • 系统分析师之系统测试与维护(十六)
  • 板材激光切割机切割穿孔时注意的几个问题