当前位置：首页 > news >正文

(done) 什么是词嵌入技术？word embedding ?（这里没有介绍词嵌入算法）（没有提到嵌入矩阵如何得到）

news 2025/9/13 18:52:45

参考视频：https://www.bilibili.com/video/BV1sw411S7i1/?spm_id_from=333.788&vd_source=7a1a0bc74158c6993c7355c5490fc600

词嵌入（word embedding）：把词汇表中的词或短语 -------- 映射 ----> 固定长度向量

我们可以把 one-hot 编码表示的高维稀疏向量 -------- 转化 ---------> 低维连续向量
在这里插入图片描述

使用低维连续向量的好处是：
1.节省存储空间和计算成本
2.可以更好地表示不同单词之间的关系
如下图，我们可以使用降维算法，把词嵌入向量(word embedding vectors) 映射到二维平面上
在这里插入图片描述

词嵌入向量不仅可以表达语义的相似性，还能通过向量的数学关系描述词语之间的词语关联
在这里插入图片描述

通过特定的词嵌入算法 (如 word2vec, fasttext, glove 等)，我们能够训练一个通用的嵌入矩阵
如下图，矩阵中的每一行都代表了一个词向量
这些词向量是通用的，它们一旦训练完成，就可以用在不同的 NLP 任务中
在这里插入图片描述

如下图，嵌入矩阵的行，就是语料库(词汇表, vocab) 中词语的个数，矩阵的列是词语的维度
在这里插入图片描述

接下来我们用一个具体的例子，来说明词嵌入的过程

首先我们需要一个 “已经训练好的” 嵌入矩阵 E
这个矩阵大小是 5000 x 128
5000 表示语料库/词汇表中有 5000 个单词
128 表示每个单词矢量的维度是 128 维
如下图表示
在这里插入图片描述

接下来我们看一句话 “我喜欢数学”，我们的目的是把这句话里的每个词，都表示成一个 128 维的向量
在这里插入图片描述

接下来进行
1.切词，把这句话里的所有词语切出来
2.查询词汇表，根据词汇表，查找出这些词语的 one-hot 编码
3.组成矩阵 V，把那些 one-hot 编码矢量组合成一个 4 x 5000 的矩阵 V
在这里插入图片描述

接下来使用 V x E，可以得到这四个词语的 “嵌入向量” (embedding vectors)
在这里插入图片描述

在这里插入图片描述

词嵌入的优势是什么？
1.储存维度降低、计算成本降低
2.语义相似的词语在向量空间上更相近
3.one-hot编码不具有通用性，而嵌入矩阵是通用的，同一份词向量，可以用在不同的 NLP 任务中
在这里插入图片描述

查看全文

http://www.lryc.cn/news/318842.html

C++静态成员函数和非静态成员函数之间的相互调用

最好用的流程编辑器bpmn-js系列之基本使用

Singularity（八）| conda实战

elementui el-select组件多选设置初始值无法修改问题

电脑自动关机后文件夹不见了怎么办？别急，找回方法在这里

tcp/ip协议2实现的插图，数据结构8 (30 - 32章)

挑战杯多目标跟踪算法实时检测 - opencv 深度学习机器视觉

【数据结构】顺序表的定义及实现方式

R语言数据挖掘-关联规则挖掘（1）

【ansible】ansible的介绍和安装

二维数组_矩阵交换行

mysql笔记：14. 权限管理

无硫防静电手指套：高科技产业的纯净与安全新选择

由浅到深认识C语言（10）：字符串处理函数

防范服务器被攻击：查询IP地址的重要性与方法

3. ElasticSearch搜索技术深入与聚合查询实战

【Linux】Shell编程【一】

Windows10+tensorrt+python部署yolov5

相关文章：