当前位置: 首页 > news >正文

自然语言处理-词嵌入 (Word Embeddings)

 人工智能例子汇总:AI常见的算法和例子-CSDN博客 

词嵌入(Word Embedding)是一种将单词或短语映射到高维向量空间的技术,使其能够以数学方式表示单词之间的关系。词嵌入能够捕捉语义信息,使得相似的词在向量空间中具有相近的表示。

 常见词嵌入方法

  1. 基于矩阵分解的方法

    • Latent Semantic Analysis (LSA)
    • Latent Dirichlet Allocation (LDA)
    • 非负矩阵分解 (NMF)
  2. 基于神经网络的方法

    • Word2Vec(Google 提出)
      • CBOW(Continuous Bag of Words):通过上下文预测目标词
      • Skip-gram:通过目标词预测上下文
    • GloVe(Stanford 提出)
      • 结合全局共现矩阵局部窗口信息,优化词向量质量
    • FastText(Facebook 提出)
      • 采用子词(Subword)表示,能更好处理未登录词(OOV, Out of Vocabulary)
  3. 基于 Transformer 预训练模型的方法

    • ELMo(Embeddings from Language Models)
    • BERT(Bidirectional Encoder Representations from Transformers)
    • GPT(Generative Pre-trained Transformer)
    • T5(Text-To-Text Transfer Transformer)
http://www.lryc.cn/news/530094.html

相关文章:

  • 自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数
  • 【论文笔记】Fast3R:前向并行muti-view重建方法
  • 谈谈你所了解的AR技术吧!
  • upload labs靶场
  • 搜索引擎友好:设计快速收录的网站架构
  • 基于 oneM2M 标准的空气质量监测系统的互操作性
  • 春晚舞台上的人形机器人:科技与文化的奇妙融合
  • 零基础学习书生.浦语大模型-入门岛
  • Gurobi基础语法之 addConstr, addConstrs, addQConstr, addMQConstr
  • 数据结构---图的遍历
  • Qwen 模型自动构建知识图谱,生成病例 + 评价指标优化策略
  • .Net Web API 访问权限限定
  • 项目架构调整,切换版本并发布到中央仓库
  • 考试知识点位运算
  • matlab快速入门(2)-- 数据处理与可视化
  • Kafka中文文档
  • Python-列表
  • 51单片机开发:定时器中断
  • 【HarmonyOS之旅】基于ArkTS开发(三) -> 兼容JS的类Web开发(二)
  • 算法【混合背包】
  • WordPress eventon-lite插件存在未授权信息泄露漏洞(CVE-2024-0235)
  • 基于微信小程序的医院预约挂号系统设计与实现(LW+源码+讲解)
  • C++初阶 -- 手撕string类(模拟实现string类)
  • 【Postman接口测试】Postman的安装和使用
  • miniconda学习笔记
  • 区块链项目孵化与包装设计:从概念到市场的全流程指南
  • JavaScript的基本组成
  • [Linux]从零开始的STM32MP157 U-Boot移植
  • 【Unity3D】实现横版2D游戏——攀爬绳索(简易版)
  • 【llm对话系统】大模型 Llama 源码分析之 LoRA 微调