当前位置: 首页 > news >正文

人工智能AI

 AI 模型。它使用深度神经网络,从数十亿或数万亿个单词中学习,能够生成任何主题或领域的文本。它可以执行各种自然语言任务,如分类、总结、翻译、生成和对话。
大语言模型开发建立在4个核心思想上:
模型 – Models
提示词 - Prompts
令牌 - Tokens
嵌入 - Embeddings

模型 – Models

模型是指经过训练和微调的 LLM AI 的特定实例或版本,例如 GPT-3.5 或 GPT-4,它们已经在大量的文本或代码(针对 Codex 模型)上进行了训练,并可以通过 API 或平台进行访问和使用。OpenAI 和 Azure OpenAI 提供了各种模型,可以通过参数或选项进行定制和控制,并可应用于不同的领域和任务。

提示词 - Prompts

提示词是用户或程序向 LLM AI 提供的输入或查询,以引发模型的特定响应。提示可以是自然语言句子或问题,也可以是代码片段或命令,或者是任何文本或代码的组合,具体取决于领域和任务。提示也可以嵌套或链接在一起,这意味着一个提示的输出可以作为另一个提示的输入,从而创建与模型更为复杂和动态的交互。

创造性地设计 LLM AI 提示词是一个新兴的领域,被称为“提示设计”或“提示工程”。它涉及到制定有效和高效的提示的过程,以引发 LLM AI 模型所需的响应。主要的挑战包括选择正确的词语、短语、符号和格式,以指导模型生成高质量和相关性强的文本。人们还可以尝试不同的参数和设置,这些参数和设置可以影响模型的行为和性能,例如温度、top-k、top-p、penalty。

令牌 - Tokens

令牌是 LLM AI 用于处理和生成语言的文本或代码的基本单位,是模型的语言构建块。根据选择的分词方法或方案,令牌可以是单词、字符、子词或符号、代码,这取决于模型的类型和大小。令牌被赋予数字值或标识符,并按序列或向量排列,最终被输入模型或进行输出。

令牌化是将输入和输出文本分割成较小的单位,以便 LLM AI 模型处理的过程。分词可以帮助模型处理不同的语言、词汇和格式,并减少计算和存储成本。分词还可以通过影响令牌的含义和上下文来影响生成的文本的质量和多样性。分词可以使用不同的方法进行,例如基于规则、统计或神经网络,这取决于文本的复杂性和变异性。

嵌入 - Embeddings

嵌入是令牌(如句子、段落或文档)在高维向量空间中的表示或编码,其中每个维度对应于语言的一个学习特征或属性。嵌入是模型捕捉和存储语言的含义和关系的方式,也是模型比较和对比不同令牌或语言单位的方式。对于模型来说,嵌入是离散和连续、符号和数字两个方面之间的桥梁。

嵌入是表示模型处理和生成的令牌的含义和上下文的数字向量或数组。嵌入是从模型的参数或权重派生出来的,并用于对输入和输出文本进行编码和解码。嵌入可以帮助模型理解令牌之间的语义和句法关系,并生成更相关和连贯的文本。嵌入还可以使模型处理多模态任务,例如图像和代码生成,通过将不同类型的数据转换为共同的表示形式。嵌入是 GPT 模型使用的 Transformer 架构的重要组成部分,其大小和维度取决于模型和任务的不同。

http://www.lryc.cn/news/44232.html

相关文章:

  • 2022天梯赛补题
  • 字节跳动测试岗面试挂在2面,复盘后,我总结了失败原因,决定再战一次...
  • Nodejs实现通用的加密和哈希算法(MD5、SHA1、Hmac、AES、Diffie-Hellman、RSA),crypto模块详解
  • 测试行业3年经验,从大厂裸辞后,面试阿里、字节全都一面挂,被面试官说我的水平还不如应届生
  • 安卓悬浮窗口,  丝滑双指缩放视频窗口
  • 300左右哪款蓝牙耳机适合学生用?四款便宜质量好的蓝牙耳机推荐
  • 桥梁设计模式
  • 【华为OD机试 2023最新 】 新员工座位(C++)
  • 蓝桥杯刷题第二十二天
  • CentOS从gcc 4.8.5 升级到gcc 8.3.1
  • 【人人都能读标准】12. 原始类型的编码形式
  • VUE进行前后端交互
  • ThingsBoard Gateway:物联网设备数据采集与集成的强大解决方案
  • 什么是镜像/raid
  • 【Python】如何有效比较两个时间序列在图形上的相似度?
  • JavaEE-常见的锁策略和synchronized的锁机制
  • 信息化,数字化,智能化是三种不同的概念吗?
  • 【华为OD机试 2023最新 】 匿名信(C++ 100%)
  • 硬件语言Verilog HDL牛客刷题day05 时序逻辑部分
  • Ajax 入门
  • 半导体器件基础06:发光二极管
  • AutoCV第二课:Python基础
  • LeetCode算法 打家劫舍 和 打家劫舍II C++
  • 蓝桥杯刷题冲刺 | 倒计时10天
  • 个人练习-Leetcode-剑指 Offer II 109. 开密码锁
  • 四个常见的Linux面试问题
  • 15、接口(C#)
  • C++中常见的容器类使用方法举例(vector、deque、map、set)
  • 什么是强缓存和协商缓存
  • 算法刷题之堆