当前位置：首页 > news >正文

AI大模型初识（一）：AI大模型的底层原理与技术演进

news 2025/9/16 0:22:45

AI大模型的底层原理与技术演进

一、ChatGPT引发的产业变革

关键事件：2022年11月30日OpenAI发布ChatGPT
- ✅ 历史性突破：2个月内日活用户破亿（超越TikTok 9个月记录）
- ✅ 产业影响：
  - 推动AI从决策式/分析式AI（基于规则的分析预测）向生成式AI（创造性内容生成）演化
  - 通用大模型基座爆发：华为盘古、阿里通义、百度文心、腾讯混元等
  - 行业应用深化：教育领域智能辅导、汽车业自动驾驶模型、金融风控系统
- 对话应用生态：
  - 国际：Anthropic的Claude、Google Bard、Microsoft Copilot
  - 国内：文心一言、通义千问、腾讯元宝

二、AI技术范式迁移

技术类型	核心逻辑	典型案例
决策式AI	学习历史数据规律 → 预测结果	银行风控系统、商品推荐引擎
生成式AI	学习数据分布规律 → 创造新内容	ChatGPT写作、AI绘图

🔍 技术跃迁：生成式AI突破"预测"局限，实现创造性输出，需依赖大参数量模型（如GPT-3含1750亿参数）

三、大模型训练三阶段核心技术

1. 预训练（Pre-training）

核心任务：无监督学习海量文本的语法/语义规律
数据要求：
- 来源：书籍、论文、社交媒体等（如GPT-3用3000亿Token数据）
- Token解释：文本处理基本单元（1英文单词≈1.2 Token）
  示例：单词"Tokenization"拆分为"Token"+"ization"两个Token
向量嵌入（Embedding）技术：
- 作用：将Token映射为高维向量（如GPT-3的12,288维向量）
- 原理：语义相近的词在向量空间中距离更近
  技术价值：使模型区分不同语境中的"苹果"（水果：向量坐标[0.3,1.2]，品牌：[5.7,-2.1])

2. 微调（Fine-tuning）

监督微调（SFT）：
- 输入专业对话数据（问题+标准答案）
- 目标：使基座模型掌握对话逻辑（如准确回答"长沙是湖南省省会"）
强化学习（RLHF）：
- 人类标注员对模型输出评分 → 优化回答质量

3. 推理（Inference）

生成机制：基于上下文概率预测下一个Token
- 流程：输入文本 → Token化 → 向量转换 → 概率计算 → 输出Token
概率计算原理：
输入可能输出概率计算依据
“I like” bananas 66.7% 训练数据中"bananas"出现频次更高
oranges 33.3%

四、Transformer革命性架构

自注意力机制（Self-Attention）：
- 作用：动态计算词间关联权重
  示例：句子"The animal didn’t cross the street because it was too tired"中，模型计算"it"与"animal"关联权重（0.9）远高于"street"（0.1）
- 层叠结构价值：
  - GPT-3含96层Transformer
  - 分层理解：底层解歧义（语法）、高层抓逻辑（语义）
  - 处理流程：输入文本 → Transformer层1 → … → 层96 → 输出预测

五、技术局限与突破方向

幻觉（Hallucination）问题：
- 根源：概率生成机制缺乏现实认知（如编造历史事件）
- 解决方案：
  1. 检索增强生成（RAG）：连接知识库实时校验事实
  2. 多模态训练：融合文本/图像/视频数据提升世界认知
  3. 扩大训练规模：使用更多高质量训练数据

关键术语表

术语	定义
Token	文本分割基本单元，中文以词/字为单位，英文以词根/单词为单位
Embedding	将离散符号映射为连续向量的技术，通过向量距离反映语义关联度
Transformer	基于自注意力机制的神经网络，支持并行处理长序列数据
RLHF	基于人类反馈的强化学习（Reinforcement Learning from Human Feedback）
自注意力机制	动态计算输入序列中各元素相关性的算法，使模型聚焦关键信息

http://www.lryc.cn/news/571366.html

相关文章：

数据库系统概论（二十）数据库恢复技术

Linux Kernel崩溃分析的法宝：Kdump+Crash（上）

暴雨服务器成功中标洪湖市政府框架采购项目

汽车 CDC威胁分析与风险评估

解锁VSCode：从入门到精通的全攻略

ArcGIS Pro无插件加载（无偏移）天地图！一次添加长久使用

【机器人学】2-5.七自由度机器人逆解-SRS型机器人【附MATLAB代码】

React19源码系列之Hooks (useEffect、useLayoutEffect、useInsertionEffect)

电阻、电容、电感

单片机 - STM32读取GPIO某一位时为什么不能直接与1判断为高电平？

力扣面试题 17.05. 字母与数字

SpringBoot 通过集成 Flink CDC 来实时追踪 MySql 数据变动

基于高性能的光频域反射（OFDR）分布式光纤传感解决方案

爬虫技术：从基础到高级，探索数据抓取的奥秘

深度融合数智化，百胜软件联合华为云加速零售行业转型升级

【Manus第三篇-Prompt优化】两周实战，一套注意力视角的prompt优化框架，真的有用！

【笔记】MSYS2 的 MinGW64 环境中正确安装 Python 相关环境管理工具（Poetry、Virtualenv、Pipenv 和 UV）

复现 apache HTTPD 换行解析漏洞（CVE-2017-15715）

ABP vNext + Sentry + ELK Stack：打造高可用异常跟踪与日志可视化平台

STM32的内部RC与外部晶振电路

python打卡day52

C++ 学习多线程 2025年6月17日18:41:30

插入排序C语言版

容器部署springboot项目--入门

Vue-8-前端框架Vue之应用基础响应式数据和计算属性

如何设计一个敏感词过滤系统

OpenCV 图像仿射变换之旋转

flutter的widget的执行顺序,单个组建的执行顺序

什么是数据清洗？数据清洗有哪些步骤？

算法导论第九章：顺序统计的艺术 - 高效查找中位数与第K小元素