当前位置: 首页 > news >正文

初识大模型

前提:学习一项技术,要从原理、实践、认知三个方面进行攻克。

        不懂原理就不会举一反三,走不了太远。

        不懂实践就只能纸上谈兵,做事不落地。

        认知不高就无法作对决策,天花板太低。

一、知识体系

二、什么是AI

基于机器学习、神经网络的是AI,基于规则、搜索的不是AI

三、大模型可以做什么

大模型,全称大语言模型,缩写LLM。

相关产品:

国家对话产品大模型链接
美国OpenAI ChatGpt

GPT-3.5、GPT-4

https://chat.openai.com/

美国Microsoft CopilotGPT-4和未知

https://copilot.microsoft.com/

美国Google BardPaLM和Gemini

https://bard.google.com/

中国百度文心一言文心

https://yiyan.baidu.com/

中国

讯飞星火星火

https://xinghuo.xfyun.cn/

中国智谱清言ChatGLM

https://chatglm.cn/

中国月之暗面MoonShot

(https://kimi.moonshot.cn/

中国MiniMax星野abab

https://www.xingyeai.com/

注册 ChatGPT、Copilot 教程:https://agiclass.feishu.cn/docx/Jt8ydP0RroFCPaxcWGDcUzVrnnd#YtxodWqgdofsa8xb0GOcaD1nny5

把大模型看做是一个函数,给输入,生成输出。

任何业务问题,都可以用语言描述,成为大模型的输入,就能生成业务问题的结果。

实际工作中,通常需要将业务任务拆解为若干个子任务,分别解决。理解业务本质,对拆解任务有很大帮助!

四、大模型是怎么生成结果的

其实,他只是根据上文,猜下一个词(的概率)

OpenAI 的接口名就叫「completion」,也证明了其只会「生成」的本质。

用不严谨但通俗的语言描述大模型的工作原理:

        1.大模型阅读了人类曾经说过的所有的话。这就是机器学习,这个过程叫训练

        2.把一大串token后面跟着的不同token的概率记了下来。记下的就是参数,也叫权重

        3.当我们给它若干token,大模型就能算出概率最高的下一个token是什么。这就是生成,也叫推理。

        4.用生成的token,再加上上文,就能继续生成下一个token。以此类推,生成更多文字。

Token 是什么?

1. 可能是一个英文单词,也可能是半个,三分之一个。可能是一个中文词,或者一个汉字,也可能是半个汉字,甚至三分之一个汉字

2. 大模型在开训前,需要先训练一个 tokenizer 模型。它能把所有的文本,切成 token

再深一点呢,

这套生成机制的内核叫「Transformer 架构」。但其实,transformer 已经不是最先进的了。

架构设计者特点链接
TransformerGoogle最流行,几乎所有大模型 都用它

https://github.com/openai/finetune-transformer-lm/blob/master/train.py

RWKVPENG Bo可并行训练,推理性能极佳,适合再端侧使用

https://www.rwkv.com/)、[RWKV 5 训练代码](https://github.com/BlinkDL/RWKV-LM/tree/main/RWKV-v5

Mamba

CMU & Princeton University

性能更佳,尤其适合长文本生成

https://github.com/state-spaces/mamba

五、用好AI核心方法

OpenAI 首席科学家 Ilya Sutskever 说过:

数字神经网络各和人脑的生物神经网络,在数学原理上是一样的。

所以重点是把AI当人看。

六、大模型应用架构

1.业务架构

Agent还太超前,Copilot值得追求。

2.技术架构

纯 Prompt

就像和一个人对话,你说一句,ta 回一句,你再说一句,ta 再回一句……

Agent + Function Calling

  • Agent:AI 主动提要求
  • Function Calling:AI 要求执行某个函数
  • 场景举例:你问过年去哪玩,ta 先反问你有几天假

RAG = Embeddings + 向量数据库

  • - Embeddings:把文字转换为更易于相似度计算的编码。这种编码叫向量
  • - 向量数据库:把向量存起来,方便查找
  • - 向量搜索:根据输入向量,找到最相似的向量
  • - 场景举例:考试时,看到一道题,到书上找相关内容,再结合题目组成答案。然后,就都忘了

Fine-tuning

努力学习考试内容,长期记住,活学活用。

七、编程调用API

        官方文档:https://platform.openai.com/docs/api-reference

         主打语言是Python,因为:

        1. Python 和 AI 是天生的一对

        2. Python 是最容易学习的编程语言

        安装 OpenAI Python 库

        在命令行执行:

        pip install --upgrade openai

http://www.lryc.cn/news/396026.html

相关文章:

  • Open3D SVD算法实现对应点集配准
  • bWAPP靶场安装
  • SpringBoot + MyBatisPlus 实现多租户分库
  • 【数据挖掘】银行信用卡风险大数据分析与挖掘
  • 使用 Qt 和 ECharts 进行数据可视化
  • 【机器学习】在【Pycharm】中的实践教程:使用【逻辑回归模型】进行【乳腺癌检测】
  • 【搭建Nacos服务】centos7 docker从0搭建Nacos服务
  • 将 build.gradle 配置从 Groovy 迁移到 Kotlin
  • 5G(NR) NTN 卫星组网架构
  • WEB安全-文件上传漏洞
  • Python函数 之 函数基础
  • 昇思25天学习打卡营第11天|SSD目标检测
  • MySQL篇五:基本查询
  • FreeBSD@ThinkPad x250因电池耗尽关机后无法启动的问题存档
  • pdfplumber vs PyMuPDF:PDF文本、图像和表格识别的比较
  • 深入Django系列
  • 【Python】找Excel重复行
  • 重读AI金典算法模型-GPT系列
  • 仙人掌中的SNMP检测不到服务器
  • git只列出本地分支
  • 算力狂飙|WAIC 2024上的服务器
  • uniapp app端跳转第三方app(高德地图/百度地图为例)
  • 阿里云RDS云数据库库表恢复操作
  • 来一场栈的大模拟(主要是单调栈)
  • 13 - matlab m_map地学绘图工具基础函数 - 介绍创建管理颜色映射的函数m_colmap和轮廓图绘制颜色条的函数m_contfbar
  • PTA - 编写函数计算圆面积
  • Golang | Leetcode Golang题解之第218题天际线问题
  • 【Mars3d】osgb倾斜摄影模型加载慢卡顿的优化方案参考
  • 认识同源策略
  • ADOQuery 查询MSSQL存储过程一个莫名其妙的错误;