当前位置: 首页 > news >正文

华为云Flexus+DeepSeek征文|华为云 Dify 高可用部署教程:CCE 容器集群一键构建企业级智能应用

前言

在数字化转型加速的企业级应用场景中,构建高可用智能平台已成为业务创新的核心驱动力。本文深度解析基于华为云CCE容器服务的Dify智能应用部署实践,揭示如何通过云原生架构与AI技术的深度融合,实现企业知识管理、智能客服等场景的敏捷落地。依托华为云CCE Turbo集群、FlexusX弹性算力及全栈安全防护体系,本方案实现动态资源调度(响应效率提升180%)、跨可用区容灾(SLA达99.95%)、数据全链路加密的技术突破,结合Dify平台无缝集成Embedding语义检索、Rerank结果优化、DeepSeek推理引擎三大核心能力,打造"高可用架构底座+多模态智能中枢+企业级知识图谱"的创新解决方案,助力企业快速构建适应复杂业务场景的智能应用体系。

方案架构及资源规划(CCE容器高可用部署)

以下是CCE容器高可用部署所需要的资源

  • 创建三个弹性公网IP EIP,提供访问公网和被公网访问能力

  • 创建一个弹性负载均衡 ELB,并绑定EIP,将访问流量自动分发到不同后端服务,扩展应用系统对外的服务能力,实现强大的应用容错性能

  • 创建一个NAT网关 NAT,并绑定EIP,配置SNAT规则,提供安全可靠的公网NAT网关和私网NAT网关服务,保护私有网络信息不对外暴露

  • 创建三台FlexusX实例,用于安装部署Dify5个核心插件

  • 创建一个云容器引擎 CCE Turbo集群,创建节点池并将三台FlexusX实例纳管为集群的Node节点

  • 创建一台FlexusX实例,用于部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型

  • 使用对象存储服务 OBS,用于将Dify的知识库挂载在对象存储服务 OBS桶上

  • 创建一个分布式缓存服务Redis®*版,兼容Redis,为用户提供高性能、低成本NoSQL数据库,同时数据流转过程中数据的一致性

  • 创建一个云数据库 RDS for PostgreSQL实例,主备分区部署,具备跨可用区故障容灾的能力

  • 创建一个云搜索服务 CSS OpenSearch集群,提供在线分布式搜索及语义搜索等功能

  • 创建四个安全组,通过配置安全组规则,为云服务器提供安全防护

在这里插入图片描述

前期准备工作

首次使用华为云时已注册的账号可直接使用,无需额外准备。若使用 IAM 用户账户,需先确认是否属于 admin 用户组:

  • 若已在 admin 组:可直接操作,无需额外权限配置。
  • 若不在 admin 组:需由管理员为账号授予相关权限,并完成以下准备工作。

创建rf_admin_trust委托(可选)

访问华为云官网并登录账号,进入控制台管理界面后,将鼠标悬停在页面右上角的个人账号区域,在弹出的下拉菜单中选择 “统一身份认证” 选项。

在这里插入图片描述

进入统一身份认证服务(IAM) 页面,在左侧导航栏中找到并点击委派选项,待右侧页面跳转后,点击右上角的创建委派按钮。

在这里插入图片描述

在委托名称输入框中填入“rf_admin_trust”,将委托类型设定为“云服务”,并在对应输入框中输入“RFS”,确认信息无误后点击“完成”按钮。

在这里插入图片描述

如下图,委派创建成功,点击“立即授权”按钮进行后续操作。

在这里插入图片描述

第一步为策略选择操作:在搜索框内输入 “Tenant Administrator” 权限,勾选对应的搜索结果后,点击 “下一步” 按钮。

在这里插入图片描述

第二步是配置最小授权范围:选择授权范围方案,并勾选“全部资源”选项,点击“确定”。

在这里插入图片描述

如下图,授权成功,但是由于系统设置原因,授权之后需要等待15-30分钟之后才可生效

在这里插入图片描述

当看到“委托”列表中显示“rf_admin_trust”委托条目时,即表示委托创建成功

在这里插入图片描述

创建桶

准备一个OBS桶:(如果已有,可跳过此步骤)登录华为云对象存储服务控制台,单击“创建桶”进入obs桶创建界面,

在这里插入图片描述

在操作时,先选取可用区域,接着输入桶名称,选择标准存储,其余配置保持默认状态,最后点击“立即创建”即可。

在这里插入图片描述

在这里插入图片描述

在弹出的提示框中,点击确定

在这里插入图片描述

创建完成后可查看已创建的桶,点击桶名称进入详情界面,复制桶名称并保存备用。

在这里插入图片描述

获取AK、SK

访问密钥ID(AK),识别访问用户的身份,取值范围:20,仅支持大写字母和数字,用于将生成的图像上传至OBS桶。参考获取AK、SK密钥。

秘密访问密钥(SK),对请求数据进行签名验证,取值范围:40,仅支持大小写字母和数字,用于将生成的图像上传至OBS桶。参考获取AK、SK密钥。

登录华为云,在右上角单击 “控制台”。鼠标移动至右上方的用户名,在下拉列表中选择 “我的凭证”。

在这里插入图片描述

找到访问密钥模块(通常在左侧导航栏或页面中部)。点击新建访问秘钥按钮,按提示完成密钥创建。

在这里插入图片描述

输入秘钥的描述信息,勾选 “我已阅读并同意”,点击确认按钮,完成访问秘钥创建。

在这里插入图片描述

创建成功后,下载包含访问密钥 ID(AK)和秘密访问密钥(SK)的.csv 文件进行保存

在这里插入图片描述

快速部署Dify-LLM(高可用)

部署流程

登录华为云解决方案实践页面,在方案列表中找到 “快速搭建 Dify-LLM 应用开发平台” 或 点击此处跳转 “快速搭建 Dify-LLM 应用开发平台”,根据需求选择部署版本,选择“可用区”,点击 “一键部署(CCE容器高可用部署)” 按钮,系统将跳转至解决方案的**“资源栈创建界面”**。

在这里插入图片描述

进行模板选择操作,保持默认配置不变,然后点击页面右下角的“下一步”按钮。

在这里插入图片描述

在该步骤中,对云服务器密码进行设置(必填项),保持其他配置为默认状态,完成后点击页面右下角的 “下一步” 按钮。

关键配置项说明

配置项说明
加密设置取消勾选“按模板要求对部分资源加密” 选项。
cce_node_pool_passwordCCE 集群 node 节点登录密码,用于集群节点访问。
pgsql_passwordPostgreSQL 数据库管理员密码,需符合指定格式要求(注意取值范围限制)。
pgsql_user_passwordPostgreSQL 数据库的 database 用户密码,需与管理员密码规则一致。
redis_passwordRedis 数据库密码,用于数据库认证。
css_passwordCSS 向量数据库密码,确保数据库安全访问。
obs_bucket填写之前创建的 OBS 桶名称(需与实际创建的桶名完全一致)。
access_key填写访问密钥 ID(AK),用于云服务身份验证。
secret_key从下载的.csv 文件中获取秘密访问密钥(SK),需准确填写。
ecs_password部署 Embedding 和 Reranker 模型的云服务器登录密码。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

一定要确认密码强度够且余额充足,不然会返回部署失败(仔细检查配置参数)
进行资源栈设置,开启“回滚设置”开关,完成后点击 “下一步” 按钮。(不做权限委派操作)

在这里插入图片描述

进入配置确认环节,仔细核对所有设置无误后,点击页面右下角的 “创建执行任务” 按钮启动部署流程。

在这里插入图片描述

当系统弹出创建执行计划对话框时,自行设置执行计划名称(支持自定义内容),确认无误后点击 “确定” 按钮。

在这里插入图片描述

可以看到执行计划创建成功,点击“部署”按钮,

在这里插入图片描述

点击 “部署” 按钮后,系统将弹出执行计划确认对话框,此时请点击对话框中的 “执行” 选项完成操作。

在这里插入图片描述

正在创建中,大概需要10-20分钟(确保配置信息无误,余额、密码强度等,如果有误不会扣除费用会进行回滚操作)

在这里插入图片描述

点击 “事件” 标签,可查看当前创建任务的状态详情,了解是否完成创建。

待“事件”中出现“Apply required resource success”,表示该解决方案已经部署完成

在这里插入图片描述

可以再资源列表中看到所有创建的资源

在这里插入图片描述

也可以在华为云面板首页,看到当前已经存在的资源

在这里插入图片描述

手动刷新页面,在 “输出” 区域中查看 Dify-LLM 应用开发平台的访问说明。当堆栈部署状态显示成功后,Dify 应用搭建脚本将自动开始执行,请耐心等待 5 至 10 分钟(具体耗时可能因网络波动而略有差异)。

在这里插入图片描述

没有标记cce的是高质量知识库所在的服务器,标记的为所部署的高可用dify平台所在服务器

在这里插入图片描述

登录注册:在浏览器输入该地址,进入 Dify 界面后,点击 “注册” 按钮,依次填写邮箱账号(自定义用户名)、密码(需符合复杂度要求),完成管理员账号创建后即可登录。

在这里插入图片描述

打开浏览器并访问您部署的 Dify 平台地址(可在堆栈 “输出” 中查询),进入登录界面后,依次输入前序步骤中注册的邮箱密码,点击 “登录” 按钮即可进入 Dify 平台。

在这里插入图片描述

如下图,我们已经成功在华为云平台部署了Dify-LLM平台,接下来就可以进行各种开发操作了。

在这里插入图片描述

搭建DeepSeek推理系统

随着互联网信息量激增,企业和个人面临海量数据管理与高效检索需求,传统搜索引擎难以满足复杂需求。国产 AI 大模型 DeepSeek 崛起,其解决方案可在华为云 Flexus 云服务器 X 实例上快速搭建 DeepSeek-R1 轻量级推理系统。该模型专注数学、代码和自然语言推理任务,通过 Ollama 部署蒸馏版轻量模型打造私人 AI 助手,适用于多场景数据处理与智能推理。

官方文档:https://support.huaweicloud.com/deepseek-aislt/deepseek_01.html
快速部署:https://www.huaweicloud.com/solution/implementations/building-a-deepseek-lnference-system.html

根据需求选择部署模式(CPU为例),选择“可用区”,点击 “一键部署(CPU版)” 按钮,系统将跳转至解决方案的**“资源栈创建界面”**。

在这里插入图片描述

进行模板选择操作,保持默认配置不变,然后点击页面右下角的“下一步”按钮。

在这里插入图片描述

在该步骤中,对云服务器密码进行设置(必填项),保持其他配置为默认状态,完成后点击页面右下角的 “下一步” 按钮。

在这里插入图片描述

进行资源栈设置,开启“回滚设置”开关,完成后点击 “下一步” 按钮。(不做权限委派操作)

在这里插入图片描述

进入配置确认环节,仔细核对所有设置无误后,点击页面右下角的 “创建执行任务” 按钮启动部署流程。

在这里插入图片描述

当系统弹出创建执行计划对话框时,自行设置执行计划名称(支持自定义内容),确认无误后点击 “确定” 按钮。

在这里插入图片描述

此时可观察到执行计划正在创建中,待其创建成功后,点击 “部署” 按钮启动部署流程。

在这里插入图片描述

可以看到执行计划创建成功,点击“部署”按钮,

在这里插入图片描述

点击 “部署” 按钮后,系统将弹出执行计划确认对话框,此时请点击对话框中的 “执行” 选项完成操作。

在这里插入图片描述

点击 “事件” 标签,可查看当前创建任务的状态详情,了解是否完成创建。

待“事件”中出现“Apply required resource success”,表示该解决方案已经部署完成

在这里插入图片描述

单击 “资源” 查看已创建的资源(参考图示),点击 “蓝色资源名称” 进入弹性云服务器详情页,查看其绑定的弹性公网 IP

在这里插入图片描述

跳转到ECS基本信息页面,查看弹性公网IP并进行保存

在这里插入图片描述

对接DeepSeek

成功部署快速搭建DeepSeek推理系统解决方案后,将DeepSeek大模型对接至Dify平台。

点击右侧“用户名称”下拉菜单,选择并点击“设置”选项。

在这里插入图片描述

点击左侧模型供应商,找到Ollama模型供应商,点击“添加模型”。

在这里插入图片描述

模型类型: 选择LLM

模型名称: 需填写快速部署中选择的模型(如 “deepseek-r1:7b”)

基础 URL 根据部署情况填写:

  • Dify 应用和 DeepSeek-R1 蒸馏版模型同一服务器或同一 VPC 下,填写获取的私网 IP 地址
  • 不在同一服务器且不在同一 VPC 下,则填写模型所在服务器的公网 IP
  • 端口号统一为 11434(使用公网连接时需确保模型服务器所在安全组放通该端口),完成后单击右下角 “保存” 并关闭窗口。

在这里插入图片描述

实际使用中发现,若使用 DeepSeek 官方提供的模型,仅需填写 API Key 即可完成配置(推荐优先选用在华为云部署的 DeepSeek-R1 蒸馏版模型)。对接步骤如下:

点击左侧模型供应商,找到DeepSeek模型提供商,点击“设置”。

在这里插入图片描述

对接向量检索模型

若需使用高质量型功能,需提前添加 Embedding 和 Reranker 模型。本解决方案的一键部署(CCE 容器高可用部署)提供可选的 Embedding 和 Reranker 模型服务器,操作步骤如下:

  1. 登录 ECS 控制台,找到解决方案创建的Embedding&Reranker 模型服务器(没有带CCE标签的),复制其私网 IP 地址

注意:不使用本方案部署的 Embedding 和 Reranker 模型,服务器 URL 需填写对应模型的公网 IP

点击右侧“用户名称”下拉菜单,选择并点击“设置”选项。

在这里插入图片描述

点击左侧模型供应商,找到Ollama模型供应商,点击“添加模型”。

在这里插入图片描述

在 Ollama 模型配置界面进行以下操作:

  1. 模型类型选择 “Text Embedding”
  2. 模型名称输入 “bge-m3”
  3. 基础 URL :
    • 如果是单独进行部署的填写:http://ECS公网IP:11434
    • 如果是使用一键部署cce时部署的的填写:http://ECS私网IP:11434
    • 对接方式均一致
  4. 端口号保持默认 11434(部署解决方案默认放行安全组)
  5. 点击右下角 “保存” 完成配置

在这里插入图片描述

点击 “模型供应商” 选项,在列表里找到 Xorbits Inference 模型,然后点击其对应的 “添加模型” 按钮。

在这里插入图片描述

在 Xorbits Inference模型配置界面进行以下操作:

  1. 选择模型类型为 Rerank
  2. 模型名称填写 “bge-reranker-v2-m3”
  3. 模型 UID 同步填写 “bge-reranker-v2-m3”
  4. 基础 URL :
    • 如果是单独进行部署的填写:http://ECS公网IP:9997
    • 如果是使用一键部署cce时部署的的填写:http://ECS私网IP:9997
    • 对接方式均一致
  5. 端口号设置为 9997(部署解决方案默认放行安全组)
  6. 点击右下角 “保存” 完成配置

在这里插入图片描述

创建知识库

Dify 平台顶部导航栏点击 “知识库” 后选择 “创建知识库”。

在这里插入图片描述

选择 “导入已有文本” 数据源,点击 “上传文件” 后点击**下一步(**数据源可自定义提供方式)。

  • 根据自身应用需求来进行准备对应的知识库

在这里插入图片描述

进入知识库选择索引方式选择高质量,配置Embedding模型为bge-m3

在这里插入图片描述

启用混合检索模式(向量+关键词检索,可调节权重),选择bge-reranker-v2-m3模型进行结果重排,开启Score阈值(推荐0.5)并设置TOP K文档分片数量(控制最大调用量)

在这里插入图片描述

当界面显示嵌入完成时,点击 “前往文档”,即可查看处于可用状态的导入知识库文档。

在这里插入图片描述

在华为云 OBS 对象存储的桶内,可查看已上传的知识库文件

在这里插入图片描述

创建应用

登录Dify平台后,在工作室主界面找到并点击“创建空白应用”选项,即可开始搭建新的应用项目。

在这里插入图片描述

选择应用类型,先选定Agent类型,然后自定义填写应用名称、上传图标,并完善描述信息

在这里插入图片描述

创建应用后会自动跳转至应用概览页,点击左侧菜单中的 编排 即可开始编排应用。在提示词设置区域点击右上角的 生成 按钮。

在这里插入图片描述

```xml
<instruction>
你是企业智能客服,基于知识库专业解答产品价格、订单状态、售后流程问题。请按照以下步骤处理用户咨询:
1. 识别用户问题类型:产品价格、订单状态或售后流程。
2. 根据问题类型提取关键变量:- 产品价格问题:提取{{product_name}}变量- 订单状态问题:提取{{order_number}}变量- 售后流程问题:提取{{after_sales_type}}变量
3. 在知识库中精准匹配变量信息,分点清晰应答:- 产品价格:列出规格、单价及优惠信息- 订单状态:提供当前状态、预计完成时间- 售后流程:分步骤说明处理流程及所需材料
4. 若问题超出范围或匹配度低于80%,回复:"您的问题需要人工客服处理,正在为您转接..."
5. 输出要求:- 使用中文分点回答(1. 2. 3.)- 不包含任何XML标签- 变量值需完整替换不要保留{{}}
</instruction>
<input>
用户咨询内容:{{user_query}}
</input>
<example>
用户咨询内容:"我想查询订单123456的当前状态"
提取变量:{{order_number}} = 123456
输出:
1. 订单123456当前状态:已发货
2. 物流公司:顺丰速运
3. 运单号:SF123456789
4. 预计送达时间:2023-12-20
</example>
<example>
用户咨询内容:"产品A的报价是多少"
提取变量:{{product_name}} = 产品A
输出:
1. 产品A当前报价:- 标准版:¥999- 专业版:¥1499(含3年保修)
2. 本月优惠:满2000减200
</example>
<output>
根据输入内容生成的客服应答(分点列表形式)
</output>
```

在这里插入图片描述

编排页面中定位到知识库板块,点击 “添加” 按钮即可进行操作。

在这里插入图片描述

在华为云 Dify 平台创建 Agent 应用时,支持灵活集成各类工具组件,轻松拓展智能体的功能边界(需要安装授权后才能使用

在这里插入图片描述

在右侧弹出的内容框中启用开场白功能,并按自身需求编辑开场白内容(使用指令生成指示词的时候会自动生成一段开场白)

在这里插入图片描述

调试与预览

输入响应的变量参数(设置了可选)之后,即可进行交流测试

在这里插入图片描述

Agent发布

当应用测试无误后,可点击界面右上角的 “发布” 按钮,然后按提示点击 “发布更新”,即可将工作流正式上线。

在这里插入图片描述

运行测试

发布完成后,可通过以下三种方式使用该 Agent 应用:

在这里插入图片描述

直接对话交互:在平台对话窗口输入问题,系统自动调用工作流逻辑生成回答;

在这里插入图片描述

在这里插入图片描述

嵌入网页 / 小程序:获取嵌入代码后,将 Agent 功能集成到自有网页或小程序界面,供用户直接访问。

在这里插入图片描述

API 接口调用:通过平台提供的 API 接口,将 Agent 集成至第三方系统或应用中使用;

在这里插入图片描述

此外还能对会话数量等数据进行监控。

在这里插入图片描述

总结

本实践通过华为云CCE容器服务与Dify平台的深度协同,成功验证了企业级智能应用的高可用部署范式。方案采用标准化部署模板实现20分钟极速建站,基于FlexusX云服务器集群与擎天架构达成算力动态分配(资源利用率提升30%)、网络流量智能调度(ELB负载均衡)、数据持久化存储(OBS对象存储+RDS主备数据库)的完整技术闭环。通过集成Embedding模型(bge-m3)实现语义向量化检索Rerank模型(bge-reranker-v2-m3)优化结果排序DeepSeek大模型(R1蒸馏版)驱动复杂推理,构建起覆盖知识库管理、智能问答、数据分析等场景的全链路智能能力。实践表明,该架构可支撑日均百万级请求处理,检索响应时间缩短至毫秒级,知识库更新效率提升5倍,为企业智能化转型提供可复制的技术路径。未来可进一步探索多模态数据融合、行业模型微调、边缘计算节点下沉等演进方向,持续释放AI与云原生技术叠加带来的业务价值。

http://www.lryc.cn/news/573795.html

相关文章:

  • 登录拦截功能实现 -瑞吉外卖笔记
  • Windows 后渗透中可能会遇到的加密字符串分析
  • 等等等等等等
  • PostgreSQL全栈部署指南:从零构建企业级高可用数据库集群
  • pyqt f-string
  • jenkins对接、jenkins-rest
  • LocalAI: OpenAI、Claude 等的开源替代
  • 3、NLP黄金九步法(问题定义-数据获取-数据探索)
  • Flink Connector Kafka深度剖析与进阶实践指南
  • js 函数参数赋值问题
  • 【Android】am命令
  • ROS 2 中 Astra Pro 相机与 YOLOv5 检测功能编译启动全记录
  • Oracle 数据库查询:单表查询
  • 华为云Flexus+DeepSeek征文|开启DeepSeek-V3+R1商用服务之旅
  • 查询消耗 IO 多的 SQL -达梦
  • C++法则1:在 C++ 中,所有的具名变量都是左值,即使它们的类型是右值引用。
  • 云原生/容器相关概念记录
  • 第八章 网络安全
  • 基于Vue.js的图书管理系统前端界面设计
  • 包教包会,ES6类class的基本入门
  • TS类型啊啊啊2
  • 计算机系统结构课堂测验
  • Claude:Anthropic打造的安全优先AI助手
  • 2025中科院2区SCI-状态优化算法Status-based Optimization-附Matlab免费代码
  • 基于split-Bregman算法的L1正则化matlab仿真,对比GRSR算法
  • 《情感反诈模拟器》2025学习版
  • 【Redis】解码Redis中hash类型:理解基础命令,以及内部编码方式和使用场景
  • Docker Desktop 4.42集成的MCP工具包
  • 安卓对外发布工程源码:怎么做到仅UI层公布
  • linux-vim编辑器