华为云Flexus+DeepSeek征文|华为云ModelArts Studio:利用New API实现大模型网关与AI资产管理的无缝对接
华为云Flexus+DeepSeek征文|基于华为云Flexus X实例和ModelArts Studio部署新一代大模型网关与AI资产管理系统New API
- 前言
- 一、华为云ModelArts Studio平台介绍
- 1.1 ModelArts Studio介绍
- 1.2 ModelArts Studio主要特点
- 二、New API介绍
- 2.1 New API简介
- 2.2 主要特性
- 三、本次实践介绍
- 3.1 本次实践介绍
- 3.2 环境规划
- 四、开通DeepSeek商用服务
- 4.1 进入ModelArts Studio控制台
- 4.2 开通商业服务
- 4.3 复制OpenAI SDK信息
- 4.4 创建API key
- 五、本地部署New API系统
- 5.1 创建部署目录
- 5.2 下载容器镜像
- 5.3 创建New API容器
- 5.4 检查容器状态
- 5.5 检查容器日志
- 六、访问New API服务
- 6.1 访问New API初始页
- 6.2 注册账号
- 6.3 重新登录New API
- 七、New API使用体验
- 7.1 添加渠道
- 7.2 渠道测试
- 7.3 创建API令牌
- 7.4 测试对话
- 7.5 调用统计
- 八、实践体验与总结
前言
随着人工智能技术的迅猛发展,大模型的应用已成为推动产业智能化的重要力量。华为云ModelArts Studio
凭借其强大的AI开发能力与全新升级的New API
接口,为开发者打造了一个高效、灵活的一站式开发平台。本文将围绕如何利用New API实现大模型网关与AI资产管理的无缝对接,探索华为云在AI生态构建中的创新实践与技术优势。
一、华为云ModelArts Studio平台介绍
1.1 ModelArts Studio介绍
- 🌟 平台介绍
ModelArts Studio
是华为云提供的一个大模型即服务平台(MaaS服务),旨在简化模型开发流程,支持定制化大模型的开发,并使这些模型能够无缝集成到业务系统中。通过降低企业AI应用的成本和难度,ModelArts Studio助力企业快速实现AI技术落地。
- 👉 立即体验:通过ModelArts Studio,让大模型成为企业数字化转型的核心驱动力,解锁智能未来!
1.2 ModelArts Studio主要特点
-
全栈模型生态,性能卓越
✅ 主流模型全覆盖:集成Llama、Baichuan、Yi、Qwen、DeepSeek等99%业界SOTA开源模型,预适配昇腾算力底座,精度与推理性能显著提升。
✅ 零代码自动化开发:沉淀100+行业调优经验,提供一键训练、自动超参优化、标准化流水线,无需手动调参,开发周期缩短50%+。
✅ 昇腾深度优化:基于昇腾算子与显存优化技术,训练/推理效率大幅提升,预置最优超参配置,开箱即用。 -
资源灵活可控,成本优化
💡 按需付费,弹性扩缩:分钟级获取算力资源,按实际使用收费,避免闲置浪费,降低AI入门门槛。
💡 高可用性保障:多数据中心部署,支持故障快速恢复(快恢)与断点续训,确保训练任务不中断,保护项目连续性。 -
智能应用快速构建
🤖 Agent开发加速器:提供优质Prompt模板与智能Agent沉淀,支持复杂任务拆解(如多系统协同决策),快速生成业务专属智能体。
🤝 组件化生态集成:即插即用MCP Server、LangChain、RAG、Guard等工具,一站式构建智能问答、知识管理、流程自动化等应用。 -
一站式全生命周期服务
📦 全流程工具链:覆盖模型调优、压缩、部署、评测等环节,支持「即开即用」,无需跨平台切换。
⚙️ 标准化流水线:内置性能与精度评价体系,自动化完成模型优化,确保全场景高性能表现。
二、New API介绍
2.1 New API简介
New API
是基于 One API 的二次开发项目,打造新一代的大语言模型(LLM)网关和 AI 资产管理平台。它支持将多种主流大模型(如 OpenAI、Claude 等)统一格式调用,适用于个人开发者及企业内部进行 AI 模型接口的管理与分发。
2.2 主要特性
特性 | 描述 |
---|---|
🎨 全新的UI界面 | 提供现代化、简洁直观的操作界面,提升用户体验。 |
🌍 多语言支持 | 支持多语言切换,满足国际化使用需求。 |
💰 支持在线充值功能(易支付) | 用户可通过集成支付系统实现便捷充值。 |
🔍 支持用key查询使用额度 | 配合 neko-api-key-tool 实现API Key的额度查询与管理。 |
🔁 兼容原版One API的数据库 | 无缝迁移原有 One API 数据,降低升级成本。 |
💵 支持模型按次数收费 | 可根据不同模型设置调用次数计费策略。 |
⚖️ 支持渠道加权随机 | 根据配置权重智能分配请求到不同渠道,提高可用性。 |
📈 数据看板(控制台) | 提供可视化数据统计面板,便于监控整体运行情况。 |
🔒 令牌分组、模型限制 | 支持对Token进行分组管理,并限制可调用的模型。 |
🤖 支持更多授权登录方式 | 支持 LinuxDO、Telegram、OIDC 等多种身份认证方式。 |
🔁 支持Rerank模型(Cohere和Jina) | 支持排序模型接入,提升搜索与推荐质量。 |
⚡ 支持OpenAI Realtime API(包括Azure渠道) | 完整支持 OpenAI 实时语音交互接口。 |
⚡ 支持Claude Messages 格式 | 兼容 Anthropic Claude 的 Messages 接口格式。 |
💬 支持使用路由 /chat2link 进入聊天界面 | 快速进入网页聊天界面,方便测试与演示。 |
🧠 支持通过模型名称后缀设置 reasoning effort | 通过后缀(-high / -medium / -low)灵活控制推理模式。 |
🔁 思考转内容功能 | 将模型的“思考”过程转换为最终输出内容。 |
🔀 针对用户的模型限流功能 | 可针对特定用户或组设置模型调用频率限制。 |
💰 缓存计费支持 | 缓存命中时可按设定比例计费,节省资源与成本。 |
三、本次实践介绍
3.1 本次实践介绍
- 本次实践基于个人测试环境,采用华为云 Flexus X 实例作为部署载体,结合 ModelArts Studio 平台开展相关测试与验证工作;
- 借助New API,华为云 ModelArts Studio 实现了与大模型网关及 AI 资产管理系统的高效集成与无缝对接。
3.2 环境规划
云厂商 | 云服务器 | 云服务 | 部署项目 | 备注 |
---|---|---|---|---|
华为云 | 华为云Flexus X实例 | MaaS平台提供的DeepSeek商用服务 | New API | —— |
四、开通DeepSeek商用服务
4.1 进入ModelArts Studio控制台
ModelArts Studio
是华为云提供的一个大模型即服务平台(MaaS服务),旨在简化模型开发流程,支持定制化大模型的开发,并使这些模型能够无缝集成到业务系统中。通过降低企业AI应用的成本和难度,ModelArts Studio助力企业快速实现AI技术落地。我们登录华为云官网后,进入ModelArts Studio
大模型即服务平台的介绍页。官网地址:https://www.huaweicloud.com/product/modelarts/studio.html。点击“ModelArts Studio控制台”,即可进入maas服务控制台内。
4.2 开通商业服务
访问 ModelArts Studio 大模型即服务平台后,ModelArts Studio 控制台,登录后进入 模型推理 页面,选择 在线推理 > 预置服务 > 商用服务,在模型列表中找到 DeepSeek-R1-32K,点击“开通服务”以启用该模型,具体操作如下所示:
同样的方法,我们可以开通DeepSeek-V3-32K和DeepSeek-R1-32K-0528商用服务,如下所示已正常开通。
4.3 复制OpenAI SDK信息
您可以选择某个已开通的商用服务(例如 DeepSeek-V3-32K),点击其右侧的 “调用说明” 选项,即可查看与该模型兼容的 OpenAI SDK 调用信息。请在此页面复制所需的 模型名称 和 API 地址,并保存至本地,以便后续配置和使用。
4.4 创建API key
我们在ModelArts Studio控制台左侧菜单栏中,单击“API Key管理”,开始创建API key。
填写API key的标签和描述,填写完毕后,确认创建。
复制我们刚才生成的密钥,如下所示:
可以在本地建一个临时文本文件,将以上关键信息保存下来。
五、本地部署New API系统
5.1 创建部署目录
为开展本次实践,需在本地准备一台已安装Linux操作系统的服务器,本文以 Ubuntu 22.04.1 LTS 为例,且已预先配置好 Docker 运行环境。在此基础上,我们将在该服务器上创建用于部署 New-API 项目的相应目录结构,为后续服务部署做好准备。
mkdir -p /data/newapi/ && cd /data/newapi/
5.2 下载容器镜像
执行以下命令,拉取New AP镜像
calciumion/new-api:latest
root@jeven01:/data/newapi# docker pull calciumion/new-api:latest
latest: Pulling from calciumion/new-api
fe07684b16b8: Already exists
72ab02d99a23: Pull complete
438427684c28: Pull complete
977cda970a68: Pull complete
Digest: sha256:89fdeb989a368d6256a9816f304193daffe3ea52aeecb0bc2452fd1d1a384eb0
Status: Downloaded newer image for calciumion/new-api:latest
docker.io/calciumion/new-api:latest
5.3 创建New API容器
如果想要使用docker命令行方式部署,可参考以下示例:
docker run -d \--restart always \--name new-api \-p 5200:3000 \-v /data/newapi/data:/data \calciumion/new-api:latest
本次实践使用docker compose方式创建容器,建议采用该方式进行创建容器项目。
vim docker-compose.yaml
version: '3'services:new-api:image: calciumion/new-api:latestcontainer_name: new-apiports:- "5200:3000"volumes:- ./data:/datarestart: always
执行以下命令,创建New API相关容器。
docker compose up -d
5.4 检查容器状态
检查容器状态,确保New API相关容器都正常启动。
root@jeven01:/data/newapi# docker compose ps
WARN[0000] /data/newapi/docker-compose.yaml: the attribute `version` is obsolete, it will be ignored, please remove it to avoid potential confusion
NAME IMAGE COMMAND SERVICE CREATED STATUS PORTS
new-api calciumion/new-api:latest "/one-api" new-api About a minute ago Up About a minute 0.0.0.0:5200->3000/tcp, [::]:5200->3000/tcp
5.5 检查容器日志
检查New API容器日志,可以看到New API服务正常运行。
docker compose logs
六、访问New API服务
6.1 访问New API初始页
浏览器访问http://<云服务器公网IP地址>:5200,将IP替换为云服务器的弹性公网IP地址,访问New API的初始页。如果无法访问到该页面,需要检查操作系统的防火墙是否关闭或放行相关服务端口。
6.2 注册账号
在 New API 的注册页面中,用户可自行填写账号和密码,并选择使用模式为【对外运营模式】,完成设置后点击“初始化系统”按钮即可完成系统初始化。
6.3 重新登录New API
使用此前设置的账号和密码,在 New API 的登录页面重新进行登录操作。
七、New API使用体验
7.1 添加渠道
在New API首页,依次点击渠道——添加渠道,进入渠道设置页面。
创建新渠道配置项,可参考如下:
类型
:OpenAI名称
:华为云 (自定义命名)密钥
:华为云maas的API KeyAPI地址
: https://api.modelarts-maas.com (会提示不要加/v1)模型
:DeepSeek-V3 (自定义模型DeepSeek-V3)其余配置默认
,提交即可。
7.2 渠道测试
在New API的左侧菜单栏中,我们选择个人设置——其他设置——价格设置,勾选接受未设置价格模型,确定保存配置。
回到渠道模块页面,点击“测试”按钮,可以看到提示该渠道测试成功,可以正常使用。
7.3 创建API令牌
依次点击API令牌——添加令牌,进入API令牌配置页面。
在 API 令牌设置中,由于当前为测试环境,我们填写名称为“华为云”,过期时间选择“永不过期”,并设置额度为无限,确认后提交即可。
7.4 测试对话
在左侧菜单栏中,我们选择“操练场”,选择刚才设置自定义模型DeepSeek-V3,在对话框内进行提问。
通过简单的提问测试,可以确认 DeepSeek-V3 已能够正常响应问题并给出相应的回答,服务运行稳定、反馈准确。
在本次测试中,我们向 AI 提出了问题:“请对世界名著《巴黎圣母院》进行简要总结,并阐述你的理解与思考。”用以检验其对文学作品的理解与分析能力。从回答结果可以看出,AI 能够按照要求清晰作答,内容结构合理、见解深刻,展现出较强的文学解析能力。
7.5 调用统计
在 New API 的数据看板以及华为云 ModelArts Studio(MAAS)的 API 调用统计中,可以清晰地观察到 Tokens 使用量始终保持一致,均为 102。这一数据表明系统间的调用记录与计费统计实现了精准同步,验证了接口对接的稳定性与准确性。
八、实践体验与总结
🌟 实践体验分享
在本次华为云ModelArts Studio的实践过程中,我们深刻体会到其作为一站式AI开发平台的强大与便捷。通过全新升级的New API接口,我们成功实现了大模型网关与AI资产管理系统之间的无缝对接,极大简化了数据流转流程,提升了模型调用效率与资产管理能力。整个操作过程流畅、响应迅速,充分展现了华为云在AI工程化落地方面的领先实力。📊✨
🚀 总结与展望:技术驱动未来
华为云ModelArts Studio凭借灵活的API扩展能力和高度集成的开发环境,为开发者和企业提供了稳定可靠的AI开发底座。借助New API,不仅实现了系统间的高效协同,也为构建智能化、可扩展的AI应用打开了更多可能性。随着AI技术不断演进,华为云将持续引领创新方向,助力每一位开发者释放潜能,推动智能产业升级!🧠🔗
📢 拥抱智能新时代,从华为云ModelArts Studio开始!