当前位置: 首页 > article >正文

云效流水线Flow使用记录

概述

最近在频繁使用阿里云云效的几款产品,如流水线。之前写过一篇,参考云效流水线缓存问题。

这篇文章来记录更多问题。

环境变量

不管是云效流水线Flow还是应用交付AppStack(基于流水线,后文不再赘述),都内置很多环境变量。参考环境变量。

Codeup

阿里云云效的代码管理,有独立的子域名:https://codeup.aliyun.com/。

关于代码仓库的权限管理,业界有很多不同的做法。据说Google使用同一套代码仓库,所有研发有所有Git仓库的阅读(View,Clone等)权限。

这在中国不太现实。云效Codeup有很严格的权限管理。比如在我司,我作为后端开发,无法查看前端、Python代码。但是呢,老板又给我布置一个AppStack的调研任务。

不管是在流水线还是AppStack里新增构建,都需要连接到Codeup。

不太确定是流水线的默认设置,还是我们公司代码仓库管理员的权限管控设置(大大大概率是后者)。

服务连接默认是【仅自己可见】:
在这里插入图片描述
基本信息截图如下,注意下图的授权:
在这里插入图片描述
但是呢,组织内的任何人都有新增服务连接的权限。
在这里插入图片描述
上图写错,应为【可选项】。

由于不能【查看】并使用他人的服务连接,组织内的任何一个开发者想要构建镜像,并发布到测试环境,要么去找运维来干这个事儿,要么是自己摸索。摸索着摸索着,就新增服务连接。就此埋下隐患。

运维离职。问题暴露。

大面积流水线构建报错:
在这里插入图片描述
日志截图
在这里插入图片描述
排查上述问题时,短暂地看过超管登录流水线子域名后的界面。乖乖,10多个服务连接,乱得一批。

上述问题的解决方法:【编辑】各个离职人创建的服务连接,选择一个可用的【服务授权/证书】;而不是针对各个流水线大面积去更换服务连接。

治理

上面提到人人都可新增服务连接,超管设置可收回此权限。

另外【超管或服务连接的创建人】可编辑服务连接,如下图所示(上面贴过一次):
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
【指定人员可见】,能给的权限也仅仅只是【使用者】。
在这里插入图片描述
可以完全放开为【所有人可见】!!!!!!!

找运维(有权限)编辑管理员(有代码仓库的最大权限)创建的服务连接,指定我可见。然后我在流水线里就可以【查看】他人创建的服务连接:
在这里插入图片描述
然后可以【查看】所有代码仓库的【连接】权限:
在这里插入图片描述
而我自己创建的服务连接,其Codeup服务连接对codeup代码仓库的可见权限继承自Codeup(有点绕),仅限于backend组,即后端组Java开发(然后老板还给我指派运维工作。。。)
在这里插入图片描述
注意看两张截图的下滑滚动条,很明显上面截图里代码仓库可见范围大得多。

再来看看Codeup代码仓库:
在这里插入图片描述
并没有其他代码仓库(如前端)的权限。

也就是说,Codeup服务连接的可见权限和Codeup代码参考的可见权限完全是两码事。

问题

unbound variable

Helm部署报错:
在这里插入图片描述
未绑定变量,大致意思是找不到变量。

解决方法:
在这里插入图片描述
在这里插入图片描述

failed to compute cache key: failed to compute checksum of ref: not found

构建报错截图如下:
在这里插入图片描述
解决方法:
ContextPath增加一个点解决问题。
在这里插入图片描述

invalid reference format

构建报错截图如下:
在这里插入图片描述
解决方法:

  • 删除替换语法:即写成,不便之处,无法和其他镜像TAG命名样式保持一致(harbor.tesla.com/rag/rag-online:test-ec85d8f3-20250411191733),而变成2025-04-11-19-17-33
    在这里插入图片描述
  • 替换使用的构建集群,如阿里云自带的构建集群
    在这里插入图片描述

failed to resolve dial up timeout

构建报错截图如下:
在这里插入图片描述
排查过程:
登录到流水线执行集群(机器)上,执行docker images命令:
在这里插入图片描述
解决方法:修改Dockerfile的FROM命令。

之前是FROM base_agent:latest
修改为FROM harbor.gpu.tesla.com:543/nlp/base_agentbase_agent:latest

repo app not found

构建报错截图如下:
在这里插入图片描述
排查下来,是流水线源选错:
在这里插入图片描述
解决方法:不是选择Helm代码仓库,而是选择业务代码仓库。

unexpected status from PUT request to 404 Not Found

构建报错截图如下:
在这里插入图片描述
报错日志:

ERROR: error writing manifest blob: failed commit on ref "sha256:b60c3b6e1eaf71deb9214e57eeaaa078d971f07afe28b0687b9f4ee459bf069d": unexpected status from PUT request to https://harbor.gpu.tesla.com:543/v2/nlp/agent/manifests/flow-docker-build-cache: 404 Not Found> importing cache manifest from harbor.gpu.tesla.com:543/nlp/agent:flow-docker-build-cache:exporting cache to registry:
ERROR: failed to solve: error writing manifest blob: failed commit on ref "sha256:b60c3b6e1eaf71deb9214e57eeaaa078d971f07afe28b0687b9f4ee459bf069d": unexpected status from PUT request to https://harbor.gpu.tesla.com:543/v2/nlp/agent/manifests/flow-docker-build-cache: 404 Not Found

报错原因显而易见,镜像缓存地址多了个v2。

报错原因,之前选择的是远端缓存:
在这里插入图片描述
解决方法:选择本地缓存。
在这里插入图片描述
构建参数
在这里插入图片描述

error: failed to solve: rpc error: code = Unknown desc = executor failed running [ ] exit code: 1

构建报错截图如下:
在这里插入图片描述
类似报错:
在这里插入图片描述
类似报错:
在这里插入图片描述
解决方法:
使用私有内部构建集群(节点)
在这里插入图片描述
注意点:

  • 不能使用${DATETIME//-/}格式(报错如上),使用${DATETIME}
  • 镜像缓存使用本地缓存。

原始日志中文乱

如下图所示,流水线里不能查看超过30天之前的日志。
在这里插入图片描述
但是可以点击【查看原始日志】
在这里插入图片描述
中文乱码:
在这里插入图片描述
这咋看?阿里云的Bug。

解决方法:点击上面截图里的【下载日志】,然后在本地查看
在这里插入图片描述

http://www.lryc.cn/news/2387586.html

相关文章:

  • OpenCV CUDA模块图像处理------颜色空间处理之颜色空间转换函数cvtColor()
  • 科技初创企业创新推动商业未来
  • 人工智能文科能学吗?
  • Ntfs!NtfsReadBootSector函数分析之nt!CcGetVacbMiss中得到一个nt!_VACB结构
  • 猿大师办公助手WebOffice用二进制数据流在Web前端打开Office文档
  • etcd:高可用,分布式的key-value存储系统
  • AI in Game,大模型能力与实时音视频技术融合,交出AI应用新答卷
  • 欢乐熊大话蓝牙知识11:如何打造一个低功耗蓝牙温湿度传感器?
  • Linux 安装 Remmina
  • 什么是HTTP HTTP 和 HTTPS 的区别
  • cos和dmz学习
  • 上升沿计数 stm32 中断
  • Java 各版本核心新特性的详细说明
  • Nginx 性能优化全解析:从进程到安全的深度实践
  • Pycharm and Flask 的学习心得(10)重定向
  • 单机Kafka配置ssl并在springboot使用
  • 《棒球特长生》棒球升学途径·棒球1号位
  • JavaScript的call和apply
  • DiT、 U-Net 与自回归模型的优势
  • 开源 FcDesigner 表单设计器组件事件详解
  • Teigha应用——解析CAD文件(DWG格式)Teigha在CAD C#二次开发中的基本应用
  • C++23内存分配新特性:std::allocate_at_least
  • JavaScript性能优化全景指南
  • 04-jenkins学习之旅-java后端项目部署实践
  • 基于Python flask 的豆瓣电影top250数据评分可视化
  • Cat.4+WiFi6工业路由器介绍小体积大作用ER4200
  • 大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)
  • 创建型模式之Abstract Factory(抽象工厂)
  • GitLab 18.0 正式发布,15.0 将不再受技术支持,须升级【一】
  • 【DeepSeek论文精读】12. DeepSeek-Prover-V2: 通过强化学习实现子目标分解的形式化数学推理