当前位置: 首页 > news >正文

docker搭建ray集群

1. 安装docker 已安装过docker 没安装流程

启动 Docker 服务

sudo systemctl start docker
sudo systemctl enable docker   # 设置开机即启动docker

验证 Docker 是否安装成功

docker --version

2. 部署ray

# 先停止docker服务
systemctl stop docker   
# 编辑 Docker 的配置文件  更改docker 镜像保存的路径 以防默认目录存储空间不足vim /etc/docker/daemon.json
{"data-root": "/data/docker"  # 自己存储空间大的目录
}
# 再次启动docker服务 使上面的配置文件生效
systemctl start docker   
# 拉取镜像到本地
docker pull **镜像名称:版本** 
# 查看镜像
docker images# --network host参数 使docker环境共享宿主机IP# -v  参数使docker环境共享宿主机挂载目录# tail -f /dev/null 参数  挂起docker  使其不中断
docker run -d --name **docker环境名称 自命名即可** --network host -v /mnt1:/mnt1 -v /mnt2:/mnt2 -v /data:/data -v /mnt3:/mnt3 **镜像名称:版本** tail -f /dev/null
# 查看docker环境列表
docker ps
#进入docker环境  执行任务
docker exec -it **自命名的docker环境名称** /bin/bash 
# 退出docker环境
exit  
# 停止容器
docker stop ailab-data-pipelinev3   # 删除已停止的容器
docker rm ailab-data-pipelinev3    
# 查看ray版本   所有机器ray版本应保持一致  否则集群不能使用
ray --version
# head节点启动命令
ray start --head --port=6379 --dashboard-host=0.0.0.0 --dashboard-port=8265  --num-cpus 96
#每个work节点启动ray服务命令   请替换IP和--num-cpus数目 --num-cpus 可以是nproc的值
ray start --address='127.0.0.0:6379' --num-cpus 96    
ray start --address='127.0.0.0:6379' --num-cpus 32
# 提交任务命令
ray job submit --working-dir ./ray_code -- python3 ray.py
http://www.lryc.cn/news/599466.html

相关文章:

  • NodeJS搭建SSE接口服务
  • 【C#补全计划:类和对象(七)—— 重写虚方法】
  • 重构 MVC:让经典架构完美适配复杂智能系统的后端业务逻辑层(内附框架示例代码)
  • 图片查重从设计到实现(4)图片向量化存储-Milvus 单机版部署
  • 【大模型实战】提示工程(Prompt Engineering)
  • 《基于电阻抗断层扫描(EIT)驱动的肌肉骨骼模型表征人体手臂动态意图用于人机交互》论文解读
  • SpringBoot实战指南:从快速入门到生产级部署(2025最新版)
  • Linux进程信号——信号保存
  • RWA项目面临的主要风险有哪些?例如市场风险、技术风险和法律风险。
  • 比特币技术简史 第九章:比特币的未来 - 发展趋势、挑战和机遇
  • Linux: network: wireshark: esp attempt to detec null-encrypted esp payloads
  • Linux: network: wireshark: tcp的segment重组是怎么判断出来的
  • Comfyui中Upscale Image By 几种放大方法的区别
  • Oracle转Mysql建表脚本
  • mysql 和oracle的选择
  • 【矩阵专题】Leetcode48.旋转图像(Hot100)
  • 【源力觉醒 创作者计划】ERNIE-4.5-VL-28B-A3B 模型详解:部署、测试与 Qwen3 深度对比测评
  • leetcode_122 买卖股票的最佳时机II
  • Axios基本使用
  • 分别使用 Java 8 和 Python 调用 Elasticsearch 接口简单获取数据
  • Web前端:JavaScript 随机点名系统案例详解
  • 常用设计模式系列(十二)—享元模式
  • OpenTelemetry学习笔记(十二):在APM系统中,属性的命名空间处理遵循规则
  • 基于讯飞星火AI的文学作品赏析系统开发实战:从通用聊天到专业文学分析的完整技术方案
  • 新房装修是中央空调还是壁挂空调好?
  • 滑动窗口---6(稍难)
  • GDB调试命令学习
  • 【开源软件】SimpleAI一款轻量级的桌面随身AI助手
  • 航段导航计算机 (Segment_Navigator) 设计与实现
  • OSPF 协议(多区域)