当前位置: 首页 > news >正文

Training - 使用 WandB 配置 可视化 模型训练参数

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/137529140

WandB

WandB (Weights&Biases) 是轻量级的在线模型训练可视化工具,类似于 TensorBoard,可以帮助用户跟踪实验,记录运行中的超参数和输出指标,可视化结果,并且,共享这些结果。WandB 支持所有主流的深度学习框架,如 TensorFlow、PyTorch、Keras 等,提供了丰富的功能。使用 WandB,可以轻松地监控模型训练过程,通过云平台同步模型输出、日志和文件,便于远程监控和协作。

WandB 的自动化配置如下,在 sh 文件中,配置账号:

wandb online
wandb login [your api key]

API Key 位于 User settings - Danger Zone,即:

API Key

API Key 需要与 WANDB_ENTITY 成对使用。

启动 WandB 的命令,如下:

  • entity: WandB 的 UserName,需要与 API Key 配对。
  • project: 工程名称,用于存储名称
  • name:实验名称,用于区分不同的实验

即:

os.environ['WANDB_ENTITY'] = "[your name]"if args.wandb:logger.info(f"Initializing wandb! {os.environ['WANDB_ENTITY']}")wandb.init(entity=os.environ["WANDB_ENTITY"],settings=wandb.Settings(start_method="fork"),project="alphaflow",name=args.run_name,config=args,)

注意:同一个项目(Project),例如 alphaflow,结果才能进行比较。

WandB 的相关日志:

wandb: Currently logged in as: morndragon. Use `wandb login --relogin` to force relogin
wandb: wandb version 0.16.6 is available!  To upgrade, please run:
wandb:  $ pip install wandb --upgrade
wandb: Tracking run with wandb version 0.16.5
wandb: Run data is saved locally in wandb/run-20240408_161416-fl5dmx0d
wandb: Run `wandb offline` to turn off syncing.
wandb: Syncing run experiment-20240408
wandb: ⭐️ View project at https://wandb.ai/[your name]/alphaflow
wandb: 🚀 View run at https://wandb.ai/[your name]/alphaflow/runs/fl5dmx0d/workspace

WandB 页面展示:

WandB

Bug:wandb.errors.CommError: It appears that you do not have permission to access the requested resource.,即:

wandb: Currently logged in as: morndragon. Use `wandb login --relogin` to force relogin
wandb: ERROR Error while calling W&B API: permission denied (<Response [403]>)
Problem at: /nfs_beijing_ai/chenlong/workspace/alphaflow-by-chenlong/train.py 50 main
wandb: ERROR It appears that you do not have permission to access the requested resource. Please reach out to the project owner to grant you access. If you have the correct permissions, verify that there are no issues with your networking setup.(Error 403: Forbidden)
Traceback (most recent call last):File "train.py", line 177, in <module>main()File "train.py", line 50, in mainwandb.init(File "miniconda3/envs/alphaflow/lib/python3.9/site-packages/wandb/sdk/wandb_init.py", line 1206, in initraise eFile "miniconda3/envs/alphaflow/lib/python3.9/site-packages/wandb/sdk/wandb_init.py", line 1187, in initrun = wi.init()File "miniconda3/envs/alphaflow/lib/python3.9/site-packages/wandb/sdk/wandb_init.py", line 786, in initraise error
wandb.errors.CommError: It appears that you do not have permission to access the requested resource. Please reach out to the project owner to grant you access. If you have the correct permissions, verify that there are no issues with your networking setup.(Error 403: Forbidden)

原因是 WandB 的登录名称 WANDB_ENTITY,与 API Key,不匹配,需要重新设置,即可。

os.environ['WANDB_ENTITY'] = "[your name]"
http://www.lryc.cn/news/335288.html

相关文章:

  • N1922A是德科技N1922A功率传感器
  • 最简洁的Docker环境配置
  • Docker内更新Jenkins详细讲解
  • 基于遗传模拟退火混合优化算法的车间作业最优调度matlab仿真,输出甘特图
  • Mac 安装 brew brew cask 遇到的问题以及解决办法
  • Vitalik Buterin香港主旨演讲:协议过去10年迅速发展,但存在效率、安全两大问题
  • 【leetcode】大数相加
  • 数据检索的优化之道:B树与B+树的深度解析与应用探索
  • 替换服务器的SSL证书有什么影响?
  • java中可变参数和简单游戏
  • 软考高级架构师:TCP/IP 协议 和 OSI 七层模型
  • 【微服务】------常见模型的分析与比较
  • C#实现HTTP上传文件的方法
  • pdffactory pro 8注册码序列号下载 附教程
  • 软件供应链安全:寻找最薄弱的环节
  • Training - Kubeflow 的 PyTorchJob 配置 DDP 分布式训练 (ncclInternalError)
  • java Web在线考试管理系统用eclipse定制开发mysql数据库BS模式java编程jdbc
  • 爬虫 新闻网站 以湖南法治报为例(含详细注释) V4.0 升级 自定义可任意个关键词查询、时间段、粗略判断新闻是否和优化营商环境相关,避免自己再一个个判断
  • 科技云报道:从“奇点”到“大爆炸”,生成式AI开启“十年周期”
  • 【用户案例】太美医疗基于Apache DolphinScheduler的应用实践
  • 权限管理系统【BUG】
  • 【CPA考试】2024注册会计师报名照片尺寸要求解读及手机拍照方法
  • 高并发环境下的实现与优化策略
  • 华为海思校园招聘-芯片-数字 IC 方向 题目分享——第二套
  • UML2.0在系统设计中的实际使用情况
  • django celery 异步任务 异步存储
  • apex0.1版本安装踩坑指南
  • HTML — 弹性布局(2)
  • MYSQL 8.0版本修改用户密码(知道登录密码)和Sqlyog错误码2058一案
  • Linux中磁盘管理