当前位置: 首页 > news >正文

Azure 使用记录

最近在做CDP迁移到Azure 云的任务,鉴于databricks中的job参数只能写死,故需在虚拟机上部署,方便参数的可变。
Azure VM 可以部署脚本,用于启动(触发)​​ Databricks 工作流(Workflow)中的作业(Job)。一旦作业被成功触发,​​实际的计算任务(运行笔记本、JAR文件、Spark作业等)是在你的 Databricks 工作区关联的、配置的云端集群(Databricks集群或Databricks Serverless)上执行的,而不是在Azure VM上执行的。
价值:​​
1. 自动化与集成​​:你可以将 databricks jobs run-now命令(或其他 CLI 命令)集成到你在 Azure VM 上运行的自动化脚本、持续集成/持续部署(CI/CD)管道或其他应用程序中,从而自动触发 Databricks 工作流。
2. ​​调度替代方案​​:虽然 Databricks 工作流本身有调度器,但有时你可能想从外部系统(如部署在VM上的调度系统、或者事件驱动的脚本)来触发作业。
3. ​​集中管理​​:在一个点上(比如特定的管理 VM)管理多个 Databricks 作业的启动。
4. ​​安全与控制​​:Azure VM 可以配置严格的网络安全规则和管理策略。

使用前的关键配置步骤:​​

  1. 安装 Databricks CLI​​: 确保已在 Azure VM 上成功安装了 Databricks CLI (pip install databricks-cli) 或使用其他安装方法。
  2. 身份验证​​: 这是最关键的一步。你必须让运行在 VM 上的 Databricks CLI 能够安全地访问你的 Databricks 工作区:
    l 生成访问令牌​​:
    ①. 登录到你的 Databricks 工作区。
    ②. 转到用户设置 -> 开发人员 -> 访问令牌 -> 生成新令牌
    ③. 记录生成的令牌
    l 配置 CLI​​:在 Azure VM 的命令行中运行
    databricks configure --token
    系统会依次提示输入:
    ○ Databricks Host:你的工作区 URL,通常是 https://.azuredatabricks.net
    ○ Token:粘贴上面生成的访问令牌。

替代方案​​:对于更安全或自动化的场景(如脚本),可以使用​​服务主体​​身份认证(推荐)或直接将主机/令牌设置为环境变量(DATABRICKS_HOST, DATABRICKS_TOKEN),但要注意安全保护(例如使用 Azure Key Vault)
3. 触发作业databricks jobs run-now --job-id 。 可以通过 databricks jobs run-now --help查看其他选项,如传递参数。
4. 监控运行:
○ 使用 databricks runs list --job-id查看该作业的所有运行实例。
○ 使用databricks runs get-output --run-id获取特定运行 ID 的详细输出和日志(注意:获取的是驱动日志摘要和结果,详细任务日志仍需在 Databricks UI 的 Spark UI 或集群驱动日志中查看)

Databricks上部署spark 任务的方法:
在这里插入图片描述
点击Create Job 按钮:
在这里插入图片描述
Task name 里填写Job name, Parameters 框内配置参数后点击Create 按钮即可。
生成后可在如下界面找到对应Job ID

http://www.lryc.cn/news/626589.html

相关文章:

  • mapbox高阶,结合threejs(threebox)添加建筑glb模型,添加阴影效果,设置阴影颜色和透明度
  • 通过try-catch判断数据库唯一键字段是否重复
  • linux的内核符号表
  • 【表的操作】
  • 深入理解 Linux 多线程
  • mysql-8.0.37-linux-glibc2.12-x86_64安装
  • 可实现三重空间感知:Ai2 开源具身机器人 AI 模型 MolmoAct
  • 从防抖节流到链表树:编程世界中的抽象优化艺术
  • 23种设计模式——模板方法模式(Template Method Pattern)详解
  • 在一台没联网的机器上,用ollama加载qwen3,14b
  • 遥感机器学习入门实战教程|Sklearn 案例④ :多分类器对比(SVM / RF / kNN / Logistic...)
  • 使用 GraalVM Native Image 将 Spring Boot 应用编译为跨平台原生镜像:完整指南
  • Spring Boot 配置
  • nvidia最新论文:小型语言模型是代理人工智能的未来
  • (5)软件包管理器 yum | Vim 编辑器 | Vim 文本批量化操作 | 配置 Vim
  • 5G-A赋能AR眼镜:毫米级虚实融合的未来已来
  • 开源 AR 眼镜怎么选?OpenGlass ,OSSG,cheApR 分析推荐
  • 给你的Unity编辑器添加实现类似 Odin 的 条件显示字段 (ShowIf/HideIf) 功能
  • 用好 Elasticsearch Ruby 传输层elastic-transport
  • 二维码跳转支付宝、微信小程序二码合一(直接关联、中间页识别跳转)方案
  • python-使用鼠标对图片进行涂抹自定义绘图
  • 自己微调的大模型如何用ollama运行
  • Android 开发问题:android:marginTop=“20px“ 属性不生效
  • 数字化图书管理系统设计实践(java)
  • Redis 复制功能是如何工作的
  • Linux I/O 多路复用实战:Select/Poll 编程指南
  • iOS 应用上架常见问题与解决方案,多工具组合的实战经验
  • Redis--day9--黑马点评--分布式锁(二)
  • C++ 数据结构 和 STL
  • 大数据毕业设计选题推荐-基于大数据的1688商品类目关系分析与可视化系统-Hadoop-Spark-数据可视化-BigData