当前位置: 首页 > news >正文

SparkML

SparkML

SparkML_lr_train :读取py处理后的train表用于训练,将训练模型保存好。
SparkML_lr_predict :读取训练好的模型,读取py处理后的test表用于预测。将预测结果写入normal_data中,根据id修改stream_is_normal的值。

提交spark任务

bin/spark-submit \
--class SparkML_lr_train \
--master yarn \
--deploy-mode cluster \
./SparkML_lr_train1.jar \
10bin/spark-submit \
--class SparkML_lr_train \
--master yarn \
--deploy-mode client \
./SparkML_lr_train4.jar \
10bin/spark-submit \
--class SparkML_lr_predict \
--master yarn \
--deploy-mode client \
./SparkML_lr_predict.jar \
10bin/spark-submit \
--class lr_train\
--master yarn \
--deploy-mode client \
./lr_train.jar \
10bin/spark-submit \
--class lr_predict\
--master yarn \
--deploy-mode client \
./lr_predict.jar \
10

启动hadoop(启动脚本)
hdp.sh start
启动spark(命令行启动)
sbin/start-all.sh

bin/spark-submit
–class SparkSQL_lr_train
–master yarn
–deploy-mode client
./SparkSQL_lr_train.jar
10

bin/spark-submit
–class lr_train
–master yarn
–deploy-mode client
./lr_train.jar
10

http://www.lryc.cn/news/222463.html

相关文章:

  • 实时定位与路径优化:跑腿App系统开发中的地理信息技术
  • Tomcat的HTTP Connector
  • 将Pytorch搭建的ViT模型转为onnx模型
  • 图神经网络(GNN)性能优化方案汇总,附37个配套算法模型和代码
  • 国科大移动互联网考试资料(2023+2020+2018真题+答案)
  • ModStart系统安全规范建议
  • 【漏洞复现】Django_debug page_XSS漏洞(CVE-2017-12794)
  • Redis性能调优:深度剖析与示例解析
  • oracle查询前几条数据的方法
  • c#弹性和瞬态故障处理库Polly
  • 20231107-前端学习炫酷菜单效果和折叠侧边栏
  • 基于CLIP的图像分类、语义分割和目标检测
  • python爬虫(数据获取——selenium)
  • [wp]NewStarCTF 2023 WEEK5|WEB
  • 未将对象引用设置到对象实例
  • 网络的地址簿:Linux DNS服务的全面指南
  • 输电线路AR可视化巡检降低作业风险
  • 18. 四数之和
  • 排序:堆排序(未完待续)
  • 小米智能电视投屏方法
  • 保外就医罪犯收到指定医院《罪犯病情诊断书》及检测、检查报告等其他医疗文书后,应当在规定时限内提交( ),或者受委托司法所审查。
  • pytorh模型训练、测试
  • MySQL 8.0 Clone Plugin 详解
  • 掌握未来技术趋势:深度学习与量子计算的融合
  • 京东数据分析:2023年9月京东笔记本电脑行业品牌销售排行榜
  • 3 任务3 使用趋动云部署自己的stable-diffusion
  • C语言 memset
  • Windows安装svn命令
  • vr航天探索科普展vr航天科普亲子嘉年华
  • 双11“万亿交易额”背后,浪潮信息助力银行扛住交易洪流