当前位置: 首页 > news >正文

大数据原生集群 (Hadoop3.X为核心) 本地测试环境搭建二

本篇安装软件版本

mysql5.6
spark3.2.1-hadoop3.2
presto0.272
zeppelin0.11.2
kafka_2.13_3.7.2


mysql

安装步骤见-》 https://blog.csdn.net/dudadudadd/article/details/110874570

spark

安装步骤见-》https://blog.csdn.net/dudadudadd/article/details/109719624
安装的时候要注意的点如下
1、3.x的spark一定要早env中改默认的master-web端口,默认的8080会导致内部资源404
2、3.x的spark和下面的hive3.x一样需要将jars下的guava-14包改个名字,不用自带的,将hadoop中share/hadoop/common/lib/guava-27.0-jre.jar包复制到jars目录下
3、3.x的spark在env文件中指定master的地址时,用的是SPARK_MASTER_HOST,而不再是SPARK_MASTER_IP,这一点一定要注意

presto

安装步骤见-》https://blog.csdn.net/dudadudadd/article/details/109726023 presto安装的时候虽然搭建在hadoop3.0体系上,但并不受影响,正常按照之前的方式配置hive的catalog就行

zeppelin

安装步骤见-》https://blog.csdn.net/dudadudadd/article/details/109719624
安装要注意:这个版本改动默认spark执行器的配置时,页面上的提示不准,需要正常的设置spark.master=yarnspark.submit.deployMode=cluster 才可以

kafka

安装步骤见–》https://blog.csdn.net/dudadudadd/article/details/109679296

需要注意的时较新的kafka版本在操作的时候,已经不再需要--zookeeper zookeeper集群地址这个配置了,你如果直接使用的话会提示你这个参数已经不再有效了,现在较新的kafka指定自身的bootstrap-server就行,底层在运行的时候会自动识别和处理zookeeper的链接信息,如下

[root@node1 ~]# /opt/kafka2.13_372/bin/kafka-topics.sh --create --bootstrap-server node1:9092 --replication-factor 1 --partitions 1 --topic test
Created topic test.
[root@node1 ~]# /opt/kafka2.13_372/bin/kafka-topics.sh --bootstrap-server node1:9092 --list
test

第一篇https://blog.csdn.net/dudadudadd/article/details/139886344

http://www.lryc.cn/news/520930.html

相关文章:

  • ClickHouse vs StarRocks 选型对比
  • 04.计算机体系三层结构与优化(操作系统、计算机网络、)
  • UML系列之Rational Rose笔记八:类图
  • Pycharm 使用教程
  • pycharm+pyside6+desinger实现查询汉字笔顺GIF动图
  • vue3学习-day5
  • SpringData-Redis缓存之RedisTemplate
  • 第423场周赛:检测相邻递增子数组 Ⅰ、检测相邻递增子数组 Ⅱ、好子序列的元素之和、统计小于 N 的 K 可约简整数
  • hive知识体系
  • 第三篇 Avaya IP Office的架构及其服务组成
  • AUTOSAR EcuM(ECU状态管理器)
  • 【PyQt】如何在mainwindow中添加菜单栏
  • 浅谈云计算01 | 云计算服务的特点
  • 【开题报告】基于springboot的煤矿安全监测系统的设计与实现
  • 微服务中引入消息队列的利弊
  • Redis缓存穿透、缓存雪崩和缓存击穿
  • EF Core分页
  • 高效设计新选择!用StartAI打造各种风格主题的平铺素材图!
  • 大数据技术Kafka详解 ⑤ | Kafka中的CAP机制
  • qml Emitter 详解
  • 【Docker】保姆级 docker 容器部署 MySQL 及 Navicat 远程连接
  • mybatis-spring @MapperScan走读分析
  • Mysql--架构篇--体系结构(连接层,SQL层,存储引擎层,文件存储层)
  • 【0x005B】HCI_Write_Default_Erroneous_Data_Reporting命令详解
  • 基于 Python 的学生成绩管理系统设计与实现
  • 【Apache Doris】周FAQ集锦:第 29 期
  • 【C】初阶数据结构3 -- 单链表
  • Autodl安装tensorflow2.10.0记录
  • 【Rust】常见集合
  • SpiderFlow平台v0.5.0之引入selenium插件