当前位置: 首页 > news >正文

大数据课程D3——hadoop的Source

文章作者邮箱:yugongshiye@sina.cn              地址:广东惠州

 ▲ 本章节目的

⚪ 掌握Source的AVRO Source;

⚪ 掌握Source的Exec Source;

⚪ 掌握Source的Spooling Directory Source;

⚪ 掌握Source的Netcat Source;

⚪ 掌握Source的Sequence Generator Source;

⚪ 掌握Source的HTTP Source;

⚪ 掌握Source的Custom Source;

一、AVRO Source

1. 概述

1. AVRO Source监听指定的端口,接收其他节点发送来的被AVRO序列化的数据。

2. AVRO Source结合AVRO Sink可以实现更多的流动模型,包括多级流动、扇入流动以及扇出流动。

2. 配置属性

属性

解释

type

必须是avro

bind

要监听的主机的主机名或者IP

port

要监听的端口

3. 案例

1. 编辑格式文件,在格式文件中需要添加指定内容:

a1.sources = s1

a1.channels = c1

a1.sinks = k1

# 配置AVRO Source

# 必须是avro

a1.sources.s1.type = avro

# 指定要监听的主机

a1.sources.s1.bind = hadoop01

# 指定要监听的端口

a1.sources.s1.port = 8090

a1.channels.c1.type = memory

a1.sinks.k1.type = logger

a1.sources.s1.channels = c1

a1.sinks.k1.channel = c1

2. 启动Flume。

../bin/flume-ng agent -n a1 -c ../conf -f avrosource.conf -

Dflume.root.logger=INFO,console

3. 在另一个窗口中,进入指定目录,编辑文件。

cd /home/software/apache-flume-1.9.0-bin/data

vim a.txt

4. 运行AVRO客户端。

../bin/flume-ng avro-client -H hadoop01 -p 8090 -F a.txt

二、Exec Source

1. 概述

1. Exec Source会运行指定的命令,然后将命令的执行结果作为日志进行收集。

2. 利用这个Source可以实现对文件或者其他操作的实时监听。

http://www.lryc.cn/news/101751.html

相关文章:

  • F5 LTM 知识点和实验 4-持久化
  • SpringBoot之WebMvcConfigurer详解
  • WPF实战学习笔记22-添加自定义询问窗口
  • Spring Boot项目的创建
  • Python加载数据的5种方法
  • QPoint、QLine、QSize、QRect
  • vue+leaflet笔记之地图量测
  • “深入理解SpringBoot:从入门到精通的几个关键要点“
  • 数值线性代数: 共轭梯度法
  • 【JVM】详解对象的创建过程
  • 华纳云:ubuntu下如何搭建nfs服务
  • HCIA实验二
  • stm32 舵机 cubemx
  • 无涯教程-jQuery - Spinner组件函数
  • Python 有趣的模块之pynupt——通过pynput控制鼠标和键盘
  • docker基于centos7镜像安装python3.7.9
  • JavaScript中的switch语句
  • Jquery笔记
  • 【C++】优先级队列的基本概念以及其模拟实现
  • TextClamp for Vue3.0(Vue3.0的文本展开收起组件)
  • 区间预测 | MATLAB实现VAR向量自回归时间序列区间预测
  • 在 Windows 上搭建 NTP 服务器
  • 应急响应经典案例-FTP 暴力破解
  • 41. linux通过yum安装postgresql
  • SpringBoot启动流程及自动配置
  • 【Linux】进程轻松入门
  • 【使用时空RBF-NN进行非线性系统识别】实现了 RBF、分数 RBF 和时空 RBF 神经网络,用于非线性系统识别研究(Matlab代码实现)
  • Tomcat 安装配置教程及成功后,启动失败报错解决方案
  • C#文件操作从入门到精通(2)——查看某个dll中有哪些函数
  • 二分查找算法(全网最详细代码演示)