当前位置: 首页 > news >正文

Flink SQL DataGen Connector 示例

Flink SQL DataGen Connector 示例

1、概述

使用 Flink SQL DataGen Connector,可以快速地生成符合规则的测试数据,可以在不依赖真实数据的情况下进行开发和测试。

2、使用示例

创建一个名为 “users” 的表,包含 6 个字段:id、name、age、email、created_at 和 updated_at。

在表的定义中,指定各个字段的规则:

id 字段使用序列生成器,生成的范围从 1 到 1000;

name 字段的长度为 10 个字符;

age 字段的范围从 18 到 60 岁;

email 字段的长度为随机的10个字符;

created_at 和 updated_at 字段使用随机时间生成器,时间范围从 2022 年 1 月 1 日到 2022 年 12 月 31 日。

3、官网参数介绍
1)数据类型注释
TypeSupported GeneratorsNotes
BOOLEANrandom
CHARrandom / sequence
VARCHARrandom / sequence
STRINGrandom / sequence
DECIMALrandom / sequence
TINYINTrandom / sequence
SMALLINTrandom / sequence
INTrandom / sequence
BIGINTrandom / sequence
FLOATrandom / sequence
DOUBLErandom / sequence
DATErandomAlways resolves to the current date of the local machine.
TIMErandomAlways resolves to the current time of the local machine.
TIMESTAMPrandomAlways resolves to the current timestamp of the local machine.
TIMESTAMP_LTZrandomAlways resolves to the current timestamp of the local machine.
INTERVAL YEAR TO MONTHrandom
INTERVAL DAY TO MONTHrandom
ROWrandomGenerates a row with random subfields.
ARRAYrandomGenerates an array with random entries.
MAPrandomGenerates a map with random entries.
MULTISETrandomGenerates a multiset with random entries.
2)连接器参数:
参数是否必选默认值数据类型描述
connector必须(none)String指定要使用的连接器,这里是 ‘datagen’。
rows-per-second可选10000Long每秒生成的行数,用以控制数据发出速率。
fields.#.kind可选randomString指定 ‘#’ 字段的生成器。可以是 ‘sequence’ 或 ‘random’。
fields.#.min可选(Minimum value of type)(Type of field)随机生成器的最小值,适用于数字类型。
fields.#.max可选(Maximum value of type)(Type of field)随机生成器的最大值,适用于数字类型。
fields.#.length可选100Integer随机生成器生成字符的长度,适用于 char、varchar、string。
fields.#.start可选(none)(Type of field)序列生成器的起始值。
fields.#.end可选(none)(Type of field)序列生成器的结束值。
4、代码示例
CREATE TABLE users (id BIGINT,name STRING,age INT,text STRING,created_at TIMESTAMP(3),updated_at TIMESTAMP(3)
) WITH ('connector' = 'datagen','fields.id.kind' = 'sequence','fields.id.start' = '1','fields.id.end' = '1000','fields.name.length' = '10','fields.age.min' = '18','fields.age.max' = '60','fields.text.length' = '5'
);

测试结果:

select * from users;

在这里插入图片描述

http://www.lryc.cn/news/220167.html

相关文章:

  • 【监控指标】监控系统-prometheus、grafana。容器化部署。go语言 gin框架、gRPC框架的集成
  • 时序分解 | Matlab实现PSO-VMD粒子群算法优化变分模态分解时间序列信号分解
  • leetcode 684. 冗余连接
  • yolov8模型训练、目标跟踪
  • Flink SQL Regular Join 、Interval Join、Temporal Join、Lookup Join 详解
  • 如何在搜索引擎中应用AI大语言模型,提高企业生产力?
  • 实验七 组合器模式的应用
  • Springboot实现人脸识别与WebSocket长连接的实现
  • 智能安全帽功能-EIS智能防抖摄像头4G定位视频语音气体检测
  • TEMU跨境平台珠宝首饰RSL报告如何办理?
  • 51单片机的篮球计分器液晶LCD1602显示( proteus仿真+程序+原理图+PCB+设计报告+讲解视频)
  • 【NI-DAQmx入门】NI-DAQmx之Python
  • YoloV8目标检测与实例分割——目标检测onnx模型推理
  • pcigo图床插件的简单开发
  • Find My手机保护壳|苹果Find My与手机保护壳结合,智能防丢,全球定位
  • encode和decode的区别
  • 建设项目管理中的 5 大预算挑战
  • vue2 集成 - 超图-SuperMap iClient3D for WebGL
  • FPGA设计过程中有关数据之间的并串转化
  • hologres基础知识一文全
  • 阿里云oss迁移到AWS S3
  • RabbitMQ(高级特性):限流
  • LeetCode--570. 至少有5名直接下属的经理
  • Ubuntu20.04下安装Redis环境
  • 什么是用户体验测试? 为什么很重要?
  • Android 图片翻面动画
  • 如何恢复已删除的PDF文件?4个常用方法分享(含操作步骤)!
  • head first python 第一章-新代码更新pypi
  • mysql之备份和恢复
  • 【音视频 | Ogg】libogg库详细介绍以及使用——附带libogg库解析.opus文件的C源码