当前位置: 首页 > news >正文

2.4 如何在FlinkSQL使用DataGen(数据生成器)

1、DataGen SQL 连接器

FLinkSQL中可以使用内置的DataGen SQL 连接器来生成测试数据

官网链接:DataGen SQL 连接器


2、随机数数据生成器

随机数数据生成器支持随机生成 char、varchar、binary、varbinary、string 类型的数据

它是一个无界流的数据生成器

-- TODO 随机数数据生成器 创建source表
drop table random_datagen_source_table;
CREATE TABLE random_datagen_source_table (user_name string,user_id int) WITH ('connector' = 'datagen','rows-per-second'='1',                 -- 指定生成速率:每秒生成的行数(默认值:10000)-- TODO 对表中的每个字段,进行配置-- 生成随机整数'fields.user_id.kind'='random',        -- 指定 数据生成器类型:random 随机数'fields.user_id.min'='1',              -- 指定 随机数的最小值 'fields.user_id.max'='1000',           -- 指定 随机数的最大值 -- 生成随机字符串(字段类型为string时,可以指定string长度)'fields.user_name.kind'='random',      -- 指定 数据生成器类型:random 随机数'fields.user_name.length'='3'          -- 指定 随机生成字符串的长度
);-- 流式SQL
select * from random_datagen_source_table;

运行结果:


3、序列生成器

序列数据生成器,可以根据指定的起始值和结束值生成连续的整数数据

当序列数字达到结束值,读取结束,所以它是有界的生成器

-- TODO 序列数据生成器 创建source表
drop table sequence_datagen_source_table;
CREATE TABLE sequence_datagen_source_table (user_id int
) WITH ('connector' = 'datagen','rows-per-second'='1',                 -- 指定生成速率:每秒生成的行数(默认值:10000)-- TODO 对表中的每个字段,进行配置'fields.user_id.kind'='sequence',        -- 指定 数据生成器类型:sequence 序列'fields.user_id.start'='1',              -- 指定 序列的起始值'fields.user_id.end'='120'               -- 指定 序列的结束值
);-- 批式SQL
select * from sequence_datagen_source_table;

运行结果:

http://www.lryc.cn/news/199124.html

相关文章:

  • Gin + Ant Design Pro JWT认证
  • canvas实现图片标注,绘制区域
  • SELECT COUNT(*) 会造成全表扫描吗?
  • python考前复习(90题)
  • 根据SpringBoot Guides完成进行示例学习(详细步骤)
  • waf、yakit和ssh免密登录
  • 【AIGC核心技术剖析】大型语言和视觉助手——LLaVA(论文+源码)
  • IBM的WAS简介与基本使用手册
  • Deno 快速入门
  • 【计算机网络笔记】OSI参考模型基本概念
  • ConnectTimeout和ReadTimeout所代表的意义
  • 使用Python计算平面多边形间最短距离,数据需要从excel表格中导入
  • 华为数通方向HCIP-DataCom H12-831题库(多选题:1-20)
  • CCC数字钥匙设计【NFC】--通过NFC进行车主配对Phase3
  • 开源OA协同办公系统,集成Flowable流程引擎 可拖拽创建个性表单
  • 为什么嵌入通常优于TF-IDF:探索NLP的力量
  • oracle-AWR报告生成方法
  • 笙默考试管理系统-MyExamTest----codemirror(37)
  • 【Unity3D编辑器拓展】Unity3D的IMGUI、GUI、GUILayout、EditorGUI、EditorGUILayout、OnGUI【全面总结】
  • 11. 机器学习 - 评价指标2
  • Nginx的代理和负载均衡
  • Oracle发布支持Vscode的Java插件
  • 互联网Java工程师面试题·Java 总结篇·第九弹
  • SpringCloud学习笔记-gateway网关自定义全局过滤器
  • 数字图像处理实验记录四(图像的空间域增强-平滑处理)
  • 怎么使用LightPicture开源搭建图片管理系统并远程访问?【搭建私人图床】
  • pytorch_神经网络构建4
  • 外骨骼机器人和人形机器人概览
  • Java面试题:链表-反转链表
  • el-upload实现上传文件夹