当前位置: 首页 > news >正文

字符串随机生成工具(开源)-Kimen(奇门)

        由于最近笔者在开发数据脱敏相关功能,其中一类脱敏需求为能够按照指定的格式随机生成一个字符串来代替原有信息,数据看起来格式需要与原数据相同,如:电话号码,身份证号以及邮箱等。在网上搜索了下,发现没有特别合适的开源工具,于是秉承着没有开源就自己写的宗旨。笔者开发了一个小的开源工具--Kimen(奇门)。这个工具可以按照给定的表达式随机生成字符串,简单易用。项目代码不多,但用到了些编程技巧,如:antlr的使用。但更多是对解决这个字符串随机生成问题的设计思考。如果感兴趣的朋友多的话,文章下留言,笔者将在后续整理出Kimen从构思到开发的过程。好了,闲话少叙,介绍Kimen(奇门)。

        KiMen(奇门)是一款基于表达式随机生成字符串的开源工具。可用于数据脱敏或系统测试时数据的仿真生成,还可用作随机密码生成的场景。其表达式借鉴了正则表达式的部分表示方式,如:

[a-zA-Z]{4}'1234'[a-zA-Z]{4}

        该表达式由三部分组成,分别是:[a-zA-Z]{4}、'1234'和[a-zA-Z]{4}。[a-zA-Z]{4}描述了一个可变字符串,该字符串长度为4,可用字符范围为'a'到'z'和'A'到'Z';'1234'描述了一个常量字符串,该字符串在进行字符串随机生成时保持不变。以下几个示例为由该表达式随机生成的字符串:

oOVj1234sCin
ygfj1234Zcdj
zpJM1234Zjmp
......

KiMen表达式

        Kimen表达式主要由两类任意多个基本的子表达式组成,格式如下:

(VariantStrExpr|ConstantStrExpr)+
VariantStrExpr

        表示可变字符串。Kimen将根据该表达式随机生成字符串。其格式如下:

'['charset']''{'min[,max]'}'

        [charset]中描述了进行字符串随机生成时可用的字符。可用字符集两端使用'[]'包围,其字符描述包括以下三种格式:

  1. 字符:如:[abcd],abcd四个字符间不需要任何分隔符。

  2. 字符区间:[0-9],0-9表示从数字0到数字9

  3. 字符字典:[\a],\a表示一个名字为a的字典,Kimen中所有的字符集字典都以一个字符命名。其可用的命名字符的范围没有限制,理论上你可以使用除[\|'|"]号外的任何一个字符为字典命名。字符字典主要用于可选字符范围较大,在表达式中展开不方便的情况。字符字典,可通过Kimen的开发接口进行注册,字符串生成器会动态装载字符字典。字符字典可以让Kimen表达式看起来更清爽一些。'\'字符为转义字符,当碰到该字符时表示,其后面的字符是字典名。需要额外注意的是,当需要在表达式中使用'\'字符时,需要用两个'\\'字符来表达。

        {min,max}中描述了可变字符串的长度,min表示随机生成字符串时的最小长度; max表示随机生成字符串时的最大长度,max可选。当只有min值时,表示按照固定长度生成字符串。

ConstantStrExpr

        表示常量字符串。常量字符串用于描述字符串随机生成时,信息相对固定的部分。其表达格式如下:

'str'|"str"

        如表达式所示,其有两种常量字符串格式:

        'str'使用[']号做为常量字符串的包围符,其内部可以是除[']号外的任意字符,当需要在常量字符串中使用'''字符时,可使用[\']或[''] (两个连续单引号)两种格式表达。

        "str"使用["]号做为常量字符串的包围符,其内部可以是除["]号外的任意字符,当需要在常量字符串中使用["]字符时,可使用[\"]表达。

KiMen代码示例

随机变长字符串示例
    // 随机字符串表达式String expr = "[a-zA-Z]{4}'1234'[a-zA-Z]{4,8}";KimenBuilder kimenBuilder = new KimenBuilder();// 构造字符串生成器StringGenerator stringGenerator = kimenBuilder.buildKimen(expr);// 循环输出生成的字符串for (int i = 0; i < 10; i++) {System.out.println(stringGenerator.generate());}

生成结果

SKDZ1234ODPC
NUvi1234dkYFvaJ
fAQJ1234KXJsbR
evZz1234ZUIvaLm
uHpi1234UPHlZH
AXQB1234KfUCwd
PuoR1234BeRBrR
NudR1234RSqoZM
SYpf1234wxEumY
slZK1234RPviU
字符字典示例
    // 随机字符串表达式String expr = "[a-zA-Z]{4}\"1234\"[\\a\\d]{4}";KimenBuilder kimenBuilder = new KimenBuilder();// 设置字符字典akimenBuilder.addCharSet('a',"bcd");// 设置字符字典dkimenBuilder.addCharSet('d',"123");// 构造字符串生成器StringGenerator stringGenerator = kimenBuilder.buildKimen(expr);// 循环输出生成的字符串for (int i = 0; i < 10; i++) {System.out.println(stringGenerator.generate());}

生成结果

rVQk1234dc33
HReP1234dcd1
dEyi12342dd2
hmaT1234322b
irsl12343dd2
vNDx1234c3dd
pfeW1234dbc1
rvlV1234211b
vEzz12341cc3
ndWD123412bd

Maven坐标

<dependency><groupId>org.datayoo.kimen</groupId><artifactId>kimen</artifactId><version>1.0.0</version>
</dependency>

http://www.lryc.cn/news/289887.html

相关文章:

  • UE4 CustomDepthMobile流程小记
  • Docker 基础篇
  • Idea上操作Git回退本地版本,怎么样保留已修改的文件,回退本地版本的四种方式代表什么?
  • vue3封装el-pagination分页组件
  • 负载均衡下Webshell连接思路及难点
  • 基于链表实现贪吃蛇游戏
  • Python网络爬虫实战——实验6:Python实现js逆向与加解密
  • 【python】使用aiohttp库编写一个简单的异步服务器
  • 新手使用代理IP接入代码教程
  • JVM问题排查手册
  • 前端canvas项目实战——简历制作网站(三)——右侧属性栏(线条宽度样式)
  • 字节跳动二面经典题目
  • 微搭低代码从入门到精通01应用介绍
  • 论文阅读《thanking frequency fordeepfake detection》
  • ArcgisForJs快速入门
  • 【解决方法】git pull报错ssh: connect to host github.com port 22: Connection timed out
  • 30天精通Nodejs--第三十天:项目实战-物联网应用
  • java 社区资源管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目
  • 网络编程套接字(Socket)
  • C语言第十一弹---函数(下)
  • Unity读书系列《Unity3D游戏开发》——拓展编辑器(一)
  • 【Git】项目管理笔记
  • 中文词性标注工具pkuseg例子(运行结果,不太好)
  • 获取URL参数:split方法、URLSearchParams方法示例
  • SparkSql---用户自定义函数UDFUDAF
  • 系统架构15 - 软件工程(3)
  • 两个近期的计算机领域国际学术会议(软件工程、计算机安全):欢迎投稿
  • (二十一)Flask之上下文管理第二篇(细细扣一遍源码)
  • Java项目:基于SSM框架实现的企业员工岗前培训管理系统(ssm+B/S架构+源码+数据库+毕业论文)
  • 深入了解Redis:选择适用于你的场景的持久化方案