当前位置：首页 > news >正文

Druid手写核心实现案例实现一个简单Select 解析，包含Lexer、Parser、AstNode

news 2025/8/5 9:41:41

文章目录

前言
本章节源码
实现目标
一、实现词义类型定义 & 词法分析器扫描
- 定义Token类型枚举类：TokenType.java
- 定义词法单元：Token.java
- 词法分析器：Lexer.java
二、定义Ast node
- 介绍
- 抽象表达式：SQLExpr.java
- 标识符表达式：SQLIdentifierExpr.java
- 数字表达式：SQLNumberExpr.java
- 二元表达式：SQLBinaryExpr.java
- Table数据源：SQLTableSource.java
三、定义解析结构statement
- 3.1、Select解析结构：SelectStatement.java
四、实现Parser解析工具
- 解析器Paser.java
测试验证
总结
资料获取

前言

博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿里云平台优质作者、专注于Java后端技术领域。

涵盖技术内容：Java后端、大数据、算法、分布式微服务、中间件、前端、运维等。

博主所有博客文件目录索引：博客目录索引(持续更新)

CSDN搜索：长路

视频平台：b站-Coder长路

本章节源码

当前文档配套相关源码地址：

gitee：https://gitee.com/changluJava/demo-exer/tree/master/java-sqlparser/demo-druid/demo-diy-druid/diy-druid-simpledemo
github：https://github.com/changluya/Java-Demos/tree/master/java-sqlparser/demo-druid/demo-diy-druid/diy-druid-simpledemo

实现目标

初步实现一个最简单的select xxx from xxx的解析功能实现，包含一些基础简单定义的ast node，词法分析器 Lexer，语法分析器Parser。

toke定义（枚举类），ast node抽象（各个组件节点），词法分析器 Lexer（涉及到语法扫描）
语法分析器Parser 读取解析 -> statement

基础select 的 sql语法支持：

select id, name from table where age > 20;

主体流程：

Parser -> lexer扫描（借助Token类型） -> Token -> 构建ast node -> 构建得到statement

一、实现词义类型定义 & 词法分析器扫描

定义Token类型枚举类：TokenType.java

package com.changlu.enums;public enum TokenType {SELECT("select"),     // SELECT 关键字FROM("from"),       // FROM 关键字WHERE("where"),      // WHERE 关键字IDENTIFIER, // 标识符（如表名、列名，主要为字符串类型）NUMBER,     // 数字COMMA(","),      // 逗号GT(">"),         // 大于号 (>)LT("<"),         // 小于号 (<)EQ("="),         // 等于号 (=)EOF;         // 结束符public String value;TokenType() {}TokenType(String value) {this.value = value;}
}

定义词法单元：Token.java

package com.changlu.core;import com.changlu.enums.TokenType;/*** 词法分析器生成的每一个词法单元*/
public class Token {private final TokenType type; // Token类型private final String value; // Token值public Token(TokenType type, String value) {this.type = type;this.value = value;}public TokenType getType() {return type;}public String getValue() {return value;}@Overridepublic String toString() {return "Token{" +"type=" + type +", value='" + value + '\'' +'}';}
}

词法分析器：Lexer.java

package com.changlu.core.lexer;import com.changlu.core.Token;
import com.changlu.enums.TokenType;/*** 词法分析器扫描*/
public class Lexer {private final String input;private int pos = 0;public Lexer(String input) {this.input = input.trim();}// 获取下一个tokenpublic Token nextToken() {if (pos >= input.length()) {return new Token(TokenType.EOF, "");}// 若是空格符，直接跳过char ch = input.charAt(pos);if (Character.isWhitespace(ch)) {pos++;return nextToken();}// 若是字母，则读取标识符if (Character.isLetter(ch)) {return readIdentifier();}// 如果是数字，则读取数字if (Character.isDigit(ch)) {return readNumber();}if (ch == ',') {pos++;return new Token(TokenType.COMMA, TokenType.COMMA.value);}if (ch == '>') {pos++;return new Token(TokenType.GT, TokenType.GT.value);}if (ch == '<') {pos++;return new Token(TokenType.LT, TokenType.LT.value);}if (ch == '=') {pos++;return new Token(TokenType.EQ, TokenType.EQ.value);}if (ch == ';') {pos++;return new Token(TokenType.EOF, "");}throw new RuntimeException("Unexpected character: " + ch);}// 读取标识符public Token readIdentifier() {StringBuilder sb = new StringBuilder();// 读取一组字符 or 变量while (pos < input.length() && Character.isLetterOrDigit(input.charAt(pos))) {sb.append(input.charAt(pos));pos++;}String value = sb.toString();// select 场景if (value.equalsIgnoreCase(TokenType.SELECT.value)) {return new Token(TokenType.SELECT, value);}// from 场景if (value.equalsIgnoreCase(TokenType.FROM.value)) {return new Token(TokenType.FROM, value);}// where 场景if (value.equalsIgnoreCase(TokenType.WHERE.value)) {return new Token(TokenType.WHERE, value);}return new Token(TokenType.IDENTIFIER, value);}/*** 读取数字* @return 数字Token*/public Token readNumber() {StringBuilder sb = new StringBuilder();while (pos < input.length() && Character.isDigit(input.charAt(pos))) {sb.append(input.charAt(pos));pos++;}return new Token(TokenType.NUMBER, sb.toString());}}

二、定义Ast node

介绍

抽象类表达式：SQLExpr

SQLBinaryExpr：二元表达式
SQLIdentifierExpr：标识符表达式
SQLNumberExpr：数字表达式

Table数据源：SQLTableSource

抽象表达式：SQLExpr.java

package com.changlu.core.ast;public abstract class SQLExpr {
}

标识符表达式：SQLIdentifierExpr.java

package com.changlu.core.ast;// 标识符表达式
public class SQLIdentifierExpr extends SQLExpr{private final String name;public SQLIdentifierExpr(String name) {this.name = name;}public String getName() {return name;}@Overridepublic String toString() {return name;}
}

数字表达式：SQLNumberExpr.java

package com.changlu.core.ast;/*** 数字表达式*/
public class SQLNumberExpr extends SQLExpr{private final String value;public SQLNumberExpr(String value) {this.value = value;}public String getValue() {return value;}@Overridepublic String toString() {return value;}}

二元表达式：SQLBinaryExpr.java

package com.changlu.core.ast;import com.changlu.enums.TokenType;// 二元表达式
public class SQLBinaryExpr extends SQLExpr{private SQLExpr left;private final TokenType operator;private SQLExpr right;// 初始化public SQLBinaryExpr(SQLExpr left, TokenType operator, SQLExpr right) {this.left = left;this.operator = operator;this.right = right;}public SQLExpr getLeft() {return left;}public TokenType getOperator() {return operator;}public SQLExpr getRight() {return right;}@Overridepublic String toString() {return left + " " + operator.value + " " + right;}}

Table数据源：SQLTableSource.java

package com.changlu.core.ast;// 表示table数据源
public class SQLTableSource {private final String tableName;public SQLTableSource(String tableName) {this.tableName = tableName;}public String getTableName() {return tableName;}}

三、定义解析结构statement

目前当前需求是实现select的statement，这里基于二中的多个表达式组件来组成构成一个statement。

3.1、Select解析结构：SelectStatement.java

package com.changlu.core.ast.statement;import com.changlu.core.ast.SQLExpr;
import com.changlu.core.ast.SQLIdentifierExpr;
import com.changlu.core.ast.SQLTableSource;import java.util.List;public class SelectStatement {private List<SQLExpr> selectList; // select 列表private SQLTableSource from; // FROM子句private SQLExpr where; // WHERE子句public List<SQLExpr> getSelectList() {return selectList;}public void setSelectList(List<SQLExpr> selectList) {this.selectList = selectList;}public SQLTableSource getFrom() {return from;}public void setFrom(SQLTableSource from) {this.from = from;}public SQLExpr getWhere() {return where;}public void setWhere(SQLExpr where) {this.where = where;}@Overridepublic String toString() {return "SelectStatement{" +"selectList=" + selectList +", from=" + from +", where=" + where +'}';}
}

四、实现Parser解析工具

目标需求是这个Parser解析工具，能够借助lexer分析器来完成扫描Token，最终转为Statement的整个过程。

解析器Paser.java

package com.changlu.core.parser;import com.changlu.core.ast.*;
import com.changlu.core.ast.statement.SelectStatement;
import com.changlu.core.lexer.Lexer;
import com.changlu.core.Token;
import com.changlu.enums.TokenType;
import com.sun.org.apache.bcel.internal.generic.Select;import java.util.ArrayList;
import java.util.List;public class Parser {private final Lexer lexer;// 词法分析器private Token currentToken; // 当前Tokenpublic Parser(Lexer lexer) {this.lexer = lexer;// 获取当前第一个Token标识this.currentToken = lexer.nextToken();}/*** 解析整个select 语句* @return SelectStatement*/public SelectStatement parse() {// 初始化对象SelectStatement stmt = new SelectStatement();match(TokenType.SELECT); // 匹配 SELECT 关键字stmt.setSelectList(parseSelectList()); // 解析select列表match(TokenType.FROM);   // 匹配 FROM 关键字stmt.setFrom(parseTable()); // 解析表名// 针对于where情况可能不会出现if (currentToken.getType() == TokenType.WHERE) {match(TokenType.WHERE);stmt.setWhere(parseExpr());}return stmt;}// 解析select列表private List<SQLExpr> parseSelectList() {List<SQLExpr> selectList = new ArrayList<>();selectList.add(parseExpr()); // 解析得到第一个表达式while (currentToken.getType() == TokenType.COMMA) {match(TokenType.COMMA);selectList.add(parseExpr()); // 解析得到下一个表达式}return selectList;}// 解析表名private SQLTableSource parseTable() {String tableName = currentToken.getValue();match(TokenType.IDENTIFIER); // 匹配表名return new SQLTableSource(tableName);}// 解析表达式private SQLExpr parseExpr() {SQLExpr expr = parsePrimary(); // 解析基本表达式if (currentToken.getType() == TokenType.GT ||currentToken.getType() == TokenType.LT ||currentToken.getType() == TokenType.EQ) {TokenType operator = currentToken.getType();match(operator); // 匹配运算符SQLExpr right = parsePrimary(); // 解析右表达式expr = new SQLBinaryExpr(expr, operator, right);}return expr;}// 解析基本表达式private SQLExpr parsePrimary() {if (currentToken.getType() == TokenType.IDENTIFIER) {SQLExpr expr = new SQLIdentifierExpr(currentToken.getValue());match(TokenType.IDENTIFIER);return expr;}else if (currentToken.getType() == TokenType.NUMBER) {SQLExpr expr = new SQLNumberExpr(currentToken.getValue());match(TokenType.NUMBER);return expr;}else {// 用于提示当前错误的Token位置throw new RuntimeException("Unexpected token: " + currentToken);}}// 匹配当前的 Token 并移动到下一个Tokenprivate void match(TokenType excepted) {if (currentToken.getType() == excepted) {currentToken = lexer.nextToken();}else {throw new RuntimeException("Unexpected token: " + currentToken);}}}

测试验证

Main.java：

package com.changlu;import com.changlu.core.ast.SQLExpr;
import com.changlu.core.ast.statement.SelectStatement;
import com.changlu.core.lexer.Lexer;
import com.changlu.core.parser.Parser;public class Main {public static void main(String[] args) {String sql = "select id, name from table where age > 20;";Parser parser = new Parser(new Lexer(sql));SelectStatement stmt = parser.parse();// 根据解析得到的SelectStatement， 去打印描述信息System.out.println("SELECT List:");for (SQLExpr expr : stmt.getSelectList()) {System.out.println("- " + expr);}System.out.println("FROM Table: " + stmt.getFrom().getTableName());if (stmt.getWhere() != null) {System.out.println("WHERE Condition: " + stmt.getWhere());}}}