暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

海量智库第30期 | 基于Antlr4的SQL解析器设计介绍

海量数据 2024-05-14
336

SQL作为一种4GL,开发人员不需要关心其具体如何实现的,只需要进行数据需求声明即可。而对于数据库管理系统或者数据库工具,开发人员则需要了解SQL背后的逻辑,通过编码实现。一般会将SQL语句输出转换成一个语法解析树,对语法解析树进行遍历,实现逻辑。

SQL Parser可以很好的完成SQL解析的任务,但也存在语法受限、对开发人员要求高、消耗大等问题。

因此,我们选择antlr4作为语法解析器的基础技术。本文将为您介绍本文将为您介绍基于antlr4的sql解析器设计



  antlr4工具介绍

antlr4是一款强大的语法分析器生成工具,它可以基于语法定义,自动化的生成编译器的前端(编译器的前端指词法分析、语法分析和语义分析三个阶段),将开发人员从复杂的编译理论中解放出来,集中精力处理业务逻辑。


术语解释:



  antlr4的总体设计

antlr4由三部分组成:


语法定义部分


编译器前端


语法解析业务逻辑

人工需要参与的是业务逻辑层的分析单元的代码编写,业务分析单元的输入和输出分别是SQL语句和统一抽象模型。



  antlr4的接口设计

01 DDL模型设计

1

公共组件设计

1.1 顶层结构设计

这里只列举了两种类型的SQL语句即DDL和DML,实际上所有的SQL语句如DCL,DAL都是SQLStatement的抽象。


1.2 Segment设计

设计说明:

  • Segment用于保存特定的对象信息,和数据库里对对象的定义类似;

  • 所有的Segment接口都继承自SQLSegment,每一种Segment都表示一种不同的功能,但是并没有直接定义方法声明。


1.3 TableSegment设计


1.4 ColumnSegment设计

设计说明:

  • ColumnDefinitionSegment实现了CreateDefinitionSegment,意义是表示这个类用于创建操作,而非修改操作。


1.5 ConstraintSegment设计


设计说明:

  • ConstraintDefinitionSegment是约束定义,实现了CreateDefinitionSegment和AlterDefinitionSegment,表示其既可用于创建时,也可用在修改时,典型的例子就是在建表和修改表时都可以用到。


1.6 基础信息类设计


2

Oracle DDL设计

2.1 CreateTableDDL模型设计

支持的SQL用BNF形式描述如下:

CREATE TABLE [ schema. ] table [relational_table];


relational_table::=

[ (relational_properties) ]


relational_properties::=

{ column_definition }

  [, {column_definition}

     | { out_of_line_constraint }

  ]...


column_definition::=

column [ datatype ] [ {inline_constraint }...]


inline_constraint::=

[ CONSTRAINT constraint_name ]

{ [ NOT ] NULL

| UNIQUE

| PRIMARY KEY

}


out_of_line_constraint::=

[ CONSTRAINT constraint_name ]

{ UNIQUE (column [, column ]...)

| PRIMARY KEY (column [, column ]...)

}


↑上下滑动查看更多↓


2.2 DropTableDDL模型设计

DropTableDDL的类图设计如下:

设计说明:

  • Oracle不支持批量Drop Table,在抽象类中的列表是为了兼容类似MySQL这种支持批量删除的数据库准备的。

支持的SQL用BNF形式描述如下:

DROP TABLE [ schema. ] table;



2.3 CreateIndexDDL模型设计

CreateIndexDDL类图设计如下:

支持的SQL用BNF形式描述如下:

CREATE INDEX [ schema. ] index_name

  ON { [schema.] table (column [, column]) };




2.4 DropIndexDDL模型设计

DropIndexDDL模型设计类图如下:

支持的SQL用BNF形式描述如下:

DROP INDEX [ schema. ] index ;



2.5 TruncateTableDDL模型设计

TruncateTableDDL模型类图设计如下:

设计说明:

  • Oracle不支持批量Truncate Table,此处使用List是为了支持其他的数据库。

支持的SQL用BNF形式描述如下:

TRUNCATE TABLE [schema.] table;



2.6 DropTriggerDDL类模型设计


支持的SQL用BNF形式描述如下:

DROP TRIGGER [ schema. ] trigger ;


通过了解Antlr4的设计,快速掌握Antlr4,让开发者简单、高效的进行SQL编译。

目前,海量数据在exBase的增量同步中也使用了Antlr4工具,帮助企业低成本的进行数据库迁移。


• END •


往期推荐


关于海量数据


北京海量数据技术股份有限公司(股票代码:603138.SH)成立于2007年,是国内首家以数据库为主营业务的主板上市企业。公司十余年来秉承“专注做好数据库”的初心,始终致力于数据库产品的研发、销售和服务。核心产品海量数据库Vastbase系列、数据库一体机Vastcube系列、海量大数据Datalink系列,全栈国产化,应用满足度高,目前广泛应用于政务、制造、金融、通信、能源、交通等多个重点行业,已成为国产企业级数据库的首选之一。



文章转载自海量数据,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论