使用grabit分析mysql数据库中的数据血缘关系

Grabit 是一个辅助工具,用于从数据库、GitHub 等修订系统、bitbucket 和文件系统等各种来源收集 SQL 脚本和存储过程,然后将其推送到 SQLFlow 服务器进行分析并生成元数据和数据沿袭。

Grabit 官方获取地址:https://www.gudusoft.com/grabit/

1、Grabit 的主要用途

连接到数据库

从Oracle、SQL Server等数据库中提取创建表、创建视图和存储过程等SQL查询,并发送到SQLFlow进行分析。

连接到SQLFlow系统

从 Github、Bitbucket 等修订系统中获取 SQL 文件并发送到 SQLFlow 以获取数据沿袭。

搜索文件系统

在本地文件系统中找到 SQL 文件并推送它 SQLFlow 以可视化数据沿袭。

本文介绍如何使用grabit分析mysql数据库中的数据血缘关系。

2、如何配置grabit环境

运行grabit的环境需要配置Java 8及以上版本,并需要在系统变量中配置如下信息,部署时请主要java的更换安装路径:

export JAVA_HOME=/usr/lib/jvm/default-java

export PATH=$JAVA_HOME/bin:$PATH

运行grabit

以windows环境下为例,需要执行grbit安装目录下执行start.bat

3、如何连接到数据库

在grabit启动页面有Database、Github、Bitbucket、Single File等多种数据源提供方式,本文重点介绍使用database方式进行获取数据源,想了解其他方式,请参考https://github.com/sqlparser/sqlflow_public/tree/master/grabit

选择mysql数据库类型,然后点击next

点击next后来到数据库配置信息页面,其中前四项为必填项,后面的为选填项。关于选填项中各项具体信息请参阅https://github.com/sqlparser/sqlflow_public/tree/master/grabit获取更详细的介绍。

配置完上述信息后,点击【upload】即可上传至sqlflow服务器并生成相应的job,如下图

如您使用的是sqlflow的云版本,需要注册一个高级会员。

可以点击【save config】保存当前的配置文件,随后点击close关闭grabit。

4、使用sqlflow获取数据血缘关系分析结果

到sqlflow服务器上查看,您可以看到相应的job已经建立并能轻松获取自动分析的数据血缘关系,如下图:

至此,使用grabit分析mysql数据库中的血缘关系介绍完毕。

参考

马哈鱼数据血缘分析器: https://sqlflow.gudusoft.com

马哈鱼数据血缘分析器中文网站: https://www.sqlflow.cn