DataHub是由LinkedIn的数据团队开源的一款提供元数据搜索与发现的工具。目前SQLFlow已经具备集成Datahub的功能。有关如何集成SQLFlow到Datahub可以参考这篇博客。
Datahub的安装十分简单,但在安装Datahub之前我们需要安装其他几个工具:
- Python3
- Docker
Python3
Python3的安装可参考这篇博客:https://www.geeksforgeeks.org/download-and-install-python-3-latest-version/
对于windows用户,安装Python3需要从官网下载Python3的release文件:https://www.python.org/downloads/

Docker
- Windows 或者 Mac系统的用户可以安装 Docker Desktop.
- 如果是Linux用户,需要安装 Docker for Linux 和 Docker Compose.


安装Datahub
有了Python3和docker之后我们就可以开始正式安装Datahub了。
使用如下指令安装Datahub:
python3 -m pip install --upgrade pip wheel setuptools
python3 -m pip install --upgrade acryl-datahub

安装完成后使用以下指令来检查Datahub是否成功安装
datahub version
如果安装成功,将会出现以下信息:

启动
datahub docker quickstart