Datahub安装教程

DataHub是由LinkedIn的数据团队开源的一款提供元数据搜索与发现的工具。目前SQLFlow已经具备集成Datahub的功能。有关如何集成SQLFlow到Datahub可以参考这篇博客

Datahub的安装十分简单,但在安装Datahub之前我们需要安装其他几个工具:

  • Python3
  • Docker

Python3

Python3的安装可参考这篇博客:https://www.geeksforgeeks.org/download-and-install-python-3-latest-version/

对于windows用户,安装Python3需要从官网下载Python3的release文件:https://www.python.org/downloads/

Docker

安装Datahub

有了Python3和docker之后我们就可以开始正式安装Datahub了。

使用如下指令安装Datahub:

python3 -m pip install --upgrade pip wheel setuptools
python3 -m pip install --upgrade acryl-datahub

安装完成后使用以下指令来检查Datahub是否成功安装

datahub version

如果安装成功,将会出现以下信息:

启动

datahub docker quickstart