Apache Atlas是托管于Apache旗下的一款元数据管理和治理的产品,Apache Atlas提供api和一系列插件可以方便将数据库元数据信息导入到atlas中进行分析,atlas也提供web界面对元数据进行管理,通过atlas,企业可以对数据库元数据建立资产目录,并对这些资产进行分类和治理,为数据分析,数据治理提供高质量的元数据
为了增强可发现性和治理能力,Atlas 提供了一个业务分类界面,允许用户首先定义一组代表其业务域的业务术语,并将其与 Atlas 管理的元数据实体相关联。业务分类法是一种 Web 应用程序,目前是 Atlas Admin UI 的一部分,并且使用 REST API 与 Atlas 集成。 Type System Overview Atlas 允许用户为他们想要管理的元数据...
为了增强可发现性和治理能力,Atlas 提供了一个业务分类界面,允许用户首先定义一组代表其业务域的业务术语,并将其与 Atlas 管理的元数据实体相关联。业务分类法是一种 Web 应用程序,目前是 Atlas Admin UI 的一部分,并且使用 REST API 与 Atlas 集成。 Type System Overview Atlas 允许用户为他们想要管理的元数据...
Atlas is a scalable and extensible set of core foundational governance services – enabling enterprises to effectively and efficiently meet their compliance requirements withinHadoopand allows integration with the whole enterprise data ecosystem. 摘抄一段官网上的介绍,Atlas 是一个可伸缩且功能丰富的数据管理...
publicAtlasEntitygetEntity(Stringguid){// 获取元数据实体AtlasEntityentity=entityStore.getById(guid);returnentity;} 1. 2. 3. 4. 5. 以下是元数据实体的时序图,可以清晰地描述数据的处理过程: EntityStoreServerClientEntityStoreServerClient发送获取请求查询元数据返回实体数据返回响应 ...
.\apache-atlas-sources-2.1.0\distro\target\apache-atlas-2.1.0-bin\apache-atlas-2.1.0\bin 执行: 代码语言:javascript 代码运行次数:0 运行 AI代码解释 setMANAGE_LOCAL_HBASE=truesetMANAGE_LOCAL_SOLR=trueatlas_start.py 注意: 首先配置环境变量(MANAGE_LOCAL_HBASE、MANAGE_LOCAL_SOLR 让Atlas启动之前先...
五、Atlas使用 5.1 Atlas启动 bin/atlas_start.py 访问host:21000,账号和密码都是admin 5.2 初始化元数据 执行import-hive.sh脚本会自动把hive仓库里的表信息同步到Atlas,只需一次同步即可,后续hive sql操作Atlas会自动监听并记录下来。 cd hook-bin shimport-hive.sh ...
Apache Atlas Server Started - Source:Apache Atlas. Atlas might only take a minute or two to get ready. You can check the status by either visitinghttps://localhost:21000or running the following command: curl -u admin:admin http://localhost:21000/api/atlas/admin/version ...
Atlas 有专门的 shell 脚本可以直接运行读取 Hive 的表结构等元数据信息同步到 Atlas 的存储库中,自动生成元数据模型,同时 Atlas 提供的 HiveHook 可以监听 Hive 的数据变化,根据 Hive 执行的 sql 推断出数据与数据之间的关系,生成血缘关系图,如果我们想要分析其他数据存储介质的元数据和血缘关系,Atlas 的支持并不...
Atlas 是一套可伸缩且可扩展的数据治理服务,使企业能够有效和高效地满足其在 Hadoop 生态中的合规要求,并允许与整个企业数据生态系统集成。 Atlas 为组织提供开放的元数据管理和治理能力,以建立其数据资产目录、对这些资产进行分类和管理,并为数据科学家、分析师和数据治理团队提供围绕这些数据资产的协作能力。