APACHE-ATLAS-2.1.0简介(二)

news/2024/5/20 22:13:57

APACHE-ATLAS-2.1.0简介(一)

什么是元数据?

元数据(METADATA),用一句话定义就是:描述数据的数据。元数据打通了数据源、数据仓库、数据应用之间的壁垒,记录了数据从产生到消费的全过程。

ATLAS的问题列表

APACHE-ATLAS-STACKOVERFLOW

APACHE-ATLAS-2.1.0的版本依赖

Use Hadoop 3.1, Hive 3.1, HBase 2.0, Solr 7.5, Kafka 2.0, JanusGraph 0.5.1, Tinkerpop 3.4.6, Spring Framework 4.3.20

ATLAS的特性

(1). 元数据类型 & 实例

  • 内置各种Hadoop和非Hadoop元数据的预定义类型;
  • 能够为要管理的元数据自定义新类型;
  • 类型可以具有原始属性,复杂属性,对象引用,可以继承其他类型;
  • 类型(type)实例(称为实体entities)捕获元数据对象详细信息及其关系;
  • 提供可以更轻松地进行集成用于处理类型和实例的REST API;

(2). 分类

  • 能够动态创建分类 - 如PII,EXPIRES_ON,DATA_QUALITY,SENSITIVE;
  • 分类可以包含属性 - 例如EXPIRES_ON分类中的expiry_date属性;
  • 实体(entities)可以与多个分类(classifications)相关联,从而实现更轻松的发现和安全实施;
  • 通过血缘传播分类 - 自动确保分类在进行各种处理时遵循数据;

(3). 血缘

  • 直观的UI,用于在数据流转时,通过各种流程时查看数据;
  • 提供用于访问和更新血缘的REST API;

(4). 搜索/发现

  • 直观的UI,按类型(type),分类(classification),属性值(attribute)或自由文本搜索实体;
  • 提供丰富的REST API,可按复杂条件进行搜索;
  • SQL搜索实体的查询语言 - 域特定语言(DSL);

(5). 安全和数据屏蔽

  • 用于元数据访问的细粒度安全性,实现对实体实例的访问控制以及添加/更新/删除分类等操作;
  • 与APACHE RANGER集成可根据与APACHE ATLAS中的实体相关的分类对数据访问进行授权/数据屏蔽,如:
    – 谁可以访问分类为PII,SENSITIVE的数据;
    – 客户服务用户只能看到分类为NATIONAL_ID的列的最后4位数字;

ATLAS分类传播

分类传播,使得数据所关联的分类能够沿着血缘关系,从父类传递给子类。

  • 当给实体数据打上分类标签后,该实体数据的子也可以得到该分类标签;
  • 当更新实体数据上的分类标签后,该实体数据的子也会对应的修改这个分类标签;
  • 当删除实体数据上的分类标签后,该实体数据的子也会对应的删除这个分类标签;
  • 当父实体数据删除时,子类所得到的这个父类的所有分类标签也会被删除;
  • 当子类到父类之间的血缘关系被破坏时,子类也会失去父类的分类标签;
  • 虽然子类到父类之间的一条血缘链中断,但是只要还有另一条血缘链存在,且使得子类可以连接到父类,那么子类就能够保存从其父类继承来的分类标签。

ATLAS模块概述

在这里插入图片描述


http://wed.xjx100/news/212712.html

相关文章

Ubuntu关机、重启和注销命令

学习linux系统,最重要的是使用各种命令对系统进行操作,打开各种软件,本次主要分析ubuntu中的关机,重启,注销命令的使用详解。 关机命令 shutdown 1)使用shutdown --help可以查看shutdown命令如何使用,当然也…

Ubuntu GitLab服务器git-data中tmp_pack_xxx文件占满磁盘

Ubuntu GitLab服务器git-data中tmp_pack_xxx文件占满磁盘 目录 Ubuntu GitLab服务器git-data中tmp_pack_xxx文件占满磁盘一、问题发现二、查找原因三、解决方法 服务器版本: cat /proc/version:Linux version 4.15.0-142-generic (builddlgw01-amd64-039…

用数据讲故事:十大统计学/机器学习魔法指数

统计学和机器学习为数据分析提供理论基础,入门时我看过很多统计学相关书籍,复杂的公式和推导过程让我一度陷入迷茫。对于数据科学/分析师来说,如何使用统计学知识并应用到我们的分析场景中更为重要。本文主要基于数据分析工作中的实际应用场景…

学习Java,可以从事哪些岗位?

不难发现,在互联网的影响下,这几年,中国的互联网行业进入了高速发展的阶段,同时IT行业,也成为了热门,备受追捧和关注的行业。在全球云计算和移动互联网的产业环境下,Java工程师为何会如此火爆&a…

SSM_jsp游戏-账-号-装-备虚拟物品交易系统

开发语言:Java 框架:ssm 前端框架:jsp/Bootstrap JDK版本:JDK1.8 服务器:tomcat8 数据库工具:Navicat 开发软件:idea 支持eclipse 游戏账号交易系统主要是为了提高工作人员的工作效率和更方便快捷的满足用户…

要做存储业务,我解析了一个项目的源码

最近在做存储相关的业务,更具体的来说是存储相关的研发,于是就上网查了一下相关的资料,思虑再三打算从最简单的 Json 数据交换格式开始研究。 JSON是独立于编程语言的数据交换格式,几乎所有与网络开发相关的语言都有JSON函数库&am…

小白畅玩免费支持ChatGPT3和4,一键定制自己专属AI

AI爆炸时代。你不用AI,别人就会用AI,当别人用AI,为自己给工作生活赋能时候。生活自在,工作高效,AI正在潜移默化改变我们生活 基于OPEN AI平台 轻松让AI 为你的生活赋能. 总之我现在生活已经离不开AI,帮助了。 不管是工作上问题…

第十二章 Productions最佳实践 - 命名约定

文章目录 第十二章 Productions最佳实践 - 命名约定命名约定业务服务路由进程路由规则集业务操作数据转换 自定义架构类别 第十二章 Productions最佳实践 - 命名约定 命名约定 本主题解释命名约定的重要性并提供示例。 通常,将逐步开发产品,一次开发一…