大数据之元数据管理

大数据
后台-插件-广告管理-内容页头部广告(手机)

今天和大家聊一下大数据方面的元数据管理的部分内容,在大数据领域,尤其是在数据治理这个方向,元数据的管理规划就显的特别重要。下面和大家一块聊聊这方面的内容。涉及元数据起源,概念,分类,元数据管理步骤,以及在数据治理方面的应用体系。

1、元数据起源。

元数据,英文名叫meta,起源于1968年,用来表明更加抽象的事。元数据,在历史上被称为图书馆目录信息。我们可以把公司的数据可以看作图书馆的书籍,管理公司数据就是管理一个大的图书馆。试想图书馆是如何管理的。管理员通过书籍分类区域,书名,简介,作者,出版社,出版时间等信息,对书籍进行排序归类;新增书籍,减少书籍,借书还书,均需要记录,以保证书籍易查找,不会丢失。管理企业数据就和这个过程一样,我们首先的有数据的目录,对数据进行定义,分类等管理,方便后续的查找。看到这里是不是大家对元数据就理解了呢?

2、元数据的概念和定义

元数据,官方定义,是关于数据的组织,数据域及其关系的信息。简单来说,元数据是对潜在信息的信息,是关于数据的更高层次抽象,是对数据的描述。比如我们通过简历了解一个人,需要用姓名,性别,民族, 年龄,身份证号,职业等方向来描述一个人。姓名,性别,民族这些,就是描述一个人的元数据。如果没有这些元数据,我们就无法了解区分这个人。如果没有数据的类型,名称,数据关系这些元数据管理,那么数据无法被组织有效准确理解分析,数据价值无法发挥,数据反而变成组织的数据负债。从这个定义来看,我们就应该理解什么是元数据了吧。

3、元数据的分类

通常把元数据分为3类,分别是业务元数据,操作元数据,技术元数据。

(1)业务元数据

业务元数据,指的是描述业务含义,业务规则等,让人更好理解和使用的元数据,为后续的数据分析和应用提供支撑。

常见的业务元数据有:

  • 术语名称,定义,缩写,计算口径
  • 数据概念模型和逻辑模型
  • 数据血缘和影响分析
  • 数据的安全或敏感级别
  • 业务规则引擎的规则,数据质量检测规则,数据挖掘算法

(2)技术元数据

技术元数据,指的是对数据结构化,方便数据库对数据进行识别,存储,传输和交换的元数据。

技术元数据,可以帮助开发人员明确数据存储和结构,为应用开发奠定基础,也可以让业务人员,快速了解数据的来龙去脉,支持数据血缘追溯和影响分析。

常见的技术元数据有:

  • 物理数据库名称,列名称,列属性,备注,约束信息等
  • 数据存储类型,位置,数据存储文件格式或数据压缩类型等
  • 数据访问权限,组和角色
  • 字段级血缘关系,ETL抽取加载转换信息
  • 调度依赖关系,进度和数据更新频率

(3)操作元数据

操作元数据,是描述数据的操作管理属性,它可以明确数据管理的部门,责任人,使用者,数据责任明晰,为数据安全管理奠定了基础。

常见的操作元数据有:

  • 数据所有者,使用者
  • 数据访问方式,访问时间,访问限制
  • 数据访问权限,组和角色
  • 数据处理作业的结果,系统执行日志
  • 数据备份,归档人,归档时间
后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。