APP推广合作
联系“鸟哥笔记小乔”
元数据是什么?怎么管?
2021-08-13

编 辑:彭文华

01 元数据怎么管? 

元数据怎么管?对于一个没接触过的人来说,简直是一个噩梦。因为理解元数据已经很艰难了,更别说管理元数据。而且身在大厂的小羊羊,很有可能在做元数据管理系统。


在这个时候,最先要做的,其实要做三件事情:


1、彻底弄清楚什么是元数据,什么是元数据管理;

2、查清楚是否有相关标准,用专家的智慧当做指导,防止自己跑偏了;


3、找到业内样例,作为对(chao)标(zuo)参(ye)考(de)


我们今天就按照这个逻辑一一说清楚。

02 什么是元数据?什么是元数据管理?

鉴于我在之前用人话解释过什么是元数据,元数据的种类有哪些,这里就不再赘述了。所以这次就引用一下权威


元数据,就是“关于数据的数据”。

它描述了数据本身(例如,数据库,数据元素,数据模型),数据表示的概念(例如,业务流程,应用程序系统,软件代码,技术基础结构)以及数据和概念之间的连接(关系)。

元数据可帮助我们了解数据、系统和业务流程,有助于处理、维护、集成、保护、审核和管理其他数据。

 --来自于:DMBOK-元数据管理


那元数据怎么管理呢?管理肯定要先分类。元数据可以分为业务元数据、技术元数据和操作元数据。当然,还有一个有争议的管理元数据。权威说明在这里哈:


元数据是什么?怎么管?


分类之后呢?那就简单了,梳理目录、ID、命名、属性等内容,设计注册、启停用、版本等基础功能,剩下的就是做增删改查了。


元数据是什么?怎么管?

03 元数据管理标准

不过,为了防止我们刚才想的不够全面,还是得找一个标准参考一下。这边都准备好了:


《GB_T 18391.1-2009 信息技术 元数据注册系统(MDR)》


这里面还给出了元数据注册系统的总体模型,分为概念层和表示层,具体如下:


元数据是什么?怎么管?


简单理解,就是我们需要在概念层(这个元数据是什么?)阐述清楚,然后再写清楚这个概念的具体值(这个元数据有什么?),这才构成了一个完整的元数据。


举个例子:


概念:长度计量单位

 

值域:千米、米、分米、厘米、毫米、微米、纳米。


另外,一个元数据实体肯定还有其他的各种属性,比如名称、类型、精度、含义、版本、归口单位、分类、状态等等。


元数据是什么?怎么管?


在标准里,元数据属性都罗列了几十个,我们在实际工作中用不到这么多。

 

单是元数据生命周期的状态,标准中就定义了首选、标准、合格、已记录、候选、未完成、失效、被替代、历史、应用这么多。


在做系统的时候,我们只需根据实际情况进行选择即可。

04 业内案例-快手元数据管理 

概念弄清楚了,标准也有了,接下来的任务就是参(chao)考(ta)一(zuo)下(ye)了


我手上正好有一个行业案例《快手元数据平台化建设及应用场景》,你看看这写的:多么诱人啊?


元数据是什么?怎么管?


不要太爽了!我给你截图自己看:


元数据是什么?怎么管?


从上图可以看出,他们主要抽象出了实体、属性和关系以及唯一ID四部分内容。


元数据是什么?怎么管?


快手把主数据分为四类:基础、安全、资产和衍生元数据。


元数据是什么?怎么管?


他们直接从大数据组件、各个管理系统和数据平台中自动接入元数据,然后进行解析、同步,并转换成标准定义,把基础信息存入关系型数据库,把关系存到图数据库,并提供查询和分析服务。


最后,还基于这些元数据做了一系列的数据应用,什么数据地图、指标模型管理、资产管理等。


元数据是什么?怎么管?


这里还给出了几个元数据应用的例子:


元数据是什么?怎么管?


比如上面这个找数的应用。当我们的表和字段多到一定程度,找到合适的数就变得非常非常困难了。因为会有大量的类似的表和字段充斥在数据库里,你根本无法确定应该用哪个。


但是如果有元数据就好办多了,你只需要确定好概念,后面一系列的库、表、字段,就自然会带出来了。


老彭我只能帮你到这里了。

-END-

大数据架构师
分享到朋友圈
收藏
收藏
评分
评论

综合评分:

我的评分

参与评论(0)

评论规则

暂无评论,快来抢沙发吧~
登录后参与评论
发布评论

鸟哥笔记限定畅饮吸管杯600ml
超大容量,让你爱上喝水
2000羽毛
立即兑换
【新品】办公/外出两用静音充电小电扇
办公桌必备小电扇!
2000羽毛
立即兑换
超级nice便签砖
超级超级超级奈斯!
1000羽毛
立即兑换
大数据架构师
大数据架构师
历任多家公司大数据总监、大数据架构师,专注于数字化转型领域。
确认要消耗 0羽毛购买
元数据是什么?怎么管?吗?
考虑一下
很遗憾,羽毛不足
我知道了

为了促进广大用户对鸟哥笔记网站的干货文章做出更加客观、真实、优质的评论,为其他读者在学习干货时提供参考,特地制定本评论规则。

一、什么样的评论内容会被通过

15字以上的、基于文章内容的优质评论。

二、什么样的评论内容不会被通过

1、15字以下的评论;
2、“已阅”,“1”,“11”,”666”,“学习”,“学习了”等明显划水的内容;
3、重复评论,即在多篇文章下面发布同样的内容;
4、带广告性质的内容(含网址、电话、微信等);
5、评论内容与本文无关的;
6、带诋毁,辱骂,色情,赌博、暴力等不符合社会主义核心价值观的内容,及一切法律法规不允许的内容。

最后,你的评论在审核通过的同时,还可以获得5羽毛的奖励,羽毛可在 "羽毛精选" 兑换各类小礼品哦~

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接