大家好,欢迎来到IT知识分享网。
近期Datahub进行了一次大的版本更新,从0.9版本以后Datahub也正式发布了列级别数据血缘的功能。
0.9.1版本又增加了,列的影响分析这个功能。
这样Datahub对于列级别数据血缘的功能支撑就非常完善了。
目前Datahub支持列级别数据血缘的主要功能有。
1、建立列级别数据血缘的API 2、Snowflake和Looker,Tableau的列级别数据血缘实现 3、列级别数据血缘的可视化 4、列的影响分析
列级别的数据血缘非常的重要。主要是从“来”和“去”两个方向对于数据血缘进行分析。
1、理解列如何计算产生的
该列是否由敏感数据计算产生。
计算该列数据都进行了什么运算?
2、理解该列如何被使用
可否弃用该列,而不影响后续的指标计算。
该列用于了哪张图表?
与Atlas的展示不同,Datahub将列血缘和数据集血缘放在了一起展示,对于数据脉络的理解也更加的清晰。
另外Datahub也发布了未来一段时间的开发计划表,值得关注的有:2022年四季度 ,实现Bigquery和Redshift 的列级别数据血缘。2023年一季度,实现对Spark的支持。
这也让我们对Datahub的未来有了更多的期待,赶紧升级用起来吧!
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/65996.html