数据治理何等重要?它在规范与处理间徘徊,贯穿于数据全生命周期

数据治理何等重要?它在规范与处理间徘徊,贯穿于数据全生命周期

201X年,当举国上下、各行各业在深化开展大数据理论研究和生产实践的过程中,也不知从何时开始,仿佛突然间出现了一个新的概念——这就是数据资产管理。


今天,尽管“数据是资产”概念已经广为人知,但“如何管理数据资产”仍然缺少成熟理论以及工具手段。

比如,什么是数据资产?当前企业数据存在哪些问题?

前者——数据资产是企业及组织拥有或控制,能带来未来经济利益的一切数据资源。与我们财务术语“固定资产相类似,电脑是资产、办公桌是资产、桌子椅子是资产……那么对应数据领域,其实报表是资产、文件是资产、接口是资产、权限视图也是资产……这些都属于数据资产的管理范畴;

后者——当前企业数据资产可能存在或多或少的问题,比如数据定义不统一,数据分配不透明、数据源不规范、数据不开放等;

我们参考本页示例,某企业当前系统情况:共有6个数据库。在线存储量800T,物理表数量37万+ ,每天新增9000张……

当前数据存在的问题:数据无数据字典和数据分类管理,很多表不知道含义(示例),导致技术元数据、业务元数据和管理元数据存在缺失。总结下来发现:

  • 数据信息无沉淀导致重复开发、数据冗余;

  • 数据自身矛盾,一致;

  • 数据清理困难;

  • 维护效率低;

这样的数据问题,带给相关人员的工作感受或许是

业务人员:仓库放了哪些数据,这些数据价值何在,都支撑哪些具体的应用不得而知。犹如“黑匣子”;

开发人员:仓库放了这么多数据,都有哪些数据?我要的数据在哪里?它们都有什么意思?犹如“大海捞针”;

运维人员:不同的运维人员负责不同的应用、数据表空间或者分区,只了解自己负责部分的数据,而仓库其他的数据基本不了解。只了解“冰山一角”;

规划人员:仓库放了哪些数据,它们都有多少?占多少存储?增长情况如何?

数据治理何等重要?它在规范与处理间徘徊,贯穿于数据全生命周期

我们以表的字段问题为例,这里也详细阐述了数据不规整所带来的负面影响,比如:存在ield1,field2类似的“错误”名称、太多预留字段,值多为空、同一个中文名但英文名不一样等……

总共规整下来发现有12个问题。这些问题都数据治理的范畴,统筹叫法就是数据资产管理

其实数据资产的概念早有涉及,只是早期企业IT系统不健全、数据规模不巨大,技术手段不太多的前提下,数据资产管理的问题并没有提升到一定高度。

数据治理何等重要?它在规范与处理间徘徊,贯穿于数据全生命周期

现在来看,伴随着大数据的持续普及发展,企业系统规模日趋复杂、数据量巨大、数据种类更多、数据形态更多样……这些实际现状致使我们必须正视数据治理这项工作的开展。所以:

  • 早期,设备是企业生产的重要资源,于是有了ERP……

  • 后来,客户成为企业生产的重要资源,于是就有了CRM……

  • 现在,数据成为企业运营的重要资源,同样需要有一个专业数据管理平台……

以数据为核心,实现数据处理与数据规范的有机融合,这就是引入数据治理的必要性,也是数据资产管理的核心。


权当抛砖引玉,以后找机会必当深入分享。


分享到:


相關文章: