移动集团的大数据指导意见是纲要和引领,但也制约了省公司的发展

移动集团的大数据指导意见是纲要和引领,但也制约了省公司的发展

随着人工智能、5G移动通信的科研与创新,新兴科技的技术关注度日益膨胀,而大数据作为上一个技术发展里程碑,也几乎随着时间的流逝埋没成历史。回顾通讯企业这几年的大数据发展,深究平台架构后得以呈现出什么样的能力?实际运用水平到底如何?为业务人员解决了哪些痛点?这可能是某些行业专家和学者所关注的重点问题。


早期大数据发展,不论是互联网BAT还是电信运营商都公开了其大数据平台架构,什么RDB、什么MPP、什么Hadoop这些已经听腻味了,因为有关于领域技术真的很广泛、各有所长、而且变化也快。但技术最终为业务服务,没必要一定要追求先进性,各个企业应根据自己的实际情况去选择自己的技术路径。所以说回来,大数据的混搭架构老生常谈,而技术混搭的前提往往也有三个必选条件。

  • 一是业务形态足够复杂多样,需要适应多种应用场景的总体布局;
  • 二是企业有充足的技术实力和人员成本控制,这个说白了就是企业规模;
  • 三是尽量不要模仿别人,有自己的发展主线的策略,混搭也有多种形态布局;

可是,在电信运营商的大数据产业布局里,总是无法剥离集团公司的管控,政治和机制问题暂且不谈,但这种模式确实可能会制约各省公司的独立发展与创新。关于大数据的平台建设,从早期集中化经分开始就已经指明方向,现在的省份平台建设基本要秉承经验且充分利用自研产品的资源优势。运营商参考集团公司的指导意见,明确了DW、MPP和Hadoop各自具有不同的资源特征和适用的应用场景,在混搭架构中是互补而非替代关系。各平台通过数据同步、任务协同、数据透明访问实现对企业大数据应用的最优支撑能力。关于技术术语的解释定义是这样的:

Hadoop:利用Hadoop技术实现企业级大数据平台中数据的并行ETL功能;实现清单等结构化数据、网络信令等非结构化数据的基础处理;提供海量数据的个性化应用环境,实现企业级大数据平台“沙盒”功能。

MPP:用于数据集市与数据挖掘,适用于多表联合复杂查询,面向个性化数据处理与服务支撑。

DW:用于企业级大数据平台的核心计算,面向企业级高性能数据处理,进行复杂汇总分析运算。

流处理:用于企业级大数据平台准实时、实时数据流的处理计算,面向企业级海量数据实时分析,实现实时营销等应用场景。

而右图也呈现出了架构的混搭、技术的并用理念。圈定了Hadoop适用于详单存储、互联网分析、日志查询等低SLA场景;MPP适用于交往圈分析、垃圾信息识别、数据探索等中SLA场景;DW适用于KPI/报表、营销应用等高SLA场景。

关于大数据的混搭架构已经谈了至少4个年头,但是怎么个混搭,如何混搭是否应该突破一下?举个例子,RDB有Oracle、Mysql、DB2、TD、GP、PSQL……等那么多产品;MPP有GBase、TD、GP等不同的选择,而作为Hadoop的生态组件更为纠结,一篮子计划颇不靠谱,但至少选择5个开源工具又不在话下。所以混搭技术的搭配组合是多元化的,再者,混搭不一定只是三个形态的产品混搭,而来有可能是4个、是5个、甚至也有可能缩减为2个,这才是关键。

与传统更多从技术角度来看待大数据平台架构的方式不同,我们要抛开旧习,更多的从业务的视角来看大数据架构,更多的要学会问为什么采用这个架构?到底能给业务带来多大价值?实践的最终结果是什么?换言之,大数据架构的发展未来绝不一定具有通用性,从一定程度讲,适合自己的架构才是最好的。当然,大数据平台的架构层次也没有什么行业级划分标准,这是因为应用的分类是横纵交错的。

大数据时代,大多数企业的架构必然向着分布式、可扩展及多元化发展,所谓合久必分,不再有一种技术能包打天下了,面多这么多技术组件,要采用一系列新的技术,让机遇和风险共生共存。对于大数据平台的商业版本,由于企业自身的发展太快,所以或许会存在服务跟不上的问题;对于开源版本,企业自身可能将面临运维和技术方面的挑战。所以要合理结合自身的业务形态、地域特性去开展自身的大数据平台研究和落地,这才是稳健发展的硬道理。


分析世界讲方案,为您带来精彩的一页;


分享到:


相關文章: