既快又经济 按“人类思维”分析数据的秘方是什么?

现在,无论是政府还是企业,都希望通过数字化转型提升竞争力,数字化绕不开两个维度,应用和数据。

无疑,数据将成为改变传统的度量依据,流程的优化、产品的迭代、商业模式的创新,都将依据数据来驱动。

在应用的时候,从边缘到核心再到云中,比数据量更有趣的是数据分析的价值,面对爆发式增长的数据,企业需要实时的决策,实现高效管理。

据IDC统计,到2025年,实时数据占比将达到29%,为了实现数据实时分析,英特尔发布以数据为中心的全方位技术创新战略,开发、记录,传输,存储和处理数据的技术,让用户存储更多的数据,以最快的速度传输数据,并处理从云端到边缘的一切数据。

如何摆脱“有苦说不出”

在进出海关时,通过指纹识别的自动通道会让我们更加便捷,在公安领域,其实指纹比对既要高速还要精度,比如指纹系统从现场采集的原始指纹数据,经过预处理和特征提取之后,会形成结构化的点集,再将其与后台数据库中百万量级的指纹实例进行比对。

看似短时的过程,其实需要后台的逻辑判断分支,这样一来,解决方案的性能会严重依赖于内存资源的可用性,同时对通用计算内核的性能需求也非常高。

类似的场景会越来越多,如何设计高性价比的存储节点和计算节点、如何快速有效地进行软硬件适配、如何在云平台上达到对海量数据进行高效比对等问题。

说到底,AI时代需要创新存储架构实现海量数据的实时、智能处理。

从SSD诞生之初的SLC到MLC,再到TLC,即将来临的QLC,单位面积内存储的数据越来越多,容量越来越大。

但对于性能增益并不明显,比如目前市面主流的NVMe SSD的随机读性能大约在60万IOPS左右,当然有更高甚至突破百万IOPS,但并不常见,而未来结合3D NAND和QLC技术的SSD,读性能大致相当,但写性能还稍有下降。

当然,这里面也有接口带宽方面的因素。未来PCIe 4.0普及以后,可预见的是,更大容量的QLC SSD并不会比现有SSD性能更好,SSD的容量越来越大,但性能趋于稳定,与磁盘的发展路线类似了。

性能大致相当,相同价格条件上,难道不是容量越大越划算吗?从成本角度而言的确如此。

但从企业应用角度,尤其是非容量需求型应用角度,相同的性能容量更大,意味着单位容量的性能越低,即每GB容量能实现的IOPS降低。因此对于需要较高性能,但并不需要大容量存储的应用而言,有种“有苦说不出”的感觉。

纵观市面上主流的高性能SSD,通常容量都比较大,小容量高性能(比如50万IOPS为参考)的SSD几近于无。

代表全面创新的英特尔® 傲腾TM 数据中心级持久内存解决方案(以下简称Optane)就是一种专门用于数据中心使用的新型存储器和存储技术,可在DRAM和SSD之间实现大型持久存储器层,又快速还经济实惠。

按人类的思维分析数据

企业需要完整业务数据进行实时分析时,但“实时”其实是可以有数值的。

人类的“实时反应时间”诗几百毫秒,对于系统来说,用毫秒衡量思维速度,则提供数据的系统组件的时延,必须用纳秒度量,才能使组合时延接近人类思维的下限(550 毫秒)。

既快又经济 按“人类思维”分析数据的秘方是什么?

也就是说,数据保留在内存中并接近 CPU 将使时延保持在纳秒级。但是,在对存储发出请求之后,时延将从纳秒级变为毫秒级。

但英特尔希望按照人类思维的节奏呈现给用户分析数据,Optane就是将更多的数据移近处理器,根本上改变了可以经济高效方式放置在处理器附近的内存量,以便实时访问、处理和分析数据,而无需先从存储器检索数据,让客户洞察数据的时间有望不断缩小。

既快又经济 按“人类思维”分析数据的秘方是什么?

从技术上来看,Optane并不同于传统认知中的(NAND)SSD,相比于NAND SSD,其应该是SSD的另一技术分支。NAND SSD通过改变电子负荷来实现数据的存储,每次负荷的改变都意味着损耗,即SSD的PE次数,SSD的寿命问题是众所周知的,当然目前主流SSD内使用的均衡算法也能实现延缓寿命的效果。

与此同时,Optane单片SSD容量虽然只有375GB,却能提供超过50万IOPS的随机读写性能,读写性能均衡,这也是Optane相对于NAND SSD的一大区别,这也使得Optane比NAND SSD更适合写密集型应用场景,比如公安领域的指纹识别比对、石油、制造等行业场景。

而Optane则使用新型材料,更类似于PCM(Phase Change Memory,简称PCM)相变存储,从原理上就与NAND不同,天然具有更好的PE次数。

之前,E企研究院针对青云QingCloud基于MySQL开发的分布式数据库RadonDB中,以NAND SSD为数据库提供存储,对比Optane(同样单盘375GB)做缓存与NAND SSD做存储进行对比,测试结果同样表明,相比单纯使用NAND SSD做数据库存储,在OLTP模式下,加入Optane做缓存后,RadonDB数据库性能有4倍以上的性能提升,且平均响应时间为原来的四分之一以下。

既快又经济 按“人类思维”分析数据的秘方是什么?

在青云QingCloud分布式数据库环境中,在加入Optane做缓存后,2节点RadonDB数据库性能提升了4倍左右,三节点则提升到了原来的6倍,数据库平均响应时间也将为NAND SSD做数据存储下的四分之一和六分之一。

然而这仍非孤例,Intel实验室的数据显示,同样在数据库环境下,加入Optane做缓存后,数据库性能亦有3倍提升,与之相呼应的延迟也仅为原来的三分之一。

既快又经济 按“人类思维”分析数据的秘方是什么?

就基准测试数据来看,Optane与NAND SSD的性能并没有相差那么大,为何在应用场景下却有数倍的性能提升?

其实就是使用基准测试工具检验Optane与NAND SSD的读写性能时,其负载通常较为纯粹,如100%读或写压力。虽然同样为实验室环境,基于应用的测试更加接近真实的负载,读写IO模型要更为复杂,且会产生变化。这使得Optane能够将写性能和低延迟不断快速累积,进而获取与基准测试结果并不成比例的性能提升。

既快又经济 按“人类思维”分析数据的秘方是什么?

可以看出,在数据存储层面,英特尔正在使用Optane独特的存储器技术释放数据价值,让客户用更加经济的方式存储数据,而从边缘计算到核心的数据中心,从基础架构到云、到应用、从数据传输到为软件和算法提供动力,英特尔已经超越处理器市场,让数据更加有价值。


分享到:


相關文章: