02.17 深度解析大數據處理系統關鍵層次架構

2019-02-17 15:26:33 程序之道1

在數據存儲層，還有很多類似的系統和某些系統的變種，這裡，僅僅列出較為出名的幾個。

一、數據存儲層

寬泛地講，據對一致性(consistency)要求的強弱不同，分佈式數據存儲策略，可分為ACID和BASE兩大陣營。

ACID是指數據庫事務具有的四個特性：原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)。ACID中的一致性要求比較強，事務執行的結果必須是使數據庫從一個一致性狀態變到另一個一致性狀態。

BASE對一致性要求較弱，它的三個特徵分別是：基本可用(Basically Available), 軟狀態/柔性事務(Soft-state，即狀態可以有一段時間的不同步), 最終一致性(Eventual consistency)。BASE還進一步細分基於鍵值的，基於文檔的和基於列和圖形的 – 細分的依據取決於底層架構和所支持的數據結構(注：BASE完全不同於ACID模型，它以犧牲強一致性，獲得基本可用性和柔性可靠性，並要求達到最終一致性)。在數據存儲層，還有很多類似的系統和某些系統的變種，這裡，我僅僅列出較為出名的幾個。如漏掉某些重要系統，還請諒解。

1、BASE

(1)鍵值存儲(Key Value Stores)

Dynamo：這是由亞馬遜工程師們設計的基於鍵值的高可用的分佈式存儲系統(注：Dynamo放棄了數據建模的能力，所有的數據對象採用最簡單的Key-value模型存儲，可簡單地將Dynamo理解為一個巨大的Map。Dynamo是犧牲了部分一致性，來換取整個系統的高可用性)。

Cassandra：這是由Facebook工程師設計的一個離散的分佈式結構化存儲系統，受亞馬遜的Dynamo啟發，Cassandra採用的是面向多維的鍵值或面向列的數據存儲格式(注：Cassandra可用來管理分佈在大量廉價服務器上的巨量結構化數據，並同時提供沒有單點故障的高可用服務)。

Voldemort：這又是一個受亞馬遜的Dynamo啟發的分佈式存儲作品，由全球最大的職業社交網站LinkedIn的工程師們開發而成。

(2)面向列的存儲(Column Oriented Stores)

BigTable：Bigtable是一個基於Google文件系統的分佈式數據存儲系統，是為谷歌打拼天下的“三駕馬車”之一，另外兩駕馬車分別是分佈式鎖服務系統Chubby和下文將提到的MapReduce。

HBase：Hbase是一個分佈式的、面向列的開源數據庫。其設計理念源自谷歌的 BigTable，用Java語言編寫而成。

Hypertable：Hypertable也是一個開源、高性能、可伸縮的數據庫，它採用與Google的Bigtable類似的模型。

(3)面向文檔的存儲(Document Oriented Stores)

CouchDB：這是一款面向文檔的、開源數據存儲管理系統。

MongoDB：是目前非常流行的一種非關係型(NoSQL)數據庫。

(4)面向圖(Graph)的存儲

Neo4j：Neo4j是一款目前最為流行的高性能NoSQL 圖數據庫，它使用圖來描述數據模型，把數據保存為圖中的節點以及節點之間的關係。這是最流行的圖數據庫。

Titan：Titan是一款Apache許可證框架下的分佈式的開源圖數據庫，特別為存儲和處理大規模圖而做了大量優化。

2、ACID

Megastore：這是一個構建於BigTable之上的、高可用的分佈式存儲系統。

Spanner：這是由谷歌研發的、可擴展的、全球分佈式的、同步複製數據庫，支持SQL查詢訪問。

MESA：亦是由谷歌研發的、跨地域複製(geo-replicated)、高可用的、可容錯的、可擴展的近實時數據倉庫系統。

CockroachDB：該系統是由Google前工程師Spencer Kimball領導開發的Spanner 的開源版本。

二、資源管理器層(Resource Managers)

第一代Hadoop的生態系統，其資源管理是以整體單一的調度器起家的，其代表作品為YARN。而當前的調度器則是朝著分層調度的方向演進(Mesos則是這個方向的代表作)，這種分層的調度方式，可以管理不同類型的計算工作負載，從而可獲取更高的資源利用率和調度效率。

YARN：這是新一代的MapReduce計算框架，簡稱MRv2，它是在第一代MapReduce的基礎上演變而來的(注：MRv2的設計初衷是，為了解決第一代Hadoop系統擴展性差、不支持多計算框架等問題。

Mesos：這是一個開源的計算框架，可對多集群中的資源做彈性管理。

這些計算框架和調度器之間是鬆散耦合的，調度器的主要功能就是基於一定的調度策略和調度配置，完成作業調度，以達到工作負載均衡，使有限的資源有較高的利用率。

三、調度器(Schedulers)

(1)作業調度器，通常以插件的方式加載於計算框架之上，常見的作業調度器有4種：

計算能力調度器

公平調度器

延遲調度

公平與能力調度器

(2)協調器(Coordination)

在分佈式數據系統中，協調器主要用於協調服務和進行狀態管理。

Paxos：Google的Chubby和Apache的Zookeeper，都是用Paxos作為其理論基礎實現的。

Chubby：本質上就是前文提到的Paxos的一個實現版本，主要用於谷歌分佈式鎖服務。

Zookeeper：這是Apache Hadoop框架下的Chubby開源版本。它不僅僅提供簡單地上鎖服務，而事實上，它還是一個通用的分佈式協調器，其設計靈感來自谷歌的Chubby。

四、計算框架(Computational Frameworks)

(0)運行時計算框架

可為不同種類的計算，提供運行時(runtime)環境。最常用的是運行時計算框架是Spark和Flink。

Spark：Spark是一個基於內存計算的開源的集群計算系統，其目的在於，讓數據分析更加快速。Spark是由加州大學伯克利分校的AMP實驗室採用Scala語言開發而成。Spark的內存計算框架，適合各種迭代算法和交互式數據分析，能夠提升大數據處理的實時性和準確性，現已逐漸獲得很多企業的支持，如阿里巴巴、百度、網易、英特爾等公司均是其用戶。

Flink：這是一個非常類似於Spark的計算框架，但在迭代式數據處理上，比Spark更給力(注：目前大數據分析引擎Flink，已升級成為Apache頂級項目)。

Spark和Flink都屬於基礎性的大數據處理引擎。具體的計算框架，大體上，可根據採用的模型及延遲的處理不同，來進行分門別類。

(1)批處理(Batch)

MapReduce

(2)迭代式(BSP)

Pregel：Pregel是一種面向圖算法的分佈式編程框架，其採用的是迭代式的計算模型。它被稱之為Google後Hadoop時代的新“三駕馬車”之一。另外兩駕馬車分別是：“交互式”大數據分析系統Dremel和網絡搜索引擎Caffeine。

Giraph：該系統建模於谷歌的Pregel，可視為Pregel的開源版本，它是一個基於 Hadoop架構的、可擴展的分佈式迭代圖處理系統。

GraphX：這是一個同時採用圖並行計算和數據並行的計算框架，GraphX最先是加州大學伯克利分校AMPLab實驗室的一個分佈式圖計算框架項目，後來整合到Spark中，成為其中的一個核心組件。GraphX最大的貢獻在於，在Spark之上提供一棧式數據解決方案，可方便高效地完成圖計算的一整套流水作業。

Hama：是一個構建Hadoop之上的基於BSP模型的分佈式計算引擎，Hama的運行環境需要關聯 Zookeeper、HBase、HDFS 組件。Hama中最關鍵的技術，就是採用了BSP模型(Bulk Synchronous Parallel，即整體同步並行計算模型，又名大同步模型)。

(3)流式(Streaming)

Storm：Storm有時也被人們稱為實時處理領域的Hadoop，它大大簡化了面向龐大規模數據流的處理機制，從而在實時處理領域扮演著重要角色。

Samza：這是一款由Linkedin公司開發的分佈式的流式數據處理框架(注：所謂流式數據，是指要在處理單位內得到的數據，這種方式更注重於實時性，流式數據有時也稱為快數據)。

Spark流：Spark Streaming是Spark 核心API的一個擴展，它並不會像Storm那樣逐個處理數據流，而是在處理前，按時間間隔預先將其切分為很多小段的批處理作業。

(4)交互式(Interactive)

Dremel該論文是多個基於Hadoop的開源SQL系統的理論基礎。

Impala：這是一個大規模並行處理(MPP)式 SQL 大數據分析引擎，Impala像Dremel一樣，其借鑑了MPP(Massively Parallel Processing，大規模並行處理)並行數據庫的思想，拋棄了MapReduce這個不太適合做SQL查詢的範式，從而讓Hadoop支持處理交互式的工作負載。

Drill：這是谷歌 Dremel的開源版本，Drill是一個低延遲的、能對海量數據(包括結構化、半結構化及嵌套數據)實施交互式查詢的分佈式數據引擎。

Shark：Shark即“Hive on Spark”的含義，本質上是通過Hive的HQL解析，把HQL翻譯成Spark上的RDD操作。然後通過Hive的元數據獲，取數據庫裡的表信息。HDFS上的數據和文件，最後會由Shark獲取，並放到Spark上運算。Shark基於 Scala語言的算子推導，可實現良好的容錯機制，對執行失敗的長/短任務，均能從上一個“快照點(Snapshot)”進行快速恢復。

Dryad：Dryad是一個通用的粗顆粒度的分佈式計算和資源調度引擎，其核心特性之一，就是允許用戶自己構建DAG調度拓撲圖。

Tez：其核心思想來源於Dryad，可視為利用Yarn(即MRv2)對Dryad的開源實現。Apache Tez是基於Hadoop Yarn之上的DAG計算框架。

BlinkDB：可在抽樣數據上實現交互式查詢，其呈現出的查詢結果，附帶有誤差標識。BlinkDB 是一個用於在海量數據上運行交互式 SQL 查詢的大規模並行查詢引擎。BlinkDB允許用戶通過適當降低數據精度，對數據進行先採樣後計算，其通過其獨特的優化技術，實現了比Hive快百倍的交互式查詢速度，而查詢進度誤差僅降低2~10%。

(5)實時系統(RealTime)

Druid：這是一個開源的分佈式實時數據分析和存儲系統，旨在快速處理大規模的數據，並能做到快速查詢和分析。

Pinot：這是由LinkedIn公司出品的一個開源的、實時分佈式的 OLAP數據分析存儲系統，非常類似於前面提到的Druid，LinkedIn 使用它實現低延遲可伸縮的實時分析。

五、數據分析層(Data Analysis)

數據分析層中的工具，涵蓋範圍很廣，從諸如SQL的聲明式編程語言，到諸如Pig的過程化編程語言，均有涉及。另一方面，數據分析層中的庫也很豐富，可支持常見的數據挖掘和機器學習算法，這些類庫可拿來即用，甚是方便。

(1)工具(Tools)

Pig：Pig Latin原是一種兒童黑話，屬於是一種英語語言遊戲，形式是在英語上加上一點規則使發音改變，讓大人們聽不懂，從而完成孩子們獨懂的交流。雅虎的工程師們於2008年發表在SIGMOD的一篇論文，論文的題目是“Pig Latin：並不是太老外的一種數據語言”，言外之意，他們發明了一種數據處理的“黑話”——Pig Latin，一開始你可能不懂，等你熟悉了，就會發現這種數據查詢語言的樂趣所在。

Hive：Hive是一個建立於 Hadoop 上的數據倉庫基礎構架。它用來進行數據的提取、轉化和加載(即Extract-Transform-Load ，ETL)，它是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。

Phoenix：它是 HBase 的 SQL 驅動，Phoenix可將 SQL 查詢轉成 HBase 的掃描及相應的動作。

(2)庫(Libraires)

MLlib：這是在Spark計算框架中對常用的機器學習算法的實現庫，該庫還包括相關的測試和數據生成器。

SparkR：這是AMPLab發佈的一個R開發包，為Apache Spark提供輕量級的前端。

Mahout：這是一個功能強大的數據挖掘工具，是一個基於傳統Map Reduce的分佈式機器學習框架，Mahout的中文含義就是“馭象之人”，而Hadoop的Logo正是一頭小黃象。很明顯，這個庫是幫助用戶用好Hadoop這頭難用的大象。

六、數據集成層(Data Integration)

數據集成框架提供了良好的機制，以協助高效地攝取和輸出大數據系統之間的數據。從業務流程線到元數據框架，數據集成層皆有涵蓋，從而提供全方位的數據在整個生命週期的管理和治理。

(1)攝入/消息傳遞(Ingest/Messaging)

Flume：這是Apache旗下的一個分佈式的、高可靠的、高可用的服務框架，可協助從分散式或集中式數據源採集、聚合和傳輸海量日誌。

Sqoop：該系統主要用來在Hadoop和關係數據庫中傳遞數據，Sqoop目前已成為Apache的頂級項目之一。

Kafka：這是由LinkedIn開發的一個分佈式消息系統，由Scala編寫而成。由於可水平擴展、吞吐率高等特性，得到廣泛應用。

(2)ETL/工作流

ETL是數據抽取(Extract)、清洗(Cleaning)、轉換(Transform)、裝載(Load)的過程，是構建數據倉庫的重要一環。

Crunch：這是Apache旗下的一套Java API函數庫，它能夠大大簡化編寫、測試、運行MapReduce 處理工作流的程序。

Falcon：這是Apache旗下的Falcon大數據管理框架，可以幫助用戶自動遷移和處理大數據集合。

Cascading：這是一個架構在Hadoop上的API函數庫，用來創建複雜的可容錯的數據處理工作流。

Oozie：是一個工作流引擎，用來協助Hadoop作業管理，Oozie字面含義是馴象之人，其寓意和Mahout一樣，幫助用戶更好地搞定Hadoop這頭大象。

(3)元數據(Metadata)

HCatalog：它提供了面向Apache Hadoop的數據表和存儲管理服務，Apache HCatalog提供一個共享的模式和數據類型的機制，它抽象出表，使用戶不必關心數據怎麼存儲，並提供了可操作的跨數據處理工具。

(4)序列化(Serialization)

Protocol Buffers：由Google推廣的一種與語言無關的、對結構化數據進行序列化和反序列化的機制。

Avro：這是一個建模於Protocol Buffers之上的、Hadoop生態系統中的子項目，Avro本身既是一個序列化框架，同時也實現了RPC的功能。

七、操作框架(Operational Frameworks)

最後，我們還需要一個操作性框架，來構建一套衡量標準和測試基準，從而來評價各種計算框架的性能優劣。在這個操作性框架中，還需要包括性能優化工具，藉助它來平衡工作負載。

(1)監測管理框架(Monitoring Frameworks)

OpenTSDB：這是構建於HBase之上的實時性能評測系統。

Ambari：這是一款基於Web的系統，支持Apache Hadoop集群的供應、管理和監控。

(2)基準測試(Benchmarking)

YCSB：YCSB是雅虎雲服務基準測試(Yahoo! Cloud Serving Benchmark)的簡寫。見名知意，它是由雅虎出品的一款通用雲服務性能測試工具。

GridMix：該系統通過運行大量合成的作業，對Hadoop系統進行基準測試，從而獲得性能評價指標。

結語

感謝您的觀看，如有不足之處，歡迎批評指正。

對大數據感興趣的同學可以關注我，並在後臺私信發送關鍵字：“大數據”即可獲取免費的大數據學習資料。

知識體系已整理好（筆記，PPT，學習視頻），歡迎大家來領取！

分享到:

閱讀更多 程序之道1 的文章

關鍵字: 存儲 Neo4J 寬泛

「大數據」（一百四十八）常用算法及數據結構之Stacks

「大數據」（一百三十六）常見算法及數據結構之Bitmap樹

大數據：瞭解Hadoop生態中Hive和HBase兄弟倆的區別

「大數據」（一百二十七）Python基礎之字符串：字符串方法

「大數據」（一百二十五）Python基礎之元組：tuple函數

「大數據」（一百二十三）Python基礎之列表：列表方法

「大數據」（一百二十一）Python基礎之序列：成員資格

「大數據」（一百二十）Python基礎之序列：乘法

「大數據」（一百一十九）Python基礎之序列：序列相加

「大數據」（一百一十七）Python基礎之字符串

「大數據」（一百一十六）Python基礎之註釋

大數據，Hadoop生態詳解

「大數據」（一百一十五）Python基礎之常用魔法函數

「大數據」（一百一十四）Python基礎知識之函數

「大數據」（一百一十三）Python基礎知識之獲取用戶輸入

「大數據」（一百一十二）Python基礎之數字和表達式

「大數據」（一百零一）常用分區工具

「大數據」（一百）磁盤分區類型及各自作用

「大數據」（九十七）Scala之文件操作

「大數據」（九十二）Scala之輔助構造器

「大數據」（八十八）Scala之數組

「大數據」（八十七）Scala之控制器和函數

「大數據」（八十六）Scala基礎

「大數據」（八十五）Spark之MLlib體驗

「大數據」（八十三）Spark之Streaming實時流

「大數據」（八十二）Spark之SparkSQL應用案例

「大數據」（八十一）Spark之SparkSQL運行架構

03.08 「大數據」（八十一）Spark之SparkSQL運行架構

「大數據」（八十）Spark之Shuffle機制

「大數據」（七十九）Spark之Lineage機制

「大數據」（七十八）Spark之通信模塊

03.03 「大數據」（七十六）Spark之工作機制

02.27 大數據：瞭解Hive和HBase的區別

02.26 「大數據」（七十）Spark之生態系統

大數據 Hadoop（中）筆記大全收藏加關注

大數據 Linux筆記大全

大數據：Yarn應用程序提交流程

大數據、Hadoop核心框架和MapReduce原理

大數據：清洗流程以及入門實例

大數據：數據清洗的定義以及數據清洗的方法

大數據、雲計算系統頂級架構師課程學習路線圖

大數據:Hbase的知識大全都在這裡

大數據：基於zookeeper協調的分布式日誌系統Kafka的文件存儲機制

大數據、機器學習和深度學習類命令行工具

大數據，Java丶Python丶Web前端等300G的學習資料無償分享！

大數據——MapReduce

大數據-hadoop生態系統及版本演化

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"