Hadoop大數據開發基礎系列：一、初識Hadoop

2020-03-06 13:36:16 軟件心旗

目錄結構

1.Hadoop概述

1.1 Hadoop簡介

1.2 Hadoop發展史

1.3 Hadoop特點

2.Hadoop核心

2.1 分佈式文件系統——HDFS

2.2 分佈式計算框架——MapReduce

2.3 集群資源管理器——YARN

3.Hadoop生態系統

4.Hadoop應用場景

5.小結

一、Hadoop介紹

1.Hadoop概述

兩大核心：HDFS和MapReduce

用於資源與任務調度的框架：YARN

1.1 Hadoop簡介

Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。用戶可以在不瞭解分佈式底層細節的情況下，開發分佈式程序。充分利用集群的威力進行高速運算和存儲。它的目的是從單一的服務器擴展到成千上萬的機器，將集群部署在多臺機器，每個機器提供本地計算和存儲，並且將存儲的數據備份在多個節點，由此提高集群的可用性，而不是通過硬件的提升，當一臺機器宕機時，其他節點仍可以提供備份數據和計算服務，Hadoop框架最核心的設計是HDFS和MapReduce。

1.2 Hadoop發展史（轉自百度百科）

Hadoop原本來自於谷歌一款名為MapReduce的編程模型包。谷歌的MapReduce框架可以把一個應用程序分解為許多並行計算指令，跨大量的計算節點運行非常巨大的數據集。使用該框架的一個典型例子就是在網絡數據上運行的搜索算法。Hadoop 最初只與網頁索引有關，迅速發展成為分析大數據的領先平臺。

目前有很多公司開始提供基於Hadoop的商業軟件、支持、服務以及培訓。Cloudera是一家美國的企業軟件公司，該公司在2008年開始提供基於Hadoop的軟件和服務。GoGrid是一家雲計算基礎設施公司，在2012年，該公司與Cloudera合作加速了企業採納基於Hadoop應用的步伐。Dataguise公司是一家數據安全公司，同樣在2012年該公司推出了一款針對Hadoop的數據保護和風險評估的軟件。

1.3 Hadoop的特點

Hadoop是一個能夠讓用戶輕鬆架構和使用的分佈式計算平臺。用戶可以輕鬆地在Hadoop上開發和運行處理海量數據的應用程序。其優點主要有以下幾個：

(1)高可靠性：因為它假設計算元素和存儲會失敗，因此它維護多個工作數據副本，確保能夠針對失敗的節點重新分佈處理。

(2)高擴展性：集群內可以很容易地進行節點擴展，擴大集群。

(3)高效性：Hadoop是在節點之間動態地移動數據，在數據所在節點進行併發處理，並保證各個節點的動態平衡，因此處理速的非常快。

(4)高容錯性：HDFS在存儲文件時會在多個節點或者多臺機器上存儲文件的備份副本，保證程序順利運行。如果啟動的任務失敗，Hadoop會重新運行該任務或啟用其他任務來完成這個任務沒有完成的部分。

(5)低成本：Hadoop是開源的。

(6)可構建在廉價機器上，Hadoop的基本框架是用java編寫的。

2.Hadoop核心

2.1 分佈式文件系統——HDFS(Hadoop Distributed File System)

2.1.1 HDFS架構及簡介

HDFS是以分佈式進行存儲的文件系統，主要負責集群數據的存儲和讀取。HDFS是一個主/從（master/slave）體系結構的分佈式文件系統。HDFS支持傳統的層次型文件組織結構，用戶或者應用程序可以創建目錄，然後將文件保存在這些目錄裡，可以通過文件路徑對文件執行創建、讀取、更新、刪除等操作。但是由於分佈式存儲的性質，他有和傳統的文件系統有明顯的區別。

HDFS基本架構圖：

在這裡還是要推薦下我自己建的大數據學習交流群:943791324，群裡都是學大數據開發的，如果你正在學習大數據，小編歡迎你加入,大家都是軟件開發黨，不定期分享乾貨（只有大數據軟件開發相關的），包括我自己整理的一份最新的大數據進階資料和高級開發教程，歡迎進階中和進想深入大數據的小夥伴加入。

HDFS文件系統主要包括一個NameNode、一個Secondary NameNode和多個DataNode。

(1)元數據(metadata)

元數據不是具體的文件內容，有三部分重要信息：①文件和目錄自身的屬性信息，如文件名、目錄名、父目錄信息、文件大小、創建時間、修改時間等；②記錄文件內容存儲的相關信息，例如文件分塊情況、副本個數、每個副本所在的DataNode信息等；③用來記錄HDFS中所有的DataNode的信息，用於管理DataNode

(2)NameNode

NameNode用於存儲元數據以及處理客戶端發出的請求。在NameNode中存放元信息的文件是fsimage文件。在系統運行期間，所有對元數據的操作都會保存在內存中，並且被持久化存儲在另一個文件edits（日誌）中，當NameNode啟動時，fsimage會被加載到內存，然後對內存裡的數據執行edits所記錄的操作，以確保內存所保留的數據處於最新狀態。

(3)Secondary NameNode

Secondary NameNode用於備份NameNode的數據，週期性將edits文件合併到fsimage文件並在本地本分，將新的fsimage文件存儲到NameNode，取代原來的fsimage，刪除edits文件。創建一個新的edits繼續存儲文件的修改操作和狀態。

(4)DataNode

DataNode是真正存儲數據的地方。在DataNode中，文件以數據塊的形式進行存儲。當文件傳到HDFS端以128MB的數據塊將文件進行切割，將每個數據塊存到不同的或者相同的DataNode並且備份副本，一般默認3個，NameNode會負責記錄文件的分塊信息，確保在讀取文件時可以找到並整合整個塊。

(5)數據塊(block)

文件在上傳到HDFS時根據系統默認文件塊大小把文件分成一個個數據塊。Hadoop 2.x 默認128MB為一個數據塊，比如存儲大小為129MB的文件，則被分為兩個塊來存儲。數據塊會被存儲到各個節點，每個數據塊都會備份副本。

2.1.2 HDFS分佈式原理

什麼是分佈式系統？分佈式系統會劃分成多個子系統或模塊，各自運行在不同的機器上，子系統或模塊之間通過網絡通信進行協作，實現最終的整體功能。利用多個節點共同協作完成一項或多項具體業務功能的系統就是分佈式系統。

分佈式文件系統是分佈式系統的一個子集，其解決的問題就是數據存儲。換句話說，它是橫跨在多臺計算機上的存儲系統。存儲在分佈式文件上的數據自動分佈在不同的節點上。

HDFS作為分佈式文件系統，主要體現在以下三個方面：

(1)HDFS並不是一個單機文件系統，它是分佈在多個集群節點上的文件系統。節點之間通過網絡通信進行協作，提供多個節點的文件信息，讓每個用戶都可以看到文件系統的文件。讓多臺機器上的多用戶分享文件和存儲空間。

(2)文件存儲時被分佈在多個節點上，這裡涉及一個數據塊的概念，數據存儲不是按一個文件存儲的，而是把一個文件分成一個或多個數據塊存儲。數據塊存儲時並不是都存儲在一個節點上，而是被分佈存儲在各個節點上，並且數據塊會在其他節點上存儲副本。

(3)數據從多個節點讀取。讀取一個文件時，從多個節點中找到該文件的數據塊，分佈讀取所有數據塊，直到最後一個數據塊讀取完畢。

2.1.3 HDFS宕機處理

數據存儲在文件系統中，如果某個節點宕機了，就很容易造成數據流失，HDFS針對這個問題提供了保護措施：

(1)冗餘備份

數據存儲過程中對每個數據塊都做了冗餘處理，副本個數可以自行設置。

(2)副本存放

使用的策略：以dfs.replication為例，在同一個機器的兩個節點上各備份一個副本，然後在另一個機器的某個節點上再放一個副本，前者是為了防止節點宕機，後者則是為了防止整個機器宕機而使數據丟失。

(3)宕機處理

①DataNode會週期性地發送心跳信息給NameNode（默認3s一次）。如果NameNode在預定時間內沒有收到心跳信息（默認10min），他會認為DataNode出問題了，把他從集群中移除。然後HDFS會檢測到硬盤上的數據塊副本數量低於要求，然後對副本數量不符合要求的數據塊創建需要的副本，以達到預設的要求。DataNode可能會因為硬件故障、主板故障、電源老化和網絡故障等問題脫離集群。

②當HDFS讀取某個數據塊時，如果該節點正處於宕機，客戶端就會到存儲該數據塊的其他節點讀取，HDFS也會檢測到數據塊副本個數不符合要求而重新補全副本。

③當HDFS存儲數據時，如果要存放的節點宕機，HDFS會重新分配一個節點給數據塊，然後備份宕機節點的數據。

2.1.4 HDFS的特點

(1)優點：

高容錯性、適合大數據的處理、流式數據訪問（一次寫入，多次讀取；文件一旦寫入，不能修改，只能增加，這樣可以保證數據的一致性）

(2)缺點：

不適合低延遲數據的訪問、無法高效存儲大量小文件、不支持多用戶寫入以及任意修改文件（寫操作只能在文件末尾完成，只能執行追加操作）

2.2 分佈式計算框架——MapReduce

2.2.1 MapReduce簡介

MapReduce是Hadoop的核心計算框架，是用於大規模數據集（大於1TB）並行計算的編程模型，主要包括Map（映射）和Reduce（歸約）兩部分。當啟動一個MapReduce任務時，Map端會讀取HDFS上的數據，將數據映射成所需要的鍵值對類型並傳到Reduce端。Reduce端會接收Map端傳過來的鍵值對類型的數據，根據不同的分組，對每一組鍵相同的數據進行處理，得到新的鍵值對並輸出到HDFS，這就是MapReduce的核心思想。

2.2.2 MapReduce工作原理

(1)MapReduce執行流程(輸入、切片、Map階段數據處理、Reduce階段數據處理、數據輸出等階段)

著重說一下Reduce階段：Reduce任務也可以有多個，按照Map階段設置的數據分區決定（數據劃分的鍵的種類），一個分區數據被一個Reduce處理。針對每一個Reduce任務，Reduce會接收到不同的Map任務傳來的數據，並且每一個Map傳來的數據都是有序的。一個Reduce任務的每一次處理都是針對所有鍵相同的數據，對數據進行歸約，以新的鍵值對輸出到HDFS。

(2)MapReduce的本質：

(3)幫助理解map和reduce過程的小例子：

2.3 集群資源管理器——YARN

2.3.1 YARN簡介

YARN提供了一個更加通用的資源管理和分佈式應用框架，目的是使得Hadoop的數據處理能力更強。在這個框架上，用戶可以根據自己的需求實現定製化的數據處理應用。MapReduce也是YARN上的一個應用。YARN的另一個目標是拓展Hadoop，使得它不僅支持MapReduce計算，還能方便的管理如Hive、HBase、Pig、Spark等應用。通過YARN，各種應用就可以互不干擾地運行在同一個Hadoop系統中，共享整個集群資源。

2.3.2 YARN的基本架構和任務流程

(1)YARN的基本組成結構

總體上，YARN還是Master/Slave結構，ResourceManager為Mater，NodeManager是Slave,ResourceManager負責對各個NodeManager上的資源進行統一管理和調度。當用戶提交一個應用程序時，需要提供一個用於跟蹤和管理這個程序的ApplicationMaster，它負責向ResourceManager申請資源，並要求NodeManager啟動可以佔用一定資源的任務。由於不同的ApplicationMaster被分佈到不同的節點上，因此他們之間不會互相影響(即可以併發執行一些應用)。

①RM(ResourceManager):由兩個組件構成（調度器，scheduler；應用程序管理器 ASM）

ResourceManager 將各個資源部分（計算、內存、帶寬等）精心安排給基礎 NodeManager（YARN 的每節點代理）。ResourceManager 還與 ApplicationMaster 一起分配資源，與 NodeManager 一起啟動和監視它們的基礎應用程序。在此上下文中，ApplicationMaster 承擔了以前的 TaskTracker 的一些角色，ResourceManager 承擔了 JobTracker 的角色。

調度器負責給正在運行的應用程序分配資源，它不從事任何與具體應用程序相關的工作。

ASM負責處理客戶端提交的job以及協商第一個Container（包裝資源的對象）以供ApplicationMaster運行，並且在ApplicationMaster失敗的時候將其重新啟動。

②NM(NodeManager):

是每個節點上的資源和任務管理器。一方面，他會定時地向RM節點彙報本節點上的資源使用情況和各個Container的運行狀態；另一方面，它接收並處理來自ApplicationMaster的Container啟動/停止等請求。

container是YARN中的資源抽象，它封裝了某個節點上的多維度資源，如內存、CPU、磁盤、網絡等。當ApplicationMaster向RM請求資源時，RM返回的資源便是用Container封裝的。YARN為每一個任務分配一個Container，且該任務只能使用該Container中描述的資源。

③AM(ApplicationMaster):相當於給一個應用配置了一個小管家

在用戶提交的每個應用程序時，系統都會生成一個AM幷包含到提交的程序裡，主要功能有：與RM中的調度器協商以獲取資源（用Container表示）；將得到的任務進一步細分給內部的程序；與NM通信以啟動/停止服務；監控所有任務的運行狀態，並在任務運行失敗時重新為任務申請資源以重啟任務。

④CA(Client Application):客戶端應用程序

客戶端將應用程序提交到RM，首先會創建一個Application上下文件對象，並設置AM必需的資源請求信息，然後提交到RM。

(2)YARN的工作流程

詳細描述YARN從提交任務到完成任務的整個工作流程：

①用戶通過Client提交一個應用程序到YARN進行處理，其中包括AM程序、啟動AM的命令、用戶程序等。

②RM為該應用程序分配第一個Container，並與分配的Container所在位置的NodeManager進行通信，要求它在這個Container中啟動應用程序的AM。該Container用於啟動AM和AM後續命令。

③AM啟動後先向RM註冊，這樣用戶可以直接通過RM查看應用程序的運行狀態，然後開始為提交的應用程序所需要執行的各個任務申請資源，並監控它的運行狀態，知道運行結束。（即重複執行④——⑦）

④AM採用輪流詢問的方式通過RPC協議向RM申請和領取資源，並監控它的運行狀態，所以多個應用程序提交時，不一定是第一個先執行。

⑤一旦AM申請到資源，便與資源對應的NM通信，要求它在分配的資源中啟動任務。

⑥NM為任務設置好運行環境後，將任務啟動命令寫到一個腳本中，並通過運行該腳本啟動任務。

⑦被啟動的任務開始執行，各個任務通過某個RPC協議向AM彙報自己的狀態和進度，以讓AM隨時掌握各個任務的運行狀態，從而可以在任務失敗時重新啟動任務。在應用程序運行過程中，用戶可以隨時通過RPC向AM查詢應用程序的當前運行狀態。

⑧應用程序運行完成後，ApplicationMaster向RM註銷自己。

⑨關閉客戶端和AM。

3.Hadoop生態系統

Hadoop面世之後，相繼開發出了很多組件，這些組件共同提供服務給Hadoop相關工程，並逐步形成了系列化的組件系統，稱為Hadoop生態系統

(1)HBase

Hadoop Database，是一個高可靠性、高性能、面向列、可伸縮的分佈式存儲系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲

(2)Hive

Hive是建立在 Hadoop 上的數據倉庫基礎構架。它提供了一系列的工具，可以用來進行數據提取轉化加載（ETL），這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。

(3)Pig

Pig是一個基於Hadoop的大規模數據分析平臺，它提供的SQL-LIKE語言叫Pig Latin，該語言的編譯器會把類SQL的數據分析請求轉換為一系列經過優化處理的MapReduce運算。

(4)Sqoop

Sqoop是一款開源的工具，主要用於在Hadoop(Hive)與傳統的數據庫(mysql、postgresql...)間進行數據的傳遞，可以將一個關係型數據庫中的數據導進到Hadoop的HDFS中，也可以將HDFS的數據導進到關係型數據庫中。

(5)Flume

Flume是Cloudera提供的一個高可用的，高可靠的，分佈式的海量日誌採集、聚合和傳輸的系統，Flume支持在日誌系統中定製各類數據發送方，用於收集數據；同時，Flume提供對數據進行簡單處理，並寫到各種數據接受方（可定製）的能力

(6)Oozie

Oozie是基於hadoop的調度器，以xml的形式寫調度流程，可以調度mr，pig，hive，shell，jar任務等等。

主要的功能有

* Workflow：順序執行流程節點，支持fork（分支多個節點），join（合併多個節點為一個）

* Coordinator，定時觸發workflow

* Bundle Job，綁定多個coordinator

(7)ZooKeeper

ZooKeeper是一個分佈式的，開放源碼的分佈式應用程序協調服務，是Google的Chubby一個開源的實現，是Hadoop和Hbase的重要組件。它是一個為分佈式應用提供一致性服務的軟件，提供的功能包括：配置維護、域名服務、分佈式同步、組服務等。

(8)Mahout

Mahout 是 Apache Software Foundation（ASF）旗下的一個開源項目，提供一些可擴展的機器學習領域經典算法的實現，旨在幫助開發人員更加方便快捷地創建智能應用程序。Mahout包含許多實現，包括聚類、分類、推薦過濾、頻繁子項挖掘。此外，通過使用 Apache Hadoop 庫，Mahout 可以有效地擴展到雲中。

4.Hadoop應用場景

十大應用場景：(1) 在線旅遊 (2) 移動數據 (3) 電子商務 (4) 圖像處理 (5) 能源開採

(6) 詐騙檢測 (7) IT安全 (8) 醫療保健 (9) 搜索引擎 (10) 社交平臺

5.小結

本文從理論方面介紹了Hadoop的基本概念、Hadoop的特點，瞭解了Hadoop的核心思想；瞭解了HDFS、MapReduce、YARN三大主要的核心框架，深入瞭解了Hadoop的整體結構；簡單地瞭解了Hadoop的生態系統和一些應用場景。

分享到:

閱讀更多 軟件心旗 的文章

關鍵字: 軟件雲計算 Cloudera

Hadoop：MapReduce多路徑輸入與多文件輸出詳解

Hadoop 偽分佈式搭建指南

Hadoop 數據科學

Hadoop DataBase學習筆記

一步一步學習大數據：Hadoop 生態系統與場景

Hadoop 安裝教程

php 操作 Hadoop

第四章 Hadoop 集群搭建

第七章 Hadoop 常用的 shell 命令

第二章 Hadoop 發展背景

不看就虧系列！這裡有完整的 Hadoop 集群搭建教程，和最易懂的 Hadoop 概念！

大數據開發學習，Hadoop-HDFS詳細介紹

03.04 大數據開發學習，Hadoop-HDFS詳細介紹

03.02 看完就能獨自把集群搭起來！Hadoop HDFS完全分佈式環境搭建詳解

03.01 Hadoop HDFS詳細操作

Hbase教程菜鳥教程：Hadoop Hbase入門簡介

Hadoop 3的主要優缺點

FastDFS、Hadoop、TiDB共同點與各自特點

Hadoop YARN：調度性能優化實踐

SQL ON HADOOP 技術框架彙總

Hadoop 數據管理平臺 Apache Falcon

深入淺出 Hadoop YARN

Hadoop、Spark等5種大數據框架對比，你的項目該用哪種？

Hadoop 企業級大數據管理平台CDH 安裝Hadoop組件

Hadoop 基本 Shell命令

揭祕Apache Hadoop YARN，第一部分：集群和YARN基礎

08.28 Hadoop 學習一:jdk配置

最全騰訊等BAT大數據面試99題：hadoop、java、spark、機器算法等

ELK hadoop hbase

系統學習大數據兩大框架 hadoop 和spark

如何系統的學習大數據框架 hadoop 和spark？

大數據計算常用的分布式計算組件——Hadoop、Storm以及Spark

Nutch-Hadoop-MongoDB搭建分佈式爬蟲

好程式設計師：hadoop job 日誌的查看

Hadoop 的主節點如何啓動java程序？

hadoop上運行python——hadoop streaming：搭建數據分析體系79篇

Hadoop 面試，來看這篇就夠了

Hadoop MapReduce v1 系統剖析

Hadoop 之上的數據建模-Data Vault 2.

Hadoop 回收站Trash知識點

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"