大數據介紹（一）

2018-06-11 11:43:36 火到沒朋友的大數據

整理的一些關於大數據的知識，總分為三個方面，第一方面主要在於理論和理解，後面的方面在於操作和補充；希

望對想學大數據的你有點幫助

第一方面：

大數據離線分析

一般處理T+1數據

Hadoop 2.X：（common、HDFS、MapReduce、YARN）

Hadoop並不是什麼數據庫，也不是程序庫，甚至不是一個獨立產品。實際上，Hadoop是一些獨立模塊的組合，包括一個分佈式文件系統HDFS、一個分佈式數據庫HBase、

一個大型分佈式數據處理庫MapReduce，等等等等。做一個類比的話，就好像是Microsoft Office，其實我們並沒有一個叫做Office的應用，Office實際上指的是Word、Excel等一系列桌面應用的組合。

環境搭建，處理數據的思想

Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。

Hadoop實現了一個分佈式文件系統（Hadoop Distributed File System），簡稱HDFS。

HDFS有高容錯性的特點，並且設計用來部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）來訪問應用程序的數據，

適合那些有著超大數據集（large data set）的應用程序。HDFS放寬了（relax）POSIX的要求，可以以流的形式訪問（streaming access）文件系統中的數據。

Hadoop的框架最核心的設計就是：HDFS和MapReduce。HDFS為海量的數據提供了存儲，則MapReduce為海量的數據提供了計算。

優點：Hadoop是一個能夠對大量數據進行分佈式處理的軟件框架。它以一種可靠、高效、可伸縮（能夠處理PB級數據）的方式進行數據處理。

同時Hadoop是一個能夠讓用戶輕鬆架構合適用的分佈式計算機平臺，用戶還可以輕鬆地在Hadoop上開發和運行處理海量級的數據的應用程序。主要有以下優點：

高可靠性、高擴展性、高效性、高容錯性、低成本

核心架構：底層是Hadoop Distributed File System(HDFS),它存儲Hadoop集群中所有存儲節點上的文件。

HDFS（對於本文）的上一層

是MapReduce 引擎，該引擎由 JobTrackers 和 TaskTrackers 組成。通過對Hadoop分佈式計算平臺最核心的分佈式文件系統HDFS、

MapReduce處理過程，以及數據倉庫工具Hive和分佈式數據庫Hbase

Hadoop的框架最核心的設計就是HDFS，MapReduce和YARN為海量的數據提供了存儲和計算

common支持其他Hadoop模塊的通用工具；

HDFS主要是Hadoop的存儲，用於海量的數據的存儲；

MapReduce主要用於分佈式計算；

YARN是Hadoop中的資源管理系統

HDFS（心跳機制）是一個分佈式文件系統，具有高容錯的特點，它可以部署在廉價的通用硬件上，提供高吞吐率的數據訪問，適合那些需要處理海量數據集的應用程序。

主要特性：

支持超大文件

一般是幾百MB，GB甚至是TB的文件

監測和快讀應對硬件故障

HDFS的檢測和冗餘機制很好地克服了大量硬件平臺上硬件故障的問題

流式數據訪問，

HDFS處理的數據規模都很大，應用一次需要訪問大量數據，同時，這些應用一般是批量處理，而不是用戶交互式處理，HDFS使用戶能夠以流的形式訪問數據集，注重的是數據的吞吐；

簡化一致性模型

大部分的HDFS程序操作文件時，需要一次寫入，多次讀取，在HDFS中，一個文件一旦經過創建寫入，關閉後一般不需要修改，這樣簡單的一致性模型有利於提高吞吐量。

HDFS不支持的場景：

低延遲數據訪問

大量的小文件

多用戶寫入文件，修改文件

Hadoop MapReduce是一個軟件框架，它可以輕鬆地編寫應用程序，在一個可靠的、容錯的方式中，以可靠的、容錯的方式處理大量的數據(數千個節點)

MapReduce是由Google公司研究提出的一種面向大規模數據處理的並行計算模型和方法，是Hadoop面向大數據並行處理的計算模型、框架和平臺

MapReduce（MR）是一個用來編寫處理並行分佈式數據程序的框架或庫。同 HDFS 一樣，它的架構也是基於主/從模式。“主機”是一個特殊的節點，負責協調多個工作節點之間的活動

MapReduce是處理大量半結構化數據集合的編程模型。編程模型是一種處理並結構化特定問題的方式。例如，在一個關係數據庫中，使用一種集合語言執行查詢，如SQL。告訴語言想要的結果，並將它提交給系統來計算出如何產生計算。還可以用更傳統的語言(C++，Java)，一步步地來解決問題。這是兩種不同的編程模型，MapReduce就是另外一種。

MapReduce和Hadoop是相互獨立的，實際上又能相互配合工作得很好。

最簡單的 MapReduce應用程序至少包含 3 個部分：一個 Map 函數、一個 Reduce 函數和一個 main 函數。main 函數將作業控制和文件輸入/輸出結合起來。在這點上，Hadoop 提供了大量的接口和抽象類，從而為 Hadoop應用程序開發人員提供許多工具，可用於調試和性能度量等。

MapReduce 本身就是用於並行處理大數據集的軟件框架。MapReduce 的根源是函數性編程中的 map 和 reduce 函數。它由兩個可能包含有許多實例（許多 Map 和 Reduce）的操作組成。Map 函數接受一組數據並將其轉換為一個鍵/值對列表，輸入域中的每個元素對應一個鍵/值對。Reduce 函數接受 Map 函數生成的列表，

然後根據它們的鍵（為每個鍵生成一個鍵/值對）縮小鍵/值對列表。

YARN

YARN的基本思想是將資源管理和作業調度/監視的功能劃分為單獨的守護進程，其思想是擁有一個全局組員管理器（RM）和每個應用程序主（AM）。

資源者和NodeManager構成數據計算框架。資源管理器是在系統中的所有應用程序之間仲裁資源的最終權威。NodeManager是負責容器、監視它們的資源使用(cpu、內存、磁盤、網絡)並將其報告給ResourceManager/調度器的每個機器框架代理。

實際上，每個應用程序的ApplicationMaster是一個特定於框架的庫，它的任務是與來自ResourceManager的資源進行協商，並與NodeManager(s)一起工作，以執行和監視任務。

ResourceManager有兩個主要組件:調度器和ApplicationsManager。

調度器負責根據熟悉的容量、隊列等約束將資源分配給正在運行的應用程序。調度器是純粹的調度器，因為它不為應用程序執行監視或跟蹤狀態。此外，它也不能保證由於應用程序失敗或硬件故障而重新啟動失敗的任務。調度程序根據應用程序的資源需求執行調度功能;它是基於資源容器的抽象概念實現的，資源容器包含內存、cpu、磁盤、網絡等元素。

調度器有一個可插拔的策略，它負責將群集資源分配到各種隊列、應用程序等中。

ApplicationsManager負責接受作業提交，協商第一個容器來執行特定於應用程序的ApplicationMaster，並在失敗時提供重新啟動ApplicationMaster容器的服務。每個應用程序的應用程序管理員有責任從調度程序中協商適當的資源容器，跟蹤它們的狀態並監視進度

YARN支持通過儲備系統進行資源保留的概念，該組件允許用戶指定資源超時和時間限制的概要(例如，截止日期)，並保留資源以確保重要任務的可預測執行。預訂系統跟蹤資源超時，執行預訂控制，並動態地指示底層調度程序以確保預訂已滿

為了使YARN的規模超過幾千個節點，YARN通過YARN聯合會的特性來支持聯合會的概念。聯邦允許透明地將多個YARN(子)簇連接在一起，並使它們作為單個的大型簇出現。這可以用於實現更大的規模，並/或允許多個獨立集群一起用於非常大的工作，或用於跨所有工作能力的租戶。

ARN是Hadoop 2.0的資源管理器。它是一個通用的資源管理系統，可為上層應用提供統一的資源管理和調度，它的引入為集群在利用率、資源統一管理和數據共享等方面帶來了巨大好處

Hive:

大數據數據倉庫

通過寫SQL對數據進行操作，類似於mysql數據庫中的sql

補充；

Hive是Hadoop的一個組價，作為數據庫，Hive的數據是儲存在Hadoop的文件系統中，Hive為Hadoop提供sql語句，是Hadoop可以通過sql語句操作文件系統中的數據。Hive是依賴於Hadoop而存在的

hive是建立在hadoop之上的一個工具，用於簡化一些BI統計。Hive能夠幫助用戶屏蔽掉複雜的mapreduce邏輯，而只需用戶使用簡單sql即可完成一定的查詢功能

Hive可以幫助開發者從現有的數據基礎架構轉移到Hadoop上，而這個基礎架構是基於傳統關係型數據庫和SQL的。Hive提供了Hive查詢語言，即HQL，它可以使用SQL方言查詢存儲在hadoop中的數據。

執行原理：

Hive本身不會生成java的mapreduce程序，而是通過XML文件驅動執行內置的、原生的Mapper和Reducer。

使用場景：

Hive適合做：數據倉庫、應用程序、可以維護海量數據、對數據進行挖掘、形成意見和報表

Hive數據倉庫軟件便於使用sql在分佈式儲存中讀寫和管理大型數據。結構可以投影到存儲中的數據上，提供命令工具和驅動程序JDBC將用戶連接到Hive

缺點：

不支持記錄級別的更新、插入或者刪除；

查詢延遲比較嚴重

不支持事務

如果想要基於SQL還想具有上面的特性，可以直接使用hadoop提供的nosql數據庫——HBase

HBase

基於HDFS的NOSQL數據庫

面向列的存儲

補充：Hbase是一個分佈式的、面向列的開源數據庫

HBase – Hadoop Database，是一個高可靠性（多備份，分佈式）、高性能（比MapReduce的性能高出許多）、面向列（存儲模式是列族和列的存儲模型）、可伸縮（集群可伸縮性）的分佈式存儲系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集群。

大數據為什麼選擇Hbase而不選擇傳統的數據庫？

Hbase性能非常高。HBase中存儲了一套HDFS的索引，通過表名－>行健－>列族－>列限定符－>時間版本這一套索引來定位數據的位置。正是因為HBase為每一列數據維護了一套索引規則，對於具體某一具體條數據的查詢可以非常快速的通過B＋樹定位數據存儲位置並將其取出。

HBase通常以集群部署，數據被分散到多個節點存儲，當客戶端發起查詢請求的時候，集群裡面多個節點並行執行查詢操作，最後將不同節點的查詢結果進行合併返回給客戶端。

HBase運行在高可用環境中。HBase集群中任意一個節點宕機都不會導致集群癱瘓。這取決於兩方面原因，第一方面，ZooKeeper解決了HBase中心化問題。第二方面，HBase將數據存放在HDFS上面，HDFS的數據冗餘存放在不同節點，一個節點癱瘓可從其他節點取得數據，保證了HBase的高可用。

Hbase適合存儲大數據HBase默認一個列族可以存放64M或更大的數據。HBase可以通過配置文件對存儲的列族大小進行設置

Hbase是一個無模式的數據庫。HBase不同於傳統的關係型數據庫，使用HBase不需要預先定義表中有多少列，也不需要定義每一列存儲的數據類型，HBase在需要的時候可以動態增加列和指定存儲數據類型。對於從不同數據源爬取的數據不一致，可以動態的新增列而不需要預先就設計好存儲的表結構，以應對數據結構多種多樣的情況

協作框架：

sqoop（橋樑：HDFS 《==》RDBMS）

sqoop是一款開源的工具，主要用於在Hadoop(Hive)與傳統的數據庫(mysql、postgresql...)間進行數據的傳遞，可以將一個關係型數據庫（例如： MySQL ,Oracle ,Postgres等）中的數據導進到Hadoop的HDFS中，也可以將HDFS的數據導進到關係型數據庫中。

特徵：

Sqoop是一個用來將Hadoop和關係型數據庫中的數據相互轉移的工具，可以將一個關係型數據庫（例如： MySQL ,Oracle ,Postgres等）中的數據導進到Hadoop的HDFS中，也可以將HDFS的數據導進到關係型數據庫中。

對於某些NoSQL數據庫它也提供了連接器。Sqoop，類似於其他ETL工具，使用元數據模型來判斷數據類型並在數據從數據源轉移到Hadoop時確保類型安全的數據處理。Sqoop專為大數據批量傳輸設計，能夠分割數據集並創建Hadoop任務來處理每個區塊。

Sqoop允許從結構化數據存儲(如關係數據庫、企業數據倉庫和NoSQL系統)輕鬆導入和導出數據。使用Sqoop，您可以在HDFS上從外部系統提供數據，並在Hive和HBase中填充表。Sqoop集成了Oozie，允許您調度和自動化導入和導出任務。Sqoop使用基於連接器的體系結構，該體系結構支持向新的外部系統提供連接的插件。

當您運行Sqoop時，在幕後發生的事情是非常簡單的。被傳輸的數據集被分割成不同的分區，一個只支持地圖的作業由負責傳輸數據集的每個映射器啟動。數據的每個記錄都以類型安全的方式處理，因為Sqoop使用數據庫元數據推斷數據類型

Sqoop還支持不同的數據格式來導入數據。例如，您可以通過簡單地指定一個選項——使用import命令的-avrodatafile來輕鬆導入Avro數據格式的數據

flume:收集日誌文件中信息

Flume是Cloudera提供的日誌收集系統，具有分佈式、高可靠、高可用性等特點，對海量日誌採集、聚合和傳輸，Flume支持在日誌系統中制定各類數據發送，同時，Flume提供對數據進行簡單處理，並寫到各種數接受方的能力。其設計的原理也是基於將數據流，如日誌數據從各種網站服務器上彙集起來存儲到HDFS，HBase等集中存儲器中。

特徵：

可靠性、可擴展性、可管理性

Flume的核心是把數據從數據源收集過來，在送到目的地，為了保證輸送一定成功，在送到目的地之前，會先緩存數據，待數據真正到達目的地後，刪除自己緩存的數據

Flume傳輸的數據基本單位是Event，如果是文本文件，通常是一行記錄，這也是事務的基本單位。Event從Source，流向Channel，再到Sink，本身為一個byte數組，並可攜帶headers信息。Event代表著一個數據流的最小完整單元，從外部數據源來，向外部的目的地去

Flume運行的核心是Agent。它是一個完整的數據收集工具，含有三個核心組件，分別是source、channel、sink。通過這些組件，Event可以從一個地方流向另外一個地方。

Flume NG架構的優勢：

NG在核心組件上進行了大規模的調整

大大降低了對用戶的要求,如用戶無需搭建ZooKeeper集群

有利於 Flume 和其他技術、hadoop 周邊組件的整合

在功能上更加強大、可擴展性更高

Flume架構核心組件：

source：source負責接收event或通過特殊機制產生event，並將events批量的放到一個或多個channel，source必須至少和一個channel關聯

不同類型的source：與系統集成的source: Syslog, Netcat；直接讀取文件的 source: ExecSource、SpoolSource；用於Agent和Agent之間通信的IPC Source: Avro、Thrift

channel：channel位於source和sink之間，用於緩存進來的event。當Sink成功的將event發送到下一跳的channel或最終目的時候，event從Channel移除。

幾種channel類型：MemoryChannel 可以實現高速的吞吐，但是無法保證數據的完整性；FileChannel（磁盤channel）保證數據的完整性與一致性。在具體配置FileChannel時，建議FileChannel設置的目錄和程序日誌文件保存的目錄設成不同的磁盤，以便提高效率

sink:Sink負責將event傳輸到下一跳或最終目的;sink在設置存儲數據時，可以向文件系統、數據庫、Hadoop存數據，在日誌數據較少時，可以將數據存儲在文件系統中，並且設定一定的時間間隔保存數據。在日誌數據較多時，可以將相應的日誌數據存儲到hadoop中，便於日後進行相應的數據分析。必須作用於一個確切的channel

調度框架anzkaban,瞭解：crontab（Linux自帶）、zeus(Alibaba)、Oozie(cloudera)

anzkaban:

Azkaban是一套簡單的任務調度服務，整體包括三部分webserver、dbserver、executorserver。

是linkin的開源項目，開發語言為Java。

Azkaban是由Linkedin開源的一個批量工作流任務調度器。用於在一個工作流內以一個特定的順序運行一組工作和流程。

Azkaban定義了一種KV文件格式來建立任務之間的依賴關係，並提供一個易於使用的web用戶界面維護和跟蹤你的工作流。

crontab(linux系統自帶):

root用戶和crontab文件的所有者

語法:

crontab [-e [UserName]|-l [UserName]|-r [UserName]|-v [UserName]|File ]

zeus(Alibaba):

Zeus是Alibaba開源的一個完整的Hadoop的作業平臺，用於從Hadoop任務的調試運行到生產任務的週期調度。

宙斯支持任務的整個生命週期。從功能上來說，支持：

* Hadoop MapReduce任務的調試運行

* Hive任務的調試運行

* Shell任務的運行

* Hive元數據的可視化查詢與數據預覽

* Hadoop任務的自動調度

* 完整的文檔管理

Zeus是針對Hadoop集群任務定製的，通用性不強。

基於Python的工作流引擎

基於Python的工作流引擎優點是：

The DAG definition is code

因此可維護性，版本管理，可測性和協作性更好。

Oozie(cloudera):

Oozie是一個管理hadoop任務的工作流/協調系統。Oozie工作流中擁有多個Action，如Hadoop Map/Reuce job,Hadoop Pig job等，所有的Action以有向無環圖(DAG Direct Acyclic Graph)的模式部署運行。詳見：Hadoop工作流調度系統Oozie

Oozie的優點是與Hadoop生態圈結合緊密，比如：

有MapReduce的Action，定義一個mapreduce任務很方便，而且可以直接通過job id關聯到hadoop history頁面

Oozie任務的資源文件都必須存放在HDFS上

Action也方便擴展，比如添加自定義的任務類型或者報警方式

缺點是通過XML文件來定義DAG依賴，雖然支持的功能很多，比如分支，ok，failed節點，但是總感覺定義過於複雜，維護成本高。

擴展前沿框架：

kylin、impala、ElasticSearch（ES）

kylin:

特性：

可擴展超快OLAP引擎: Kylin是為減少在Hadoop/Spark上百億規模數據查詢延遲而Hadoop ANSI SQL 接口: Kylin為Hadoop提供標準SQL支持大部分查詢功能

交互式查詢能力: 通過Kylin，用戶可以與Hadoop數據進行亞秒級交互，在同樣的數據集上提供比Hive更好的性能

多維立方體（MOLAP Cube）: 用戶能夠在Kylin裡為百億以上數據集定義數據模型並構建立方體

與BI工具無縫整合:Kylin提供與BI工具的整合能力，如Tableau，PowerBI/Excel，MSTR，QlikSense，Hue和SuperSet

其他特性:

Job管理與監控

壓縮與編碼

增量更新

利用HBase Coprocessor

基於HyperLogLog的Dinstinc Count近似算法

友好的web界面以管理，監控和使用立方體

項目及表級別的訪問控制安全

支持LDAP、SSO

kylin生態圈：

Kylin 核心:

Kylin OLAP引擎基礎框架，包括元數據（Metadata）引擎，查詢引擎，Job引擎及存儲引擎等，同時包括REST服務器以響應客戶端請求

擴展:支持額外功能和特性的插件

整合:

用戶界面:在Kylin核心之上擴展的第三方用戶界面

驅動:ODBC 和 JDBC 驅動以支持不同的工具和產品，比如Tableau

impala:

Impala是開源、原生分析數據庫。

Impala在Hadoop上提供了低延遲和高併發性的BI/解析查詢(不是由像Apache Hive這樣的批處理框架交付的)。Impala也線性擴展，即使在多租戶環境中也是如此。

使用與Hadoop部署相同的文件和數據格式、元數據、安全性和資源管理框架——沒有冗餘的基礎設施或數據轉換/複製。

對於Apache Hive用戶，Impala使用相同的元數據和ODBC驅動程序。與Hive一樣，Impala支持SQL，所以不必擔心重新發明實現輪。

使用Impala，更多的用戶，無論是使用SQL查詢還是BI應用程序，都可以通過單一的存儲庫與更多的數據進行交互，並通過分析從源存儲元數據。

ElasticSearch（ES）

ElasticSearch是一個基於Lucene的搜索服務器。它提供了一個分佈式多用戶能力的全文搜索引擎，基於RESTful web接口。Elasticsearch是用Java開發的，

並作為Apache許可條款下的開放源碼發佈，是當前流行的企業級搜索引擎。設計用於雲計算中，能夠達到實時搜索，穩定，可靠，快速，安裝使用方便。

後記：對於大部分轉行的人來說，找機會把自己的基礎知識補齊，邊工作邊補基礎知識，真心很重要。"我們相信人人都可以成為一個IT大神，現在開始，選擇一條陽光大道，助你入門，學習的路上不再迷茫。這裡是北京尚學堂，初學者轉行到IT行業的聚集地。

分享到:

閱讀更多 火到沒朋友的大數據 的文章

關鍵字: HDFS 大數據軟件

「大數據」（一百四十八）常用算法及數據結構之Stacks

「大數據」（一百三十六）常見算法及數據結構之Bitmap樹

大數據：瞭解Hadoop生態中Hive和HBase兄弟倆的區別

「大數據」（一百二十七）Python基礎之字符串：字符串方法

「大數據」（一百二十五）Python基礎之元組：tuple函數

「大數據」（一百二十三）Python基礎之列表：列表方法

「大數據」（一百二十一）Python基礎之序列：成員資格

「大數據」（一百二十）Python基礎之序列：乘法

「大數據」（一百一十九）Python基礎之序列：序列相加

「大數據」（一百一十七）Python基礎之字符串

「大數據」（一百一十六）Python基礎之註釋

大數據，Hadoop生態詳解

「大數據」（一百一十五）Python基礎之常用魔法函數

「大數據」（一百一十四）Python基礎知識之函數

「大數據」（一百一十三）Python基礎知識之獲取用戶輸入

「大數據」（一百一十二）Python基礎之數字和表達式

「大數據」（一百零一）常用分區工具

「大數據」（一百）磁盤分區類型及各自作用

「大數據」（九十七）Scala之文件操作

「大數據」（九十二）Scala之輔助構造器

「大數據」（八十八）Scala之數組

「大數據」（八十七）Scala之控制器和函數

「大數據」（八十六）Scala基礎

「大數據」（八十五）Spark之MLlib體驗

「大數據」（八十三）Spark之Streaming實時流

「大數據」（八十二）Spark之SparkSQL應用案例

「大數據」（八十一）Spark之SparkSQL運行架構

03.08 「大數據」（八十一）Spark之SparkSQL運行架構

「大數據」（八十）Spark之Shuffle機制

「大數據」（七十九）Spark之Lineage機制

「大數據」（七十八）Spark之通信模塊

03.03 「大數據」（七十六）Spark之工作機制

02.27 大數據：瞭解Hive和HBase的區別

02.26 「大數據」（七十）Spark之生態系統

大數據 Hadoop（中）筆記大全收藏加關注

大數據 Linux筆記大全

大數據：Yarn應用程序提交流程

大數據、Hadoop核心框架和MapReduce原理

大數據：清洗流程以及入門實例

大數據：數據清洗的定義以及數據清洗的方法

大數據、雲計算系統頂級架構師課程學習路線圖

大數據:Hbase的知識大全都在這裡

大數據：基於zookeeper協調的分布式日誌系統Kafka的文件存儲機制

大數據、機器學習和深度學習類命令行工具

大數據，Java丶Python丶Web前端等300G的學習資料無償分享！

大數據——MapReduce

大數據-hadoop生態系統及版本演化

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"