「大數據」Hadoop生態系統：分佈式計算系統

2018-12-30 10:03:40 智能時刻

Apache Ignite

Apache Ignite In-Memory Data Fabric是一個分佈式內存平臺，用於實時計算和處理大規模數據集。它包括分佈式鍵值內存存儲，SQL功能，map-reduce和其他計算，分佈式數據結構，連續查詢，消息和事件子系統，Hadoop和Spark集成。 Ignite是用Java構建的，提供.NET和C ++ API。

Apache Ignite
Apache Ignite文檔

Apache MapReduce

MapReduce是一種編程模型，用於在群集上使用並行分佈式算法處理大型數據集。 Apache MapReduce源自Google MapReduce：大群集上的簡化數據處理。當前的Apache MapReduce版本是基於Apache YARN Framework構建的。 YARN代表“Yet-Another-Resource-Negotiator”。它是一個新的框架，有助於編寫任意分佈式處理框架和應用程序。 YARN的執行模型比早期的MapReduce實現更通用。與原始的Apache Hadoop MapReduce（也稱為MR1）不同，YARN可以運行不遵循MapReduce模型的應用程序。 Hadoop YARN試圖將Apache Hadoop超越MapReduce進行數據處理。

Apache MapReduce
谷歌MapReduce論文
編寫YARN應用程序

Apache Pig

Pig提供了一個在Hadoop上並行執行數據流的引擎。它包括一種用於表達這些數據流的語言Pig Latin。 Pig Latin包含許多傳統數據操作（連接，排序，過濾等）的運算符，以及用戶開發自己的讀取，處理和寫入數據的功能。豬在Hadoop上運行。它利用了Hadoop分佈式文件系統，HDFS和Hadoop的處理系統MapReduce。

Pig使用MapReduce來執行其所有數據處理。它編譯Pig Latin腳本，用戶將其寫入一系列一個或多個MapReduce作業，然後執行它們。 Pig Latin看起來與您看到的許多編程語言不同。 Pig Latin中沒有if語句或for循環。這是因為傳統的過程和麵向對象的編程語言描述了控制流，而數據流是程序的副作用。 Pig Latin專注於數據流。

1. pig.apache.org/
2.Pig examples by Alan Gates

JAQL

JAQL是一種功能性的聲明性編程語言，專門用於處理大量結構化，半結構化和非結構化數據。顧名思義，JAQL的主要用途是處理存儲為JSON文檔的數據，但JAQL可以處理各種類型的數據。例如，它可以支持XML，逗號分隔值（CSV）數據和平面文件。 “JAQL中的SQL”功能允許程序員使用結構化SQL數據，同時使用JSON數據模型，該模型的限制性比結構化查詢語言對應項更少。

具體來說，Jaql允許您選擇，加入，分組和過濾存儲在HDFS中的數據，就像Pig和Hive的混合一樣。 Jaql的查詢語言受到許多編程和查詢語言的啟發，包括Lisp，SQL，XQuery和Pig。

JAQL由IBM研究實驗室的工作人員於2008年創建，併發布給開源。雖然它繼續作為Google Code上的項目託管，其中可下載的版本在Apache 2.0許可下可用，但圍繞JAQL的主要開發活動仍然以IBM為中心。該公司提供查詢語言作為與InfoSphere BigInsights及其Hadoop平臺相關聯的工具套件的一部分。與工作流協調器一起使用，BigInsights中使用JAQL在存儲，處理和分析作業之間交換數據。它還提供外部數據和服務的鏈接，包括關係數據庫和機器學習數據。

Google Code中的JAQL
什麼是Jaql？byIBM

Apache Spark

數據分析集群計算框架最初是在加州大學伯克利分校的AMPLab中開發的。 Spark適用於Hadoop開源社區，構建於Hadoop分佈式文件系統（HDFS）之上。但是，Spark為Hadoop MapReduce提供了一種更易於使用的替代方案，並且在某些應用程序中，其性能比Hadoop MapReduce等上一代系統快10倍。

Spark是一個用於編寫快速分佈式程序的框架。 Spark解決了與Hadoop MapReduce類似的問題，但具有快速的內存方法和乾淨的功能樣式API。憑藉其與Hadoop和內置工具集成的交互式查詢分析（Shark），大規模圖形處理和分析（Bagel）以及實時分析（Spark Streaming）的能力，它可以交互式地用於快速處理和查詢大型數據集。

為了加快編程速度，Spark在Scala，Java和Python中提供了簡潔，簡潔的API。您還可以從Scala和Python shell以交互方式使用Spark來快速查詢大數據集。 Spark也是Shark背後的引擎，Shark是一個完全與Apache Hive兼容的數據倉庫系統，運行速度比Hive快100倍。

Apache Spark
Mirror of Spark on Github
RDDs - Paper
Spark: Cluster Computing... - Paper Spark Research

Apache Storm

Storm是一個複雜的事件處理器（CEP）和主要以Clojure編程語言編寫的分佈式計算框架。是一種分佈式實時計算系統，用於處理快速，大量的數據流。 Storm是一種基於主工作者範式的架構。因此，Storm集群主要由主節點和工作節點組成，由Zookeeper協調完成。

Storm使用zeromq（0mq，zeromq），這是一個先進的可嵌入網絡庫。它提供了一個消息隊列，但與面向消息的中間件（MOM）不同，0MQ系統可以在沒有專用消息代理的情況下運行。該庫旨在具有熟悉的套接字式API。

該項目最初由Nathan Marz和BackType團隊創建，該項目在被Twitter收購後開源。 Storm最初是在2011年在BackType開發和部署的。經過7個月的開發，BackType於2011年7月被Twitter收購.Storm於2011年9月開源。

Hortonworks正在開發Storm-on-YARN版本，計劃在2013年第四季度完成基礎級集成。這是Hortonworks的計劃。 Yahoo / Hortonworks還計劃在不久的將來將github.com/yahoo/storm-yarn上的Storm-on-YARN代碼轉移到Apache Storm項目的子項目中。

Twitter最近發佈了一款名為“Summingbird”的Hadoop-Storm Hybrid.Summingbird將這兩個框架融合為一體，允許開發人員使用Storm進行短期處理，使用Hadoop進行深度數據潛水。旨在通過將批處理和流處理組合成混合系統來減輕批處理和流處理之間的權衡的系統。

Storm Project/
Storm-on-YARN

Apache Flink

Apache Flink（以前稱為Stratosphere）在Java和Scala中具有強大的編程抽象，高性能運行時和自動程序優化。它具有對迭代，增量迭代和由大型DAG操作組成的程序的本機支持。

Flink是一個數據處理系統，是Hadoop MapReduce組件的替代品。它帶有自己的運行時，而不是構建在MapReduce之上。因此，它可以完全獨立於Hadoop生態系統工作。但是，Flink還可以訪問Hadoop的分佈式文件系統（HDFS）來讀取和寫入數據，以及Hadoop的下一代資源管理器（YARN）來配置群集資源。由於大多數Flink用戶使用Hadoop HDFS來存儲他們的數據，因此它已經提供了訪問HDFS所需的庫。

Apache Flink incubator page
Stratosphere site

Apache Apex

Apache Apex是一個基於Apache YARN的企業級大數據動態平臺，它統一了流處理和批處理。它以高度可擴展，高性能，容錯，有狀態，安全，分佈式和易於操作的方式處理大數據。它提供了一個簡單的API，使用戶能夠編寫或重用通用Java代碼，從而降低編寫大數據應用程序所需的專業知識。

Apache Apex-Malhar是Apache Apex平臺的補充，它是一個運營商庫，可實現希望快速開發應用程序的客戶所需的通用業務邏輯功能。這些運營商提供對HDFS，S3，NFS，FTP和其他文件系統的訪問; Kafka，ActiveMQ，RabbitMQ，JMS和其他消息系統; MySql，Cassandra，MongoDB，Redis，HBase，CouchDB和其他數據庫以及JDBC連接器。該庫還包括許多其他常見的業務邏輯模式，可幫助用戶顯著減少投入生產所需的時間。易於與所有其他大數據技術集成是Apache Apex-Malhar的主要任務之一。

GitHub上提供的Apex是DataTorrent商業產品DataTorrent RTS 3以及其他技術（如數據攝取工具dtIngest）所基於的核心技術。

Apache Apex from DataTorrent
Apache Apex main page
Apache Apex Proposal

Netflix PigPen

PigPen是針對Clojure的map-reduce，它編譯為Apache Pig。 Clojure是Rich Hickey創建的Lisp編程語言的方言，因此是一種功能通用語言，可在Java虛擬機，公共語言運行時和JavaScript引擎上運行。在PigPen中，沒有特殊的用戶定義函數（UDF）。定義Clojure函數，匿名或命名，並像在任何Clojure程序中一樣使用它們。該工具由美國按需互聯網流媒體提供商Netflix公司開源。

GitHub上的PigPen

AMPLab SIMR

Apache Spark是在Apache YARN中開發的。但是，到目前為止，在Hadoop MapReduce v1集群上運行Apache Spark相對比較困難，即沒有安裝YARN的集群。通常，用戶必須獲得在某些機器子集上安裝Spark / Scala的權限，這個過程可能非常耗時。 SIMR允許任何有權訪問Hadoop MapReduce v1集群的人開箱即用。用戶可以直接在Hadoop MapReduce v1之上運行Spark，而無需任何管理權限，也無需在任何節點上安裝Spark或Scala。

GitHub上的SIMR

Facebook Corona

“Map-Reduce的下一個版本”，基於自己的Hadoop分支。當前的MapReduce技術的Hadoop實現使用單個作業跟蹤器，這會導致非常大的數據集出現擴展問題.Apache Hadoop開發人員有他們正在創建他們自己的下一代MapReduce，名為YARN，由於公司部署Hadoop和HDFS的高度定製化特性，Facebook工程師對此進行了評估，但是折扣也很明顯。像YARN一樣，Corona產生了多個工作跟蹤器（每個工作一個，在Corona的案例中.

在Github上的Corona

Apache REEF

Apache REEF™（可保留評估程序執行框架）是一個用於為Apache Hadoop™YARN或Apache Mesos™等集群資源管理器開發可移植應用程序的庫。 Apache REEF通過以下功能大大簡化了這些資源管理器的開發：

集中控制流程：Apache REEF將分佈式應用程序的混亂轉變為單個機器中的事件，即作業驅動程序。事件包括容器分配，任務啟動，完成和失敗。對於失敗，Apache REEF盡一切努力使任務拋出的實際“異常”可用於驅動程序。

任務運行時：Apache REEF提供名為Evaluator的Task運行時。評估器在REEF應用程序的每個容器中實例化。評估者可以將數據保存在任務之間的內存中，從而在REEF上實現高效的管道。

支持多個資源管理器：Apache REEF應用程序可以輕鬆地移植到任何受支持的資源管理器。此外，REEF中的新資源管理器很容易支持。

.NET和Java API：Apache REEF是在.NET中編寫YARN或Mesos應用程序的唯一API。此外，單個REEF應用程序可以自由混合和匹配為.NET或Java編寫的任務。

插件：Apache REEF允許插件（稱為“服務”）擴充其功能集，而不會向核心添加膨脹。 REEF包括許多服務，例如任務MPI啟發的組通信（廣播，減少，收集，...）和數據入口之間基於名稱的通信。

Apache REEF網站

Apache Twill

Twill是ApacheHadoop®YARN的抽象，它降低了開發分佈式應用程序的複雜性，使開發人員能夠更專注於業務邏輯。 Twill使用一個簡單的基於線程的模型，Java程序員會發現它很熟悉。 YARN可以被視為集群的計算結構，這意味著像Twill這樣的YARN應用程序可以在任何Hadoop 2集群上運行。

YARN是一個開源應用程序，它允許Hadoop集群變成一組虛擬機。 Weave由Continuuity開發，最初位於Github上，是一個互補的開源應用程序，它使用類似於Java線程的編程模型，可以輕鬆編寫分佈式應用程序。為了消除與Apache上類似命名的項目（名為“Weaver”）的衝突，Weave的名稱在轉移到Apache孵化時更改為Twill。

斜紋作為擴展代理。 Twill是YARN和YARN上任何應用程序之間的中間件層。在開發Twill應用程序時，Twill處理YARN中的API，類似於Java熟悉的多線程應用程序。在Twill中構建多處理的分佈式應用程序非常容易。

Apache Twill Incubator

Damballa

Parkour圖書館使用LISP語言Clojure開發MapReduce程序。 Parkour旨在為Hadoop提供深入的Clojure集成。使用Parkour的程序是普通的Clojure程序，使用標準的Clojure函數而不是新的框架抽象。使用Parkour的程序也是完整的Hadoop程序，可以在原始Java Hadoop MapReduce中完全訪問所有可能的內容。 1.跑酷GitHub項目

Apache Hama

Apache頂級開源項目，允許您在MapReduce之外進行高級分析。許多數據分析技術（如機器學習和圖形算法）都需要迭代計算，這就是批量同步並行模型比“普通”MapReduce更有效的地方。

Hama site

Datasalt Pangool

一種新的MapReduce範例。用於MR作業的新API，其級別高於Java。

Pangool
GitHub Pangool

Apache Tez

Tez是一個開發通用應用程序的提案，該應用程序可用於處理複雜的數據處理任務DAG，並在Apache Hadoop YARN上本機運行。 Tez將MapReduce範例概括為基於將計算表示為數據流圖的更強大的框架。 Tez並不直接面向最終用戶 - 實際上它使開發人員能夠以更好的性能和靈活性構建最終用戶應用程序。傳統上，Hadoop是一個用於處理大量數據的批處理平臺。但是，查詢處理的近實時性能有很多用例。還有一些工作負載，例如機器學習，它們不適合MapReduce範例。 Tez幫助Hadoop解決這些用例問題。 Tez框架構成了Stinger計劃的一部分（基於Hive的Hadoop基於低延遲的SQL類型查詢接口）。

Apache Tez孵化器
Hortonworks Apache Tez頁面

Apache DataFu

DataFu基於它提供了更高級語言的Hadoop MapReduce作業和函數的集合，以執行數據分析。它提供常見統計任務（例如分位數，採樣），PageRank，流會話以及集合和包操作的功能。 DataFu還為MapReduce中的增量數據處理提供Hadoop作業。 DataFu是最初在LinkedIn開發的Pig UDF（包括PageRank，會話，集合操作，抽樣等等）的集合。

DataFu Apache孵化器

Pydoop

Pydoop是一個用於Hadoop的Python MapReduce和HDFS API，它基於C ++管道和C libhdfs API，允許編寫具有HDFS訪問權限的完整MapReduce應用程序。 Pydoop與Hadoop內置的Python編程解決方案相比有幾個優點，即Hadoop Streaming和Jython：它是一個CPython包，它允許您訪問所有標準庫和第三方模塊，其中一些可能不可用。

SF Pydoop網站
Pydoop GitHub項目

Kangaroo

來自Conductor的Kangaroo開源項目，用於編寫消耗Kafka數據的MapReduce作業。介紹性帖子通過使用HFileOutputFormat的MapReduce作業解釋了Conductor從Kafka到HBase的用例加載數據。與其他限制為每個Kafka分區的單個InputSplit的解決方案不同，Kangaroo可以在單個分區的流中以不同的偏移量啟動多個消費者，以提高吞吐量和並行性。

Kangaroo Introduction
Kangaroo GitHub Project

TinkerPop

用Java編寫的TinkerPop Graph計算框架。提供圖形系統供應商可以實現的核心API。有各種類型的圖形系統，包括內存中的圖形庫，OLTP圖形數據庫和OLAP圖形處理器。實現核心接口後，可以使用圖形遍歷語言Gremlin查詢基礎圖形系統，並使用啟用TinkerPop的算法進行處理。對於許多人來說，TinkerPop被視為圖形計算社區的JDBC。

Apache Tinkerpop提案
TinkerPop網站

Pachyderm MapReduce

Pachyderm是一款全新的MapReduce引擎，構建於Docker和CoreOS之上。在Pachyderm MapReduce（PMR）中，作業是Docker容器（微服務）中的HTTP服務器。您為Pachyderm提供Docker鏡像，它將自動在整個群集中將其分發到您的數據旁邊。數據通過HTTP發佈到容器，結果存儲迴文件系統。您可以使用您想要的任何語言實現Web服務器並提取任何庫。 Pachyderm還為系統中的所有作業及其依賴項創建DAG，並自動調度管道，使得每個作業在依賴關係完成之前不會運行。 Pachyderm中的所有東西都“在差異中說話”，因此它確切地知道哪些數據已經改變以及管道的哪些子集需要重新運行。 CoreOS是一個基於Chrome OS的開源輕量級操作系統，實際上CoreOS是Chrome OS的一個分支。 CoreOS僅提供在軟件容器內部署應用程序所需的最少功能，以及用於服務發現和配置共享的內置機制

Pachyderm站點
Pachyderm介紹文章

Apache Beam

Apache Beam是一個開源的統一模型，用於定義和執行數據並行處理管道，以及一組特定於語言的SDK，用於構建管道和運行時特定的Runner以執行它們。

Beam背後的模型源於許多內部Google數據處理項目，包括MapReduce，FlumeJava和Millwheel。該模型最初被稱為“數據流模型”，最初實現為Google Cloud Dataflow，包括用於編寫管道的GitHub上的Java SDK和用於在Google Cloud Platform上執行它們的完全託管服務。

2016年1月，Google和許多合作伙伴以Apache Beam（統一批量+ strEAM處理）的名義提交了數據流編程模型和SDK部分作為Apache孵化器提案。

Apache Beam Proposal
DataFlow Beam和Spark Comparasion

分享到:

閱讀更多 智能時刻 的文章

關鍵字: Hadoop Spark 大數據

Hadoop：MapReduce多路徑輸入與多文件輸出詳解

Hadoop 偽分佈式搭建指南

Hadoop 數據科學

Hadoop DataBase學習筆記

一步一步學習大數據：Hadoop 生態系統與場景

Hadoop 安裝教程

php 操作 Hadoop

第四章 Hadoop 集群搭建

第七章 Hadoop 常用的 shell 命令

第二章 Hadoop 發展背景

不看就虧系列！這裡有完整的 Hadoop 集群搭建教程，和最易懂的 Hadoop 概念！

大數據開發學習，Hadoop-HDFS詳細介紹

03.04 大數據開發學習，Hadoop-HDFS詳細介紹

03.02 看完就能獨自把集群搭起來！Hadoop HDFS完全分佈式環境搭建詳解

03.01 Hadoop HDFS詳細操作

Hbase教程菜鳥教程：Hadoop Hbase入門簡介

Hadoop 3的主要優缺點

FastDFS、Hadoop、TiDB共同點與各自特點

Hadoop YARN：調度性能優化實踐

SQL ON HADOOP 技術框架彙總

Hadoop 數據管理平臺 Apache Falcon

深入淺出 Hadoop YARN

Hadoop、Spark等5種大數據框架對比，你的項目該用哪種？

Hadoop 企業級大數據管理平台CDH 安裝Hadoop組件

Hadoop 基本 Shell命令

揭祕Apache Hadoop YARN，第一部分：集群和YARN基礎

08.28 Hadoop 學習一:jdk配置

最全騰訊等BAT大數據面試99題：hadoop、java、spark、機器算法等

ELK hadoop hbase

系統學習大數據兩大框架 hadoop 和spark

如何系統的學習大數據框架 hadoop 和spark？

大數據計算常用的分布式計算組件——Hadoop、Storm以及Spark

Nutch-Hadoop-MongoDB搭建分佈式爬蟲

好程式設計師：hadoop job 日誌的查看

Hadoop 的主節點如何啓動java程序？

hadoop上運行python——hadoop streaming：搭建數據分析體系79篇

Hadoop 面試，來看這篇就夠了

Hadoop MapReduce v1 系統剖析

Hadoop 之上的數據建模-Data Vault 2.

Hadoop 回收站Trash知識點

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"