面向雲資料庫，超低延遲文件系統PolarFS誕生了

2018-09-04 11:22:33 雲棲社區

摘要

：如同Oracle存在與之匹配的OCFS2，POLARDB作為存儲與計算分離結構的一款數據庫，PolarFS承擔著發揮POLARDB特性至關重要的角色。PolarFS是一款具有超低延遲和高可用能力的分佈式文件系統，其採用了輕量的用戶空間網絡和I／O棧構建，而棄用了對應的內核棧，目的是充分發揮RDMA和NVMe SSD等新興硬件的潛力，極大地降低分佈式非易失數據訪問的端到端延遲。

隨著國內首款Cloud Native自研數據庫POLARDB精彩亮相ICDE 2018的同時，作為其核心支撐和使能平臺的PolarFS文件系統的相關論文"PolarFS: An Ultra-low Latency and Failure Resilient Distributed File System for Shared Storage Cloud Database"也被數據庫頂級會議VLDB 2018錄用。8月，阿里雲數據庫團隊亮相於巴西里約召開的VLDB 2018，對整個業界起到了非常積極的影響。

VLDB(Very Large Data Base)和另外兩大數據庫會議SIGMOD、ICDE構成了數據庫領域的三個頂級會議。VLDB國際會議於1975在美國的弗雷明漢馬 (Framingham MA) 成立，是數據庫研究人員，供應商，參與者，應用開發者，以及用戶一年一度的頂級國際論壇。

VLDB主要由四個主題構成，分別為：Core Database Technology (核心數據庫技術)，Infrastructure for Information Systems (基礎設施信息系統)，Industrial Applications and Experience (工業應用與經驗) 以及 Experiments and Analyses（實驗和分析）。

從09年至今的數據分析來看，VLDB的論文接受率總體是比較低，其中，核心數據庫主題中的論文接受率大概為16.7%；基礎設施信息系統方面的論文接受率大約為17.9%；工業應用與經驗的論文接收比例近視為18%；而實驗和分析部分的為19%左右。由此可見，論文被VLDB接收不是件容易的事情，必須是創新性很高，貢獻很大的論文才有機會被錄用。

本文著重介紹PolarFS的系統設計與實現。

背景

如同Oracle存在與之匹配的OCFS2，POLARDB作為存儲與計算分離結構的一款數據庫，PolarFS承擔著發揮POLARDB特性至關重要的角色。PolarFS是一款具有超低延遲和高可用能力的分佈式文件系統，其採用了輕量的用戶空間網絡和I／O棧構建，而棄用了對應的內核棧，目的是充分發揮RDMA和NVMe SSD等新興硬件的潛力，極大地降低分佈式非易失數據訪問的端到端延遲。目前，PolarFS的3副本跨節點寫入的訪問總延遲已經非常接近單機本地PCIe SSD的延遲水平，成功地使得POLARDB在分佈式多副本架構下仍然能夠發揮出極致的性能。

設計初衷

針對數據庫設計分佈式文件系統會帶來以下幾點好處：

計算節點和存儲節點可以使用不同的服務器硬件，並能獨立地進行定製。例如，計算節點不需要考慮存儲容量和內存容量的比例，其嚴重依賴於應用場景並且難以預測。

多個節點上的存儲資源能夠形成單一的存儲池，這能降低存儲空間碎化、節點間負載不均衡和空間浪費的風險，存儲容量和系統吞吐量也能容易地進行水平擴展。

數據庫應用的持久狀態可下移至分佈式文件系統，由分佈式存儲提供較高的數據可用性和可靠性。因此數據庫的高可用處理可被簡化，也利於數據庫實例在計算節點上靈活快速地遷移。

此外，雲數據庫服務也會因此帶來額外的收益：

雲數據庫可以採用虛擬計算環境如KVM等部署形態，其更安全、更易擴展和更易升級管理。

一些關鍵的數據庫特性，如一寫多讀實例、數據庫快照等可以通過分佈式文件系統的數據共享、檢查點等技術而得以增強。

系統結構

系統組件

PolarFS系統內部主要分為兩層管理：

存儲資源的虛擬化管理，其負責為每個數據庫實例提供一個邏輯存儲空間。

文件系統元數據的管理，其負責在該邏輯存儲空間上實現文件管理，並負責文件併發訪問的同步和互斥。

PolarFS的系統結構如圖所示：

libpfs是一個用戶空間文件系統庫，負責數據庫的I/O接入。
PolarSwitch運行在計算節點上，用於轉發數據庫的I／O請求。
ChunkServer部署在存儲節點上，用於處理I／O請求和節點內的存儲資源分佈。
PolarCtrl是系統的控制平面，它包含了一組實現為微服務的管理者，相應地Agent代理被部署到所有的計算和存儲節點上。

在進一步介紹各部分之前，我們先來了解下PolarFS存儲資源的組織方法：

PolarFS的存儲資源管理單元分為3層：Volume、Chunk、Block。

Volume

Volume是為每個數據庫提供的獨立邏輯存儲空間，其上建立了具體文件系統供此數據庫使用，其大小為10GB至100TB，可充分適用於典型雲數據庫實例的容量要求。

在Volume上存放了具體文件系統實例的元數據。文件系統元數據包括inode、directory entry和空閒資源塊等對象。由於POLARDB採用的是共享文件存儲架構，我們在文件層面實現了文件系統元數據一致性，在每個文件系統中除DB建立的數據文件之外，我們還有用於元數據更新的Journal文件和一個Paxos文件。我們將文件系統元數據的更新首先記錄在Journal文件中，並基於Paxos文件以disk paxos算法實現多個實例對Journal文件的互斥寫訪問。

Chunk

每個Volume內部被劃分為多個Chunk，Chunk是數據分佈的最小粒度，每個Chunk只存放於存儲節點的單個NVMe SSD盤上，其目的是利於數據高可靠和高可用的管理。典型的Chunk大小為10GB，這遠大於其他類似的系統，例如GFS的64MB。

這樣做的優勢是能夠有效地減少Volume的第一級映射元數據量的大小（例如，100TB的Volume只包含10K個映射項）。一方面，全局元數據的存放和管理會更容易；另一方面，這使得元數據可以方便地緩存在內存中，從而有效避免關鍵I/O路徑上的額外元數據訪問開銷。

但這樣做的潛在問題是，當上層數據庫應用出現區域級熱點訪問時，Chunk內熱點無法進一步打散，但是由於我們的每個存儲節點提供的Chunk數量往往遠大於節點數量（節點:Chunk在1:1000量級），PolarFS可支持Chunk的在線遷移，並且服務於大量數據庫實例，因此可以將不同實例的熱點以及同一實例跨Chunk的熱點分佈到不同節點以獲得整體的負載均衡。

Block

在ChunkServer內，Chunk會被進一步劃分為多個Block，其典型大小為64KB。Blocks動態映射到Chunk 中來實現按需分配。Chunk至Block的映射信息由ChunkServer自行管理和保存，除數據Block之外，每個Chunk還包含一些額外Block用來實現Write Ahead Log。我們也將本地映射元數據全部緩存在ChunkServer的內存中，使得用戶數據的I／O訪問能夠全速推進。

下面我們詳細介紹PolarFS的各個系統組件。

libpfs

libpfs是一個輕量級的用戶空間庫，PolarFS採用了編譯到數據庫的形態，替換標準的文件系統接口，這使得全部的I／O路徑都在用戶空間中，數據處理在用戶空間完成，儘可能減少數據的拷貝。這樣做的目的是避免傳統文件系統從內核空間至用戶空間的消息傳遞開銷，尤其數據拷貝的開銷。這對於低延遲硬件的性能發揮尤為重要。

其提供了類Posix的文件系統接口（見下表），因而付出很小的修改代價即可完成數據庫的用戶空間化。

PolarSwitch

PolarSwitch是部署在計算節點的Daemon，它負責I/O請求映射到具體的後端節點。數據庫通過libpfs將I/O請求發送給PolarSwitch，每個請求包含了數據庫實例所在的Volume ID、起始偏移和長度。PolarSwitch將其劃分為對應的一到多個Chunk，並將請求發往Chunk所屬的ChunkServer完成訪問。

ChunkServer

ChunkServer部署在後端存儲節點上。一個存儲節點可以有多個ChunkServer。每個ChunkServer綁定到一個CPU核，並管理一個獨立的NVMe SSD盤，因此ChunkServer之間沒有資源爭搶。

ChunkServer負責Chunk內的資源映射和讀寫。每個Chunk都包括一個WAL，對Chunk的修改會先進Log再修改，保證數據的原子性和持久性。ChunkServer使用了3DXPoint SSD和普通NVMe SSD混合型WAL buffer，Log會優先存放到更快的3DXPoint SSD中。

ChunkServer會複製寫請求到對應的Chunk副本（其他ChunkServer）上，我們通過自己定義的Parallel Raft一致性協議來保證Chunk副本之間在各類故障狀況下數據正確同步和保障已Commit數據不丟失。

PolarCtrl

PolarCtrl是PolarFS集群的控制核心。其主要職責包括：

監控ChunkServer的健康狀況，確定哪些ChunkServer有權屬於PolarFS集群；
Volume創建及Chunk的佈局管理（即Chunk分配到哪些ChunkServer）；
Volume至Chunk的元數據信息維護；
向PolarSwitch推送元信息緩存更新；
監控Volume和Chunk的I/O性能；
週期性地發起副本內和副本間的CRC數據校驗。

PolarCtrl使用了一個關係數據庫雲服務用於管理上述metadata。

中心統控，局部自治的分佈式管理

分佈式系統的設計有兩種範式：中心化和去中心化。中心化的系統包括GFS和HDFS，其包含單中心點，負責維護元數據和集群成員管理。這樣的系統實現相對簡單，但從可用性和擴展性的角度而言，單中心可能會成為全系統的瓶頸。去中心化的系統如Dynamo完全相反，節點間是對等關係，元數據被切分並冗餘放置在所有的節點上。去中心化的系統被認為更可靠，但設計和實現會更復雜。

PolarFS在這兩種設計方式上做了一定權衡，採用了中心統控，局部自治的方式：PolarCtrl是一箇中心化的master，其負責管理任務，如資源管理和處理控制平面的請求如創建Volume。ChunkServer負責Chunk內部映射的管理，以及Chunk間的數據複製。當ChunkServer彼此交互時，通過ParallelRaft一致性協議來處理故障並自動發起Leader選舉，這個過程無需PolarCtrl參與。

PolarCtrl服務由於不直接處理高併發的I／O流，其狀態更新頻率相對較低，因而可採用典型的多節點高可用架構來提供PolarCtrl服務的持續性，當PolarCtrl因崩潰恢復出現的短暫故障間隙，由於PolarSwitch的緩存以及ChunkServer數據平面的局部元數據管理和自主leader選舉的緣故，PolarFS能夠儘量保證絕大部分數據I／O仍能正常服務。

I/O 流程

下面我們通過一個I/O的處理來說明各組件的互動過程。

PolarFS執行寫I/O請求的過程如上圖所示：

POLARDB通過libpfs發送一個寫請求，經由ring buffer發送到PolarSwitch。
PolarSwitch根據本地緩存的元數據，將該請求發送至對應Chunk的主節點。
新寫請求到達後，主節點上的RDMA NIC將寫請求放到一個提前分好的buffer中，並將該請求項加到請求隊列。一個I／O輪詢線程不斷輪詢這個請求隊列，一旦發現新請求到來，它就立即開始處理。
請求通過SPDK寫到硬盤的日誌block，並通過RDMA發向副本節點。這些操作都是異步調用，數據傳輸是併發進行的。
當副本請求到達副本節點，副本節點的RDMA NIC同樣會將其放到預分buffer中並加入到複製隊列。
副本節點上的I／O輪詢線程被觸發，請求通過SPDK異步地寫入Chunk的日誌。
當副本節點的寫請求成功回調後，會通過RDMA向主節點發送一個應答響應。
主節點收到一個複製組中大多數節點的成功返回後，主節點通過SPDK將寫請求應用到數據塊上。
隨後，主節點通過RDMA向PolarSwitch返回。
PolarSwitch標記請求成功並通知上層的POLARDB。

數據副本一致性模型

ParallelRaft協議設計動機

一個產品級別的分佈式存儲系統需要確保所有提交的修改在各種邊界情況下均不丟失。PolarFS在Chunk層面引入一致性協議來保證文件系統數據的可靠性和一致性。設計之初，從工程實現的成熟度考慮，我們選擇了Raft算法，但對於我們構建的超低延遲的高併發存儲系統而言，很快就遇到了一些坑。

Raft為了簡單性和協議的可理解性，採用了高度串行化的設計。日誌在leader和follower上都不允許有空洞，其意味著所有log項會按照順序被follower確認、被leader提交併apply到所有副本上。因此當有大量併發寫請求執行時，會按順序依次提交。處於隊列尾部的請求，必需等待所有之前的請求已被持久化到硬盤並返回後才會被提交和返回，這增加了平均延遲也降低了吞吐量。我們發現當併發I／O深度從8升到32時，I／O吞吐量會降低一半。

Raft並不十分適用於多連接的在高併發環境。實際中leader和follower使用多條連接來傳送日誌很常見。當一個鏈接阻塞或者變慢，log項到達follower的順序就會變亂，也即是說，一些次序靠後的log項會比次序靠前的log項先到。但是，Raft的follower必需按次序接收log項，這就意味著這些log項即使被記錄到硬盤也只能等到前面所有缺失的log項到達後才能返回。並且假如大多數follower都因一些缺失的項被阻塞時，leader也會出現卡頓。我們希望有一個更好的協議可以適應這樣的情形。

由於PolarFS之上運行的是Database事務處理系統，它們在數據庫邏輯層面的並行控制算法使得事務可以交錯或亂序執行的同時還能生成可串行化的結果。這些應用天然就需要容忍標準存儲語義可能出現的I／O亂序完成情況，並由應用自身進一步保證數據一致性。因此我們可以利用這一特點，在PolarFS中依照存儲語義放開Raft一致性協議的某些約束，從而獲得一種更適合高I／O併發能力發揮的一致性協議。

我們在Raft的基礎上，提供了一種改進型的一致性協議ParallelRaft。ParallelRaft的結構與Raft一致，只是放開了其嚴格有序化的約束。

亂序日誌複製

Raft通過兩個方面保障串行化：

當leader發送一個log項給follower，follower需要返回ack來確認該log項已經被收到且記錄，同時也隱式地表明所有之前的log項均已收到且保存完畢。
當leader提交一個log項並廣播至所有follower，它也同時確認了所有之前的log項都已被提交了。ParallelRaft打破了這兩個限制，並讓這些步驟可亂序執行。

因此，ParallelRaft與Raft最根本的不同在於，當某個entry提交成功時，並不意味著之前的所有entry都已成功提交。因此我們需要保證：

在這種情況下，單個存儲的狀態不會違反存儲語義的正確性；
所有已提交的entry在各種邊界情況下均不會丟失；

有了這兩點，結合數據庫或其他應用普遍存在的對存儲I／O亂序完成的默認容忍能力，就可以保證它們在PolarFS上的正常運轉，並獲得PolarFS提供的數據可靠性。

ParallelRaft的亂序執行遵循如下原則：

當寫入的Log項彼此的存儲範圍沒有交疊，那麼就認為Log項無衝突可以亂序執行；
否則，衝突的Log項將按照寫入次序依次完成。

容易知道，依照此原則完成的I／O不會違反傳統存儲語義的正確性。

接下來我們來看log的ack-commit-apply環節是如何因此得到優化並且保持一致性的。

亂序確認（ack）：當收到來自leader的一個log項後，Raft follower會在它及其所有之前的log項都持久化後，才發送ack。ParallelRaft則不同，任何log entry成功持久化後均能立即返回，這樣就優化了系統的平均延遲。
亂序提交（commit）：Raft leader串行提交log項，一個log項只有之前的所有項提交之後才能提交。而ParallelRaft的leader在一個log項的多數副本已經確認之後即可提交。這符合存儲系統的語義，例如，NVMe SSD驅動並不檢查讀寫命令的LBA來保證並行命令的次序，對命令的完成次序也沒有任何保證。
亂序應用（apply）：對於Raft，所有log項都按嚴格的次序apply，因此所有副本的數據文件都是一致的。但是，ParallelRaft由於亂序的確認和提交，各副本的log都可能在不同位置出現空洞，這裡的挑戰是，如何保證前面log項有缺失時，安全地apply一個log項？

ParallelRaft引入了一種新型的數據結構look behind buffer來解決apply中的問題。

ParallelRaft的每個log項都附帶有一個look behind buffer。look behind buffer存放了前N個log項修改的LBA摘要信息。
look behind buffer的作用就像log空洞上架設的橋樑，N表示橋樑的寬度，也就是允許單個空洞的最大長度，N的具體取值可根據網絡連續缺失log項的概率大小，靜態地調整為合適的值，以保證log橋樑的連續性。
通過look behind buffer，follower能夠知道一個log項是否衝突，也就是說是否有缺失的前序log項修改了範圍重疊的LBAs。沒有衝突的log項能被安全apply。如有衝突，它們會被加到一個pending list，待之前缺失的衝突log項apply之後，才會接著apply。

通過上述的異步ack、異步commit和異步apply，PolarFS的chunk log entry的寫入和提交避免了次序造成的額外等待時間，從而有效縮減了高併發3副本寫的平均時延。

ParallelRaft協議正確性

我們在ParallelRaft的設計中，確保了Raft協議關鍵特性不丟失，從而保障了新協議的正確性。

ParallelRaft協議的設計繼承了原有Raft協議的Election Safety、Leader Append-Only及Log Matching特性。
衝突log會以嚴格的次序提交，因此協議的State Machine Safety特性能夠最終得以保證。
我們在Leader選舉階段額外引入了一個Merge階段，填補Leader中log的空洞，能夠有效保障協議的Leader Completeness特性。

PolarFS中與POLARDB緊密相關的設計

文件系統多副本高速寫入——數據庫單實例的超高TPS，數據高可靠

PolarFS設計中採用瞭如下技術以充分發揮I/O性能：

PolarFS採用了綁定CPU的單線程有限狀態機的方式處理I/O，避免了多線程I/O pipeline方式的上下文切換開銷。
PolarFS優化了內存的分配，採用MemoryPool減少內存對象構造和析構的開銷，採用巨頁來降低分頁和TLB更新的開銷。
PolarFS通過中心加局部自治的結構，所有元數據均緩存在系統各部件的內存中，基本完全避免了額外的元數據I/O。
PolarFS採用了全用戶空間I/O棧，包括RDMA和SPDK，避免了內核網絡棧和存儲棧的開銷。

在相同硬件環境下的對比測試，PolarFS中數據塊3副本寫入性能接近於單副本本地SSD的延遲性能。從而在保障數據可靠性的同時，極大地提升POLARDB的單實例TPS性能。

下圖是我們採用Sysbench對不同負載進行的初步測試比較。

POLARDB on PolarFS
Alibaba MySQL Cloud Service RDS

用例負載：OLTP，只讀、只寫（update : delete : insert = 2:1:1）、讀寫混合（read : write = 7:2）。數據庫測試集數據量為500GB。

可以發現POLARDB在PolarFS下取得了較好的性能，PolarFS同時支持了POLARDB的高TPS和數據的高可靠性。

文件系統共享訪問——寫多讀的數據庫QPS強擴展，數據庫實例的Failover

PolarFS是共享訪問的分佈式文件系統，每個文件系統實例都有相應的Journal文件和與之對應的Paxos文件。Journal文件記錄了metadata的修改歷史，是共享實例之間元數據同步的中心。Journal文件邏輯上是一個固定大小的循環buffer。PolarFS會根據水位來回收journal。Paxos文件基於Disk Paxos實現了分佈式互斥鎖。

由於journal對於PolarFS非常關鍵，它們的修改必需被Paxos互斥鎖保護。如果一個節點希望在journal中追加項，其必需使用DiskPaxos算法來獲取Paxos文件中的鎖。通常，鎖的使用者會在記錄持久化後馬上釋放鎖。但是一些故障情況下使用者不釋放鎖。為此在Paxos互斥鎖上分配有一個租約lease。其他競爭者可以重啟競爭過程。當PolarFS當節點開始同步其他節點修改的元數據時，它從上次掃描的位置掃描到journal末尾，將新entry更新到memory cache中。

下圖展示了文件系統元數據更新和同步的過程。

節點1分配塊201至文件316後，請求互斥鎖，並獲得。
Node 1開始記錄事務至journal中。最後寫入項標記為pending tail。當所有的項記錄之後，pending tail變成journal的有效tail。
Node1更新superblock，記錄修改的元數據。與此同時，node2嘗試獲取node1擁有的互斥鎖，Node2會失敗重試。
Node2在Node1釋放lock後拿到鎖，但journal中node1追加的新項決定了node2的本地元數據是過時的。
Node2掃描新項後釋放lock。然後node2回滾未記錄的事務並更新本地metadata。最後Node2進行事務重試。
Node3開始自動同步元數據，它只需要load增量項並在它本地重放即可。

PolarFS的上述共享機制非常適合POLARDB一寫多讀的典型應用擴展模式。一寫多讀模式下沒有鎖爭用開銷，只讀實例可以通過原子I/O無鎖獲取Journal信息，從而使得POLARDB可以提供近線性的QPS性能擴展。

由於PolarFS支持了基本的多寫一致性保障，當可寫實例出現故障時，POLARDB能夠方便地將只讀實例升級為可寫實例，而不必擔心底層存儲產生不一致問題，因而方便地提供了數據庫實例Failover的功能。

**文件系統級快照——POLARDB的瞬時邏輯備份

對於百TB級超大數據庫實例的備份而言，數據庫快照是必須支持的功能。

PolarFS採用了自有的專利快照技術，能夠基於位於底層的多個ChunkServer的局部快照，構建Volume上的統一的文件系統即時映像。POLARDB利用自身數據庫的日誌，能夠基於此文件系統映像快速構建出此具體時點的數據庫快照，從而有效支持數據庫備份和數據分析的需求。

可以發現，POLARDB的高性能、強擴展、輕運維等具備競爭優勢的優異特性，與PolarFS的緊密協作息息相關，PolarFS發揮了強大的使能作用。

結論

PolarFS是一個專為雲數據庫而設計的分佈式文件系統，其能夠支持跨節點高可靠性同時提供極致的性能。PolarFS採用了新興硬件和先進的優化技術，例如OS-bypass和zero-copy，使得PolarFS中數據塊3副本寫入性能接近於單副本本地SSD的延遲性能。PolarFS在用戶空間實現了POSIX兼容接口，使得POLARDB等數據庫服務能夠儘量少地修改即可獲得PolarFS帶來的高性能的優勢。

可以看到，面向數據庫的專有文件系統，是保障未來數據庫技術領先的一個不可或缺的關鍵一環。數據庫內核技術的進展及其專有文件系統的使能，是一個相輔相成的演進過程，二者的結合也會隨著當今系統技術的進步而愈加緊密。

未來我們將探索NVM和FPGA等新硬件，以期通過文件系統與數據庫的深度結合來進一步優化POLARDB數據庫的性能。

作者：鳴嵩，弘然，明書，旭危，寧進，文義，韓逸，翊雲

感謝POLARDB團隊全體同學

分享到:

閱讀更多 雲棲社區 的文章

關鍵字: 數據結構 HDFS 數據庫

數據庫+分佈式緩存+JVM+Spring等

騰訊Java崗三面，我居然掛了！算法+數據庫+設計模式，都答不出來

java入門看這篇就夠了！java+數據庫+SSM框架+spring+SpringBoot

史上最全499道Java面試題：JVM+分佈式+算法+鎖+MQ+微服務+數據庫

大佬終於講明白了大數據基礎框架、數據庫、大數據分析分佈式技術

伯俊軟件新款ERP全面集成阿里雲PolarDB 數據庫，成本下降50%

京東Java高開崗三面算法+數據庫+設計模式，複習1個月成功拿offer

給light評個級

BATJ大廠面試題之Java併發、spring、Netty，數據庫，緩存，Jvm

全網最全Java面試300題：算法+緩存+TCP+JVM+搜索+分佈式+數據庫

最強阿里及大廠350道面試大全：框架+數據庫+併發+開源+微服務

03.06 小鳥雲新動作？5000臺免費雲服務器每日發放

微盟 10 天貶值 27 億，數據庫：與我何瓜

03.03 微盟 10 天貶值 27 億，數據庫：與我何瓜

offer計劃之複習：基礎+算法+數據庫+設計模式+mybatis+spring

02.26 offer計劃之複習：基礎+算法+數據庫+設計模式+mybatis+spring

ArcGIS生成等值線圖的方法

面試清單（Java崗)Java+JVM+數據庫+算法+Spring+中間件+設計模式

VBA代碼如何限制文本框的輸入

VBA代碼限制文本框的輸入

12.26 展望2020，Java學習書單分享：Java核心+框架+數據庫+架構+面試題

12.19 美團3面（Java崗）：TCP+索引+數據庫+算法+ZK+紅黑樹+緩存等

美團3面（Java崗）：TCP+索引+數據庫+算法+ZK+紅黑樹+緩存等

知乎高贊丨面試清單（Java崗）：JVM+數據庫+算法+Spring+中間件

新突破！華為河圖引擎開源，像使用“數據庫”一樣使用“大數據”

華為開源“河圖引擎”：像使用“數據庫”一樣使用“大數據”

華為侯金龍：讓合作伙伴像使用“數據庫”一樣使用“大數據”

阿里雲雙11在線銷售破10億彈性計算、數據庫、IoT等成"爆款"

螞蟻金服技術面試題：數據庫+緩存+併發編程+Spring+JVM+Netty等

車通雲郝鼎文：打造汽配供應鏈閉環，數據庫、供應鏈、AI缺一不可

BAT高級Java面試題：JVM+Redis+Spring+Mysql+數據庫+多線程+算法

一個非科班出生Java程序員的阿里之路：JVM+分佈式+Spring+數據庫

實戰分享：小程序雲開發玩轉訂閱消息

Java進階備戰金九銀十88道真題：多線程+集合+鎖+JVM+數據庫+算法

一個Prometheus label的生命週期

空中課堂（42）Carry Protocol讓用戶從線下零售數據中獲得獎勵

數據庫，究竟要怎樣呵護你？

shopxo安裝教程-支持PC/wap/微信小程序/支付寶小程序的商城系統

微信小程序雲開發之獲取小程序用戶信息

09.17 當雲存儲遇見區塊鏈

區塊鏈是否本身是個騙局？它的本身是否有弊端？

08.24 磁盤陣列基礎知識學習

一看就能懂的區塊鏈入門

產品、運營需知的用戶數據採集體系打造方法

06.14 黑客：我們決定無條件刪除A站被洩漏數據庫

06.10 全球免費資源數據庫送給你

03.03 知識點滴：Java裡十大低級錯誤，80％的人遇到過，要趕緊改回來

02.01 區塊鏈升級優化而來的以特幣

小米太無恥了。

小米高管不只口嗨了，在國內拳打友商，在國外卻開始下跪了。下一步，我猜小米會喊，高通爸爸，人家愛死你了，人家已經五體投地了喲。

蹭熱點！說說我理解的手機包裝盒事件。

今早醒來刷頭條，發現大批米系自媒體鋪天蓋地發文嘲諷華為系自媒體，忍不住好奇瞭解了一下情況，原來是剛發佈的一加8 海外版手機的手機包裝盒上面印了一句話:with easy access to the Google apps you use most.而這句話也印在前段時間發佈的小

蘋果公司正式發佈iPhone SE二代手機

新品名為“iPhoneSE”，擁有跟iPhone 8相似的外觀，搭載了蘋果當前最新的A13仿生芯片，具備IP67級別防水防塵能力，配備4.7英寸LCD材質屏幕，支持原彩顯示，配備了Touch ID指紋識別。

華為河圖、麒麟芯片和鴻蒙OS三駕馬車並行？華為生態建設佈局深遠

至於受很多人關注的華為河圖全面落地問題，官方有消息稱，2020年第二季度會提供100個華為河圖測試點，測試點到第四季度會增加至1000個，測試覆蓋空間包括智慧園區、旅遊景點、高鐵站和機場等。

小米高管表示，四千毫安時 5G 手機，和三千多毫安時 4G 手機一樣

小米科技高管盧偉冰在近日表示，5G旗艦手機如果5G網絡全開，功耗會比4G手機高20%，4000mAh的5G手機大約等於4G手機的3200mAH；今年Redmi堅持把5G手機的容量控制在4500mAh以上，也是考慮到5G網絡耗電大的原因，今年很多5G智能手機均採用大電池的設計。

5G畫風變了：麒麟985落地首跑，榮耀坐上開往高端的「地鐵」

榮耀30Pro/30 Pro+同時搭載麒麟990 5G SoC，相應的其它配置更高：Wi-Fi6+，支持紅外遙控，USB 3.0 Type-C接口。

旗艦手機標配Wifi 6 換Wifi 6路由器的時機到了嗎？

現在，家庭寬帶都在500M左右，大部分手機也不支持Wifi6標準，換Wifi 6無線路由器有點早，因為換了Wifi 6無線路由器網速也不會變快。

2020年5G手機賣不動？繼蘋果砍單25%之後，華為小米紛紛跟砍？

都說蘋果手機賣不動了，可我看想買iPhone手機的人還是那麼多，不然之前蘋果公司怎麼會限購？數據顯示，3月份在國內的 iPhone 銷量比 2 月份激增 416%，達到約 250 萬部。

幹翻華為P40系列榮耀30也玩中

而今天的華為發佈會上，榮耀30、30 Pro、30 Pro +3個版本中、大、特大杯齊亮相，又一片全新5G SOC，麒麟985也要登場。

程序員辭互聯網工作，跨行傳統上市公司，上班第1天就蒙了

原來男子是從事互聯網工作，後面覺得是互聯網寒冬來了，就堅決辭去互聯網工作，跨行選擇了一個教育傳統上市公司，可是第1天上班就蒙了，公司讓做的活兒太死板了，沒有發揮空間，同事一點都不友善，領導不放權，而且管理線超級單一，氛圍一點都不一樣，所以想離職。

蘋果發佈新款iPhoneSE，3299元起售

北京時間4月15日晚，蘋果正式發佈了新款iPhone SE，搭載了A13仿生芯片，支持最新的iOS 13系統，支持 18W快充，也支持Qi無線充電。SE機型蘋果到目前為止只發布了兩款，這是iPhone產品體系裡小屏和低價的典型機器。

我很糾結：我究竟適不適合做亞馬遜電商？看了這三條你就知道了

請仔細閱讀，關於跨境電商你想知道的都在這兒

政府對於跨境電商行業的大力支持給咱們廣大跨境電商賣家吃了一顆“定心丸”。我們所做的跨境電商事業在一定程度上不再是為個人謀利益，而是成為了中國產品走向世界，為國家賺取外匯的主力軍。

騙子手段太“精明”：商家賠了貨物又賠款，亞馬遜平臺騙術大揭祕

在開始文章的乾貨分享之前，先給大家講一個商家被用戶勒索的案例。有一位朋友剛剛加入亞馬遜跨境電商平臺兩個多月，在這期間有位美國用戶在他店鋪裡面購買了一個毛巾架。

做跨境電商這麼多年，今天才知道給國外客戶發文件原來這麼簡單

做過跨境電商朋友肯定知道，很多國外客戶對於有些商品看不懂說明書，想索要商品使用視頻教程，畢竟視頻信息量大，容易理解和快速上手。

值得收藏！三類賣家三種選品方案，總有適合你的一個……

網上很多所謂的“大佬”喜歡吹噓用某某工具就可以迅速選品效率，迅速取得很高效率等等，其實這類人就是在賣軟件，收培訓費用…

萬萬沒想到！亞馬遜平臺上面賣床單竟營收一個億！你還在等什麼？

做店鋪這麼多年，今天才知道我的listing突然被封，竟是因為……

亞馬遜小白看過來！請採納這些：亞馬遜選品和運營的小建議

亞馬遜賣家如何爆單？跨境精細化運營攻略必看

不收保證金、入住費、年費，還免三個月佣金，我也想入駐這個平臺

咱們今天不說主打歐美市場的亞馬遜，只談一下以東南亞市場為主的Shopee。好多人都聽說過，但是沒有真正瞭解過，好多人想加入Shopee但是顧慮重重，今天我來給大家普及一下關於Shopee小秘密。

馬雲終於要辭職了，留下的話句句觸動人心

去年，在教師節這天，阿里巴巴集團創始人馬雲今天公開信宣佈：一年後的阿里巴巴20週年之際，即2019年9月10日，也就是今天，他將不再擔任集團董事局主席，卻留下句句觸動心靈的話！！

等等，明年5G手機將迎來大降價

11月26日下午，聯發科技（MediaTek）在深圳舉辦“聯發科技 5G方案發布暨全球合作伙伴大會”，正式發佈了全新的5G新芯片品牌——“天璣”，同時帶來了首款集成式旗艦級5G移動平臺——天璣1000。

微信公開課PRO版2019正在進行時，往屆各自都有什麼黑科技

微信公開課pro版2019，為期兩天微信大會正在廣州火熱進行中，本次會議主題為：同行WITHUS。微信這一款超級應用，已經深入到我們生活的方方面面，所以這48小時的未來盛宴必將吸引無數眼球。

推出「信任分」升級「閃購」，美團本地生活這盤棋有多大？

小海按：美團的超級App夢想更近了？Tech星球文 | 馬微冰陳橋輝頭圖 | IC Photo王興曾說，“太多人關注邊界，而不關注核心。”

5G我們超越了6G我們也將領先! 美國為什麼會害怕失去5G領導地位呢

而且在我們國內和美企中，有相當一部分覺得我們研發不了5G，更特說超越他們了。由於，我們在科技領域一直是，裝備一代，研發一代，探索一代。

界讀｜華為：幫助英國共渡疫情難關，無端批評令英國蒙受損失

前段時間，英國首相呼籲員工在家辦公的第二天，英國網絡就出現大面積崩潰現象，不僅無法正常上網，而且電話也不能打、短信也不能發，給用戶造成了很大的困擾。

為什麼華為今天可以傲視群雄，在世界上立於不敗之地？

為什麼華為今天可以傲視群雄，在世界上立於不敗之地？因為五年內沒有人能超過整個5G領域，所以美國人無法超越，為什麼？

血戰「在線辦公」，阿里、騰訊、字節、華為的底牌與大殺器

小海按：前端殺手級應用，後端雲服務，在線辦公「四小龍」之戰開啟。本來，在線辦公更多的是阿里巴巴的主場。

2020年最強拍照旗艦來了華為P40系列多項業界首創香！

原來華為P40Pro+在上一代P30 Pro潛望式鏡頭橫置長焦鏡頭模組和感光器件基礎之上，進一步採用全新的多反射潛望式光路摺疊技術，實現5次反射光路，光程比上一代潛望式長焦提升178%。

今天聊一聊直播

今天聊一聊直播突然談到這個話題，是因為後知後覺的我，突然發現幾乎所有大互聯網公司都進軍了網絡直播行業，或者正在準備進軍直播領域。

通過直播賺錢不容易，既要豁得出去，又要端得起來

今天咱們繼續聊一聊直播吧當下，像頭條、網易、百度等公司，看上去和直播八竿子打不著的公司，也開始涉足直播了。

AI和自動化技術聯手，最終會讓60%的工人失去現有的飯碗。

並非危言聳聽，AI和自動化結合，勢必會把數十億人類踢出勞動力市場，數量巨大的失業工人，將會構成一個規模龐大的新階級。AI最終會讓60%的工人失去現有的飯碗。

這個網還能不能好好上了？今日全球IPv4地址正式耗盡

長期以來，一直令人擔心的IPv4地址耗盡的問題，今天這一刻終於發生——所有43億個IPv4地址已分配完畢，這意味著沒有更多的IPv4地址可以分配給ISP和其他大型網絡基礎設施提供商。

12306系統不行？內行人告訴你它有多牛，阿里騰訊高手去了也膜拜

很多人認為12306系統很不好，之前我也是這麼認為的，因為我覺得像雙十一這麼大流量，阿里都能承受住，為什麼12306不行，這其實是誤解，12306擁有著神一般的架構設計，平時的壓力比淘寶大的多。

有內幕？美國防部授與微軟百億雲合同，亞馬遜不滿發起訴訟

據路透社消息，10月25日，美國防部將高達100億美元的十年期戰略合同授予微軟公司，這一舉動引起亞馬遜的不滿。

未來之芯--RISC-V總部從美國遷往瑞士，華為、阿里是其成員

北京時間26日消息，國際開源芯片技術組織RISC-V基金會週一宣佈，由於擔心美國的貿易限制，計劃將總部從美國特拉華州遷往瑞士。該基金會首席執行官卡利絲塔-雷蒙德（Calista Redmond）表示，希望確保美國以外的大學、政府和企業能夠幫助開發其開源技術。

神話還能繼續嗎？幾度過山車，比特幣半年來首次跌破7000美元

比特幣價格今年如同坐上過山車，年初的3000美元到最高13861.9美元，今天跌破7000美元，算是這半年來的最低點了。說起比特幣，給人印象最深刻的，莫過於2017年末到2018年初的暴漲了吧。

劉強東卸任後，突然宣佈一個“好消息”，讓馬雲措手不及！

蘋果的瘋狂其實從未停止，AirPower或將重新啟航

可是，蘋果事實上一直都在推動終端產品進入全面無線時代，所以他們是不太可能在真正意義上放棄這款產品。有外媒稱，蘋果目前正準備重新啟動AirPower項目。

曾保護近4億中國人的電腦，卻因得罪阿里、騰訊，慘遭市場淘汰

曾保護近4億中國人的電腦，卻因得罪阿里、騰訊，慘遭市場淘汰隨著網絡的不斷髮展，如何確保網絡信息安全成為人們十分重視的問題。

互聯網流量需求增大希臘民眾“宅生活”考驗網速

英國諮詢公司Tech4i2報告指出，在疫情期間，希臘的互聯網流量需求至少增長50%，但網速僅下降1.2%，而在大多數歐洲國家，網速平均下降了5%-7%。

互聯網科技企業，傳統辦公模式該走向何處?

　　紐約，處於美國疫情震中的城市，工作模式大多是使用公司發放的電腦進行遠程辦公，而在這之前，部分互聯網企業本來默認每週三為在家辦公日，所以大家對在線辦公可以說駕輕就熟。

微信又悄悄上線一新功能～網友卻開始擔心

備註後的群聊名稱僅自己可見往後再也不用為分清亂糟糟的微信群聊而困擾不過從目前來看只有iOS端上線了這一新功能安卓用戶還需要再等等並且此次更新為後臺更新無需到AppStore更新即可看到這個新功能該功能上線後網友們紛紛站隊但也有網友視野開闊擔心起另一件事對於微信新功能群備註你覺得實

正式確認！孫正義退出市值5959億阿里，20年與馬雲成就彼此

文：小娜說到孫正義這個名字，我們很多人都知道他是日本軟銀集團的創始人兼總裁，但他除此之外也有另外的身份，那就是阿里巴巴最大的董事之一。阿里之所以成為今天的阿里，與孫正義的投資是分不開的。當時，馬雲和孫正義僅僅交談了五分鐘，孫正義當即就決定投資阿里，而且一下就投資2000萬美元。

科技添柴“非接觸經濟”升溫

新華社記者王全超攝中國同拉美和加勒比國家舉行視頻工作會議，就新冠肺炎疫情防控開展交流。亞歷山大·培尼亞攝在中國科學技術大學附屬第一醫院，乘客用“無接觸電梯按鈕”操作電梯。

好像在哪見過？華為nova7官宣餘承東:何必只有一點點

全新iPhoneSE根據此前爆料，此次華為nova7系列將有nova7 SE、nova7和nova7 Pro三個版本，可能會採用“麒麟985+麒麟990”或“麒麟820+麒麟985+麒麟990”兩種芯片組合。

行業紅利、資本湧入，疫情後的在線教育聚師網如何“涅槃”

2018年，線下培訓機構受到了相關部門政策的影響，整體發展勢頭趨降，然而市場上對於教育的需求卻在不斷增加，於是，大量學員開始把需求放到了線上，其中，職業教育在這方面的變化尤其明顯。

數字貨幣真的來了？首吃螃蟹者傳出，碰一碰功能露臉

蘇州相城區政府相關人士對此未予置評，區金融局人士表示“不便答覆”，其他多個當地機關單位稱尚不知情，央行蘇州市中心支行表示“以總行口徑為準”，央行總行方面未予確認。新京報記者程維妙陳鵬編輯嶽彩周校對薛京寧

實例 | 200 SMART運動控制基本指令詳解

C_Dir:表示電機的當前方向信號狀態，0 = 正向 1 = 反向。 START:觸發開始發脈衝信號，必須要在運動軸空閒時發送一次信號，必須用邊沿觸發。