深度學習之Attention模型詳解

2019-11-26 16:55:00 THU數據派

轉載自：Datawhale（ID：Datawhale）

本文8434字41圖，建議閱讀22分鐘。

本文介紹深度學習中的Attention模型。

Attention的產生

起因：《Sequence to Sequence Learning with Neural Networks》

Attention模型的引入原因：

seq2seq將輸入序列都壓縮成一個固定大小的隱變量，就像我們的壓縮文件一樣，這個過程是有損壓縮的，會迫使丟失許多輸入序列中的信息；
存在著難以對齊的問題。比如中譯音“我愛你”“I love you”,輸入序列中的“我”應該與“I”對齊(貢獻最大)，然而在seq2seq模型中，“我”對"I"，"love"，"you"的貢獻都是一致的。

Attention的發展

Show, attend and tell: Neural image caption generation with visual attention

本文可以算是第一篇Attention論文。

該任務是實現圖文轉換。與前面講述的seq2seq的問題一樣，在之前的圖文轉換任務中也是存在著難以對齊的問題。所謂難以對齊就是毫無重點。

本文提出了兩種attention：

sort Attention
hard Attention

本文的模型結構：

將圖片通過一個CNN轉換成的LD.這裡稱L個向量為L個註釋向量(annotation vector)，D為特徵維度，可以認為提取了圖片中L個區域的特徵。對這L個區域向量加權相加來表示這張圖片。由於不同時刻的關注點是不同的，annotation vector還要與decoder中的隱狀態進行交互，以便知道下一時刻的關注區域。

這裡編碼器是VGG，解碼器是LSTM。LTSM輸入是不同時刻的圖片的關注點信息，然後生成當前時刻的單詞。

Attention的計算

如上所屬，attention的值不僅與annotation vector 有關，還與上一時刻解碼器的隱狀態有關。因此有：

其中t表示時刻t，i表示第i個區域，a是我們得到的attention weight分佈。

f實際上是對齊函數，用於計算對齊的分數，常見的對齊函數有：dot product，general，multilayer perceptron。

1，Soft attention：直接使用attention的權重對L個向量加權相加，這麼做的好處是整個問題是可微的，可以利用BP end to end。

2，Hard attention：Hard attention很粗暴，挑出最大權重的向量，剔除其餘向量(置0)。顯然這種形式的模型是不可微的，為了實現BP，這裡採用蒙特卡洛採樣的方法來估計模塊的梯度。

幫助我們在t時刻選出了第i個向量是我們最後選中的的向量，引入一個變量,當區域i被選中時取值為1，否則為0.則有：

問題如何生成,在本文中，將視為隱變量，為參數是的多元伯努利分佈(伯努利是兩點分佈)

$$P(s_{t,i}=1|s_{t

這個可以認為是我們的帶隱變量的目標函數。

對目標函數求梯度：

用N次蒙特卡洛採用(拋銀幣)來近似：

在用蒙特卡洛方法估計梯度時可以用滑動平均來減小梯度的方差。在第k個mini-batch時，滑動平均被估計為先前對數似然伴隨指數衰減的累加和：

總結

總的來說，這裡率先引入了soft attention與hard attention，通過在每一時刻給圖片各個區域分配attention權重，來提升語句與特定圖塊的相關性。

結果：

Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation

本文可以算是第一篇在seq2seq中引入的Attention的論文(2015.07)

本文同樣涉及了soft attention，hard attention。求解形式與上一篇並無差異。

並且文中考慮了四種應用場景：1. Neural Machine Translation ；2. Image Caption Generation ；3. Video Description Generation ；4. End-to-End Neural Speech Recognition。

Effective Approaches to Attention-based Neural Machine Translation

本文比上一篇晚發表了2個月。。。

文章提出了兩種attention的改進版本，即global attention和local attention。

global attention

global attention 在計算context vector 的時候會考慮encoder所產生的全部hidden state。其實就是第一篇文章的attetion方法。

2.local attention

本文認為local attention為hard attention和soft attention的混合體(優勢上的混合)，因為他的計算複雜度要低於global attention，soft attention，而且與hard attention 不同的是，local attention 幾乎處處可微，易於訓練。

local attention克服了每個source hidden state都要掃描的缺點，計算開銷大，而且對於長句不利，為了提升效率，提出了 local attention。每次只focus 一部分的source position。

這裡 context vector 的計算只focus窗口內的2D+1個source hidden state。設是一個source position index，可以理解為 attention的“焦點”，作為模型的參數，D根據經驗來選擇。

關於的計算，文章給出了兩種計算方案：

1） Monotonic alignment(local-m)

2)predictive alignment(local-p)

其中和是模型的參數，S是source sentence的長度，易知.

權重的計算為：

可以看出，距離中心越遠的位置，其位置上的source hidden state 對應的權重就會被壓縮地越厲害。這裡設置為D/2。

這裡的，

其中score函數其實就是第一篇裡介紹的對齊函數，存在三種dot product，general，concat。

實驗對比：

Attention-Based Multi-Perspective Convolutional Neural Networks for Textual Similarity Measurement

本文的任務是STS(semantic textual similarity)指給定一個檢索句子和比較的句子，計算他們的相似度得分。

過去的模型，把輸入的句子獨立對待，忽略了句子的上下文交互。attention也就是因此而引入的。

本文的基礎模型結構是：MPCNN(multi-perspective con- volutional neural network model)，主要包括兩個部分：1，multi-perspective sentence model；2， structured similarity measurement layer。

multi-perspective sentence model

multi-perspective sentence model 使用的是卷積神經網絡，通過使用不同類型的卷積核，不同類型的池化方式，不同大小的卷積窗口，來得到每個句子的不同粒度的表達。

a. 卷積層有兩種卷積的方式：(1)粒度為word的卷積；(2)粒度為embedding 維度上的卷積。前者相當於n-gram特徵抽取，後者抽取的是向量每一維度上的信息。作者認為後面這種方式由於粒度更小有助於充分地提取出輸入的特徵信息。作者使用了這兩種方式以獲得更豐富的表達。

b. 卷積窗口大小：不同卷積窗口的大小捕捉不同n-gram的長度下的信息，這裡窗口大小是{1, 2, 3，∞}, 表示輸入句子中unigrams, bigrams, trigrams和不使用卷積層。

c. 池化方式：池化層可以保留一個卷積模型中最顯著和最通用的特性，這裡使用max，min，mean三種方式。

Structured Similarity Measurement layer

Structured Similarity Measurement Layer的目標是計算句子表達的相似度。

Structured Similarity Measurement Layer的目標是計算句子表達的相似度。作者認為最後生成的句子向量中的每一個部分的意義各不相同，直接應用傳統的相似度計算方法如餘弦相似度在兩個句子向量上並不是最優的，應該對句子向量中的各個部分進行相應的比較和計算(Structured Comparision)。為了使得句子向量中的局部間的比較和計算更加有效，我們需要考慮如下方面：

(1) 是否來自相同的building block；(2) 是否來自相同卷積窗口大小下的卷積結果；(3) 是否來自相同的pooling層；(4) 是否來自相同的Feature Map；

至少滿足以上兩個條件時，才比較句子中的相應部分時，作者採用了兩種算法比較相似性。一種只針對粒度為詞的卷積，另一種則同時針對粒度為詞的卷積和粒度為embedding 維度上的卷積。

在句子局部的相似度計算之後，作者疊加了兩層的線性層，並在中間使用了tanh激活函數，最後使用log-softmax輸出。更多的細節參考He et al. 2015。

Attention-Based Input Interaction Layer

本文作者在上述模型的基礎上，增加了一層基於attention的交互層。其目的就是在剛做完embedding以後，給兩個句子更相關的部分賦予更多的權值。

輸入序列,其中,銅鼓計算對應向量的餘弦相似度得到attention。

得到了attention權值矩陣後，可以計算每個句子對應的attention向量，並歸一化：

最後拼接起來得到attention 的re-weighted向量：

作者沒有添加額外的參數，只是簡單的餘弦距離去作為attention權值然後做歸一化，並在實驗中取得了不錯的結果。

ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs

本文的任務是(sentence pair)句子配對。這包括了Answer Selection（AS），Paraphrase identification（PI），Textual entailment（TE）。

基礎模型：BCNN(Basic Bi-CNN)。BCNN有四個部分：1. 輸入層，2. 卷積層，3. 池化層，4. 輸出層。特別要指出卷積層。這裡卷積層採用的是寬卷積（Wide convolution）。即對句子的邊緣部分進行，使得輸出的序列長度大於輸入的序列長度。(寬卷積常用於卷積核大小相對於輸入向量長度較大時)

這裡提出了三種ABCNN

ABCNN-1

ttention 矩陣的計算：

可以從上圖看出矩陣中的一列代表一個詞，行代表特徵。

這裡的match-score可以用多種方式進行計算，本文采用的是來計算。

句子中attention特徵的計算：

這裡的輸出被送入到了卷積層。

ABCNN-2

這裡Attention矩陣的計算方式與ABCNN-1類似，不同的是在ABCNN-1的基礎上對兩個句子的unit進行求和作為unit的attention 值，即

然後利用這個attention值對卷積層的輸出進行加權，具體公式如下：

這裡的輸出輸入到了pooling層中。

ABCNN-3

將上述兩個結構進行疊加。在輸入和池化都引入注意力。

本文實際上提出了兩種引入attention 的位置，一種是在Conv前(ABCNN-1),一種是Conv後(ABCNN-2)。從結果來看，Attention放在Conv後的效果比前面的效果更好。可能的原因是Word embedding經過Conv相當於提取了n-gram，能表示上下文。conv 之後再結合 Attention 能比單純 input 之後的 Attention 包含更多的信息。

Graph Attention Network(GAT)

小結1

之後的一系列論文如《Multi-Attention CNN for FGVC：MA-CNN》,《Coupled Multi-Layer Attentions for Co-Extraction of Aspect and Opinion Terms》等儘管實現的任務都花裡胡哨的，並引入了Attention，但是attention的使用方式還是千篇一律。

Attention is all you need

提出的動機：

跳出原來千篇一律的attention形式，不使用CNN，不使用RNN，光靠attention，實現高並行化；
抓取更強的長距離依賴關係。

創新點：

總結了attention的通用形式；
提出了self attention，multi-head attention；
Transform結構。

總結Attention的通用格式

作者將Attention理解為q，k，v的形式，

其實前面介紹的attention都可以套用該框架。

提出self attention, multi-head attention

這裡的self attention 指的是用到自身的信息來計算attention。傳統的attention都是考慮用外部信息來計算attention。

這裡採用的attention計算方式也與之前的不同，採用 Scaled Dot-Product 的形式。

注意：分母是為了歸一化，避免造成進入softmax函數的飽和區，其梯度較小。

採用multi-head attention為的就是讓不同head學習到不同的子空間語義。顯然實驗也證實這種形式的結果較好。

在self attention中其實在做的當前文本句中單詞依賴關係分數的計算。

比如“Think Machines”兩個單詞：

優點：

由於self attention 是對整個文本句求attention的，所以他能抓取到當前單詞和該文本句中所有單詞的依賴關係強度。這方面的能力顯然比RNN的獲取長依賴的能力強大的多；
此時不在用RNN的這種串行模式，即每一步計算依賴於上一步的計算結果。因此可以像CNN一樣並行處理，而CNN只能捕獲局部信息，通過層疊獲取全局聯繫增強視野。

缺點：很顯然，既是並行又能全局，但他不能捕捉語序順序。這是很糟糕的，有點像詞袋模型。因為相同單詞不同詞序的含義會有很大差別。為了克服這個問題，作者引入了Position embedding。這是後話了。

Transform

Transform是一大法寶，影響深遠。

從上圖粗看，Transform仍延續著一個Encoder一個Decoder的形式。

重要部件：

Positional embedding。正如上面所說，self attention缺乏位置信息，這是不合理的。為了引入位置信息，這裡用了一個部件position embedding。

這裡考慮每個token的position embedding的向量維度也是d維的，與input embedding的輸出一樣，然後將input embedding和position embedding 加起來組成最終的embedding輸入到上面的encoder/decoder中去。這裡的position embedding計算公式如下：

其中pos表示位置的index，i表示dimension index。

Position Embedding本身是一個絕對位置的信息，但在語言中，相對位置也很重要，Google選擇前述的位置向量公式的一個重要原因是：由於我們有

這表明位置p+k的向量可以表示成位置p的向量的線性變換，這提供了表達相對位置信息的可能性。

residual connection 。無論是encoder還是decoder，我們都能看到存在residual connection這種跳躍連接。

隨著深度的增加會導致梯度出現彌散或者爆炸，更為嚴重的是會導致模型退化（也就是在訓練集上性能飽和甚至下降，與過擬合不同）。深度殘差網絡就是為了解決退化的問題。其實引入殘差連接，也是為了儘可能保留原始輸入x的信息。

Layer Normalization

與 BN 不同，LN 是一種橫向的規範化。

LN針對單個訓練樣本進行，不依賴於其他數據。避免了受mini batch中其他數據的影響。

BN適用於不同mini batch數據分佈差異不大的情況，而且BN需要開闢變量存每個節點的均值和方差，空間消耗略大；而且 BN適用於有mini_batch的場景。

Masked Multi-Head Attention

這裡用mask來遮蔽當前位置後面的單詞。實現也很簡單，採用一個上三角都為1，下三角為0的矩陣。

小結一下：本文對attention的概念進行了本質上的轉變。傳統的attention是在端尾計算源文本各個token對該時刻單詞的貢獻。而self attention將這個過程提到了端口，計算當前句子中token的相關性來充分各個token的表達其語義。簡單的講就是傳統的attention是為了使輸出端表達充分，而self attention 是為了使輸入端表達充分。儘管他們的形式都可以用Q，K，V框架來解釋。

An Attentive Survey of Attention Models

《An Attentive Survey of Attention Models》是香農科技提出的一篇關於attention的綜述論文。

本文給attention作出了分類，分為四種分類方法：

1，number of sequences

a)distinctive。只考慮了涉及單個輸入和相應輸出序列的情況（例如seq2seq中的attention）；

b)co-attention。同時對多個輸入序列進行操作，並共同學習它們的注意權重，以捕獲這些輸入之間的交互（例如前面介紹的ABCNN）；

c)inner attention。使用注意力來學習輸入序列中對應於相同輸入序列中的每個標記的相關標記.(例如self attention)。

2，Number of abstraction levels

按照輸入特徵的抽象層次來分，這裡的抽象層次可以是詞粒度、短語粒度、句子粒度、文檔粒度。

a)single-level。只為原始輸入序列計算注意權重；

b)multi-level。注意力可以按順序應用於輸入序列的多個抽象層次[例如在兩個不同的抽象層次（即單詞級別和句子級別）上使用了注意力模型來完成文檔分類任務]。

3，Number of positions

a)soft attention。它使用輸入序列所有隱藏狀態的加權平均值來構建上下文向量；

b)hard attention。其中上下文向量是從輸入序列中隨機採樣的隱藏狀態計算出來的；

c)global attention。與soft attention一樣；

d)local attention。是hard attention和soft attention的一種折中。

4，Number of representations

a)multi-Representational Attention model。通過多個特徵表示捕捉輸入的不同方面,注意可以用來為這些不同的表示分配重要權重，這些表示可以確定最相關的方面，而忽略輸入中的噪聲和冗餘；

b)multi-dimensional。這種attention 作用在維度上，attention的權重表示各個維度上的重要性。

然後作者又對帶有attention的網絡結構進行餓了分類。

1，Encoder-Decoder

2，Memory Networks

像問答和聊天機器人這樣的應用程序需要能夠從事實數據庫中的信息中學習。網絡的輸入是一個知識數據庫和一個查詢，其中一些事實比其他事實更與查詢相關。端到端memory networks通過使用一組內存塊存儲事實數據庫來實現這一點，並使用attention在回答查詢時在內存中為每個事實建立關聯模型。

使用attention還提供了計算優勢，使目標連續，並通過反向傳播支持端到端訓練。端到端內存網絡可以看作是AM的一種泛化，它不是隻在單個序列上建模注意力，而是在一個包含大量序列(事實)的數據庫上建模注意力。

3，Networks without RNNs 最具代表性的就是Transformer。

未完待續

其實還有很多要補充的，比如Memory Network中的attention(外部記憶作為V)以及Graph neural network裡的attention，儘管理論上都是一個道理，但是還要對的起標題的all。待補充。

— 完 —

關注清華-青島數據科學研究院官方微信公眾平臺“THU數據派”及姊妹號“數據派THU”獲取更多講座福利及優質內容。

分享到:

閱讀更多 THU數據派 的文章

關鍵字: 本文深度王亦豐

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

深度學習之Attention模型詳解

相關文章:

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Redis內存分析工具--rdr安裝與使用

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

一行代碼提升遷移性能

利用相似幾何信息，做可泛化3D形狀分割模型

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

分佈式緩存，真香

特徵工程的力量

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

SpringBoot如何優雅的使用RocketMQ

css代碼規範工具stylelint

如何理解柳傳志和雷軍對華為的態度？

紅蟬花和飄香藤，養哪個好？

如果華為宣佈推出自主的操作系統或剔除美國的國產替代，你是否欣然接受併購買？

霍思燕和杜江的感情到底好到什麼程度？

剛買的天竺葵有花包了，用的是園土，能洗根上盆嗎？

婚姻真的會存在七年之癢嗎？

娛樂圈中被有的人稱為情商最高的孩子“嗯哼”，杜江霍思燕是如何養成的？

比較難養的花有哪些？

平心而論，該如何評價鄭爽的演技？

莫道桑榆晚為霞尚滿天，劉禹錫寫給白居易的詩是怎樣一種意境？

如何掌握律詩的起承轉合？

什麼樣的婚姻永遠挽回不了了？

杜鵑花北方怎麼養？

三角梅葉子徒長，怎樣才會花開不斷？

二婚女嫁什麼樣的男人比較好？

蘭花的花苞掉了，是怎麼回事？應該怎麼辦？

仙客來花蔫巴了怎麼辦？

剛剛種的五年月季葉子曬乾了怎麼辦？

蘇軾的哪一首詩詞符合你現在的心境？

蘇軾眾多豁達的詞中，你最喜歡哪一句？

君子蘭盆土太溼我們該怎麼辦？

大唐最花心的詩人，卻寫出史上最動人的情詩，這詩人是誰？情詩是哪首？

楊萬里小詩《夏夜追涼》，真是心靜自然涼嗎？

正在開花的蘭花可以換盆嗎？

網購苿莉花沒除原土直接上盆，可以活嗎？

種植花卉植物該如何控制光照？

吻遍半個娛樂圈，中年霸屏的張嘉譯，為何如此深得女演員的喜愛？

麗格海棠什麼季節購買最好？

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪