機器不學習：CNN+RNN，二神合體，威力無窮，最好的NN模型介紹_科技 _ 頭條網

機器不學習 www.jqbxx.com : 深度聚合機器學習、深度學習算法及技術實戰

卷積網絡循環網絡結合-CNN+RNN

1. CNN+RNN

相同點

都是傳統神經網絡的擴展；前向計算產生結果，反向計算進行模型的更新；每層神經網絡橫向可以多個神經元共存，縱向可以有多層神經網絡連接。

不同點

CNN進行空間擴展，神經元與特徵卷積；RNN進行時間擴展，神經元與多個時間輸出計算；RNN可以用於描述時間上連續狀態的輸出，有記憶功能；CNN則用於靜態輸出；CNN高級結構可以達到100+深度；RNN的深度有限。

組合的意義

大量信息同時具有時間空間特性：視頻，圖文結合，真實的場景對話；帶有圖像的對話，文本表達更具體；視頻相對圖片描述的內容更完整。

組合方式

CNN特徵提取，用於RNN語句生成->圖片標註

RNN特徵提取用於CNN內容分類->視頻分類

CNN特徵提取用於對話問答->圖片問答

組合方式實現

特徵提取： LSTM輸出（考慮不同時間研究對象的特徵），FC層輸出。特徵合併 Concatenate層（合併在一起形成更長的向量），Attention相乘（某些區域加強，某些區域削弱）。結果輸出連續語句輸出LSTM，組合分類迴歸DNN。

2. 圖片標註

問題描述

擁有大量圖片及其標註信息，能夠通過學習建立一個能夠自動圖片標註的模型？

基本思路

目標是產生標註語句，是一個語句生成的任務，根本上來說是一個RNN的任務，使用LSTM。描述的對象是大量的圖像信息，進行圖像信息的表達，使用CNN。CNN網絡中全連接層利用特徵進行圖片的描述，特徵與LSTM輸入進行結合。

模型設計

1. 整體結構

2. 特徵提取

圖片特徵：CNN全連接層提取；語言特徵：Word2Vec。

3. 數據準備

圖片CNN特徵提取；圖片標註生成Word2Vec向量；生成訓練數據：圖片特徵+第n個單詞向量->第n+1個單詞向量。

4. 模型訓練

運用遷移學習進行模型構建和訓練，用於CNN特徵，語句特徵應用已有的模型；最終的輸出模型是LSTM，訓練過程的參數：設定梯度上限（gradient clipping）用於防止梯度爆炸、學習率調整（adaptive learning）

5. 模型運行

CNN進行特徵提取；CNN特徵+語句的開頭，單詞逐個預測；

圖片標註升級-詳細標註

DenseCap，主要基於Faster R-CNN

3. 視頻行為識別

常用方法

CNN特徵簡單組合

3D版本CNN

RNN+CNN

RNN用於CNN特徵融合CNN進行特徵提取；LSTM判斷；多次識別結果進行分析。

CNN進行特徵提取；LSTM融合；Linear regr + Softmax分類。

RNN用於CNN特徵篩選+融合並不是所有的視頻圖像包含確定分類信息；RNN用於確定哪些frame是有用的；對有用的圖像特徵融合；

RNN用於目標檢測CNN直接產生目標候選區；LSTM對產生候選區進行融合（相鄰時刻位置近似）；確定最終的精確位置。

4. 圖片/視頻問答

給定一張圖片，提出圖片內容相關問題，問答模型給出答案。

問題的種類

方法流程

按照語言問答路程解決；圖片特徵同語言特徵融合；訓練數據：問題+圖片->答案

模型設計

純文字問答系統

背景故事生成（word embedding）問題特徵生成；背景，問題特徵融合；標準答案迴歸。

圖片問答系統

基本模型背景故事特徵生成-CNN；問題特徵生成；背景，問題特徵融合；標準答案迴歸。

模型優化1 對圖片特徵向量進一步處理，建立CNN特徵的fisher特徵；提高特徵表達的效率，更容易同encoding特徵組合。

模型優化2 用問題作為“候選區域”對原始CNN特徵圖局部識別。

模型優化3 注意力圖對圖片問答進行幫助；根據問題產生第一次注意力圖；然後產生最終的注意力圖；

5. 實例：學習Image Caption 圖片自動標註

一個將圖片轉換為相應文字描述的例子。

fork代碼參見：https://github.com/KoalaTree/models/tree/master/im2txt

機器不學習 www.jqbxx.com : 深度聚合機器學習、深度學習算法及技術實戰

卷積網絡循環網絡結合-CNN+RNN

相關文章:

小米太無恥了。

蹭熱點！說說我理解的手機包裝盒事件。

蘋果公司正式發佈iPhone SE二代手機

華為河圖、麒麟芯片和鴻蒙OS三駕馬車並行？華為生態建設佈局深遠

小米高管表示，四千毫安時 5G 手機，和三千多毫安時 4G 手機一樣

5G畫風變了：麒麟985落地首跑，榮耀坐上開往高端的「地鐵」

旗艦手機標配Wifi 6 換Wifi 6路由器的時機到了嗎？

2020年5G手機賣不動？繼蘋果砍單25%之後，華為小米紛紛跟砍？

幹翻華為P40系列 榮耀30也玩中

程序員辭互聯網工作，跨行傳統上市公司，上班第1天就蒙了

蘋果發佈新款iPhoneSE，3299元起售

我很糾結：我究竟適不適合做亞馬遜電商？看了這三條你就知道了

請仔細閱讀，關於跨境電商你想知道的都在這兒

騙子手段太“精明”：商家賠了貨物又賠款，亞馬遜平臺騙術大揭祕

做跨境電商這麼多年，今天才知道給國外客戶發文件原來這麼簡單

值得收藏！三類賣家三種選品方案，總有適合你的一個……

萬萬沒想到！亞馬遜平臺上面賣床單竟營收一個億！你還在等什麼？

做店鋪這麼多年，今天才知道我的listing突然被封，竟是因為……

亞馬遜小白看過來！請採納這些：亞馬遜選品和運營的小建議

亞馬遜賣家如何爆單？跨境精細化運營攻略必看

不收保證金、入住費、年費，還免三個月佣金，我也想入駐這個平臺

馬雲終於要辭職了，留下的話句句觸動人心

等等，明年5G手機將迎來大降價

微信公開課PRO版2019正在進行時，往屆各自都有什麼黑科技

推出「信任分」升級「閃購」，美團本地生活這盤棋有多大？

5G我們超越了6G我們也將領先! 美國為什麼會害怕失去5G領導地位呢

界讀｜華為：幫助英國共渡疫情難關，無端批評令英國蒙受損失

為什麼華為今天可以傲視群雄，在世界上立於不敗之地？

血戰「在線辦公」，阿里、騰訊、字節、華為的底牌與大殺器

2020年最強拍照旗艦來了 華為P40系列多項業界首創 香！

今天聊一聊直播

通過直播賺錢不容易，既要豁得出去，又要端得起來

AI和自動化技術聯手，最終會讓60%的工人失去現有的飯碗。

這個網還能不能好好上了？今日全球IPv4地址正式耗盡

12306系統不行？內行人告訴你它有多牛，阿里騰訊高手去了也膜拜

有內幕？美國防部授與微軟百億雲合同，亞馬遜不滿發起訴訟

未來之芯--RISC-V總部從美國遷往瑞士，華為、阿里是其成員

神話還能繼續嗎？幾度過山車，比特幣半年來首次跌破7000美元

劉強東卸任後，突然宣佈一個“好消息”，讓馬雲措手不及！

蘋果的瘋狂其實從未停止，AirPower或將重新啟航

幹翻華為P40系列榮耀30也玩中

2020年最強拍照旗艦來了華為P40系列多項業界首創香！