深度學習幾種典型架構_技术 _ 頭條網

介紹幾種典型的深度學習架構。

卷積神經網絡(CNN)

卷積神經網絡由LeCun提出。在Kaggle競賽中取得了巨大成功。

典型的卷積網絡有兩部分。第一個是負責特徵提取，由一對或多對卷積和子採樣/最大池化層組成。第二部分是經典的全連接多層感知器，將提取的特徵作為輸入。如下圖所示。

卷積神經網絡架構

長短期記憶網絡（LSTM)

長短期記憶網絡是比較流行的一種網絡結構。

LSTM架構

長短期記憶網絡用兩個門來控制單元狀態的內容，一個是遺忘門(forget gate)，決定了上一時刻的單元狀態有多少能夠保留到當前時刻；一個是輸入門(input gate)，決定了當前時刻網絡的輸入有多少保留到單元狀態。LSTM使用輸出門(output gate)控制單元狀態有多少輸出到LSTM的當前輸出值。

GRU

GRU是 LSTM 的簡化版，但在大多數任務中其表現與 LSTM 不相伯仲。

GRU和LSTM對比

相比LSTM， GRU 有更少的參數，因此相對容易訓練且過擬合的問題要輕一些，在訓練數據較少時可以嘗試使用GRU。

更簡化的有迷你GRU。

迷你GRU

DB-LSTM

深度雙向LSTM

卷積殘差記憶網絡

卷積殘差記憶網絡是CNN和LSTM的一種結合。

卷積殘差記憶網絡架構

深度學習幾種典型架構

卷積神經網絡(CNN)

長短期記憶網絡（LSTM)

GRU

DB-LSTM

卷積殘差記憶網絡

Dynamic NTM

Evolvable Neural Turing Machines

Unsupervised Domain Adaptation By Backpropagation

Deeply Recursive CNN For Image Super-Resolution

Recurrent Model Of Visual Attention

MLP with synthetic gradients

Google’s Neural Machine Translation System

卷積神經網絡(CNN)

長短期記憶網絡（LSTM)

GRU

DB-LSTM

卷積殘差記憶網絡

Dynamic NTM

Evolvable Neural Turing Machines

Unsupervised Domain Adaptation By Backpropagation

Deeply Recursive CNN For Image Super-Resolution

Recurrent Model Of Visual Attention

MLP with synthetic gradients

Google’s Neural Machine Translation System

相關文章:

Junit5 架構、新特性及基本使用（常用註解與套件執行）

阿里技術官深入淺出MySQL：架構+高級特性+性能優化+集群實戰

Java高級面試攻略：消息+緩存+高併發+高可用+架構+分佈式+微服務

HBase 初探：架構 + 原理 + 對比 + 實踐

Istio1.4.5系列——架構

阿里2020年內部PPT全棧分享：架構、大數據、算法

03.02 「架構」淺談 Web 網站架構演變過程

02.27 架構，如何進行容量設計？

2020年互聯網Java面試複習大綱：ZK+Redis+MySQL+Java基礎+架構

MVC架構實戰精講

“搜索”的原理，架構，實現，實踐，面試不用再怕了

「架構」kubernetes 跨集群 服務註冊與發現方案探討

「架構」當微服務遇見kubernetes

02.02 「架構」kubernetes跨集群三層網絡設計

「PostgreSQL 架構」PostgreSQL 11和即時編譯查詢

架構

「架構」對於微服務設計原則的思考

步步深入MySQL：架構-&gt;查詢執行流程-&gt;SQL解析順序

「轉」“搜索”的原理，架構，實現，實踐，面試不用再怕了

乾貨：阿里大神分享API網關在微服務架構中的應用

09.03 詳解虛擬化之KVM概念、架構、功能、常用工具及部署

多網站項目的 CSS 架構

架構：領域驅動設計（一）

阿里大神分享API網關在微服務架構中的應用

架構：領域結構組織模式

架構：常用架構模式

架構：緩存設計

架構：負載均衡

阿里P8架構師談：多線程、架構、異步消息、Redis等性能優

[BPM 架構]頂級免費和開源BPM軟件

架構：微服務之服務發現

架構：數據庫讀寫分離

支付寶中間件4面：J.U.C併發框架+RocketMQ +MyCat+鎖機制+架構

「架構」到底指什麼

「架構」面向服務（SOA）必記知識點

09.21 步步深入MySQL：架構-&gt;查詢執行流程-&gt;SQL解析順序

步步深入MySQL：架構->查詢執行流程->SQL解析順序！

Qemu 架構

阿里P8架構師談：多線程、架構、異步消息、Redis等性能優化策略

全世界最全「基礎+架構+大數據」免費資料分享給沒有基礎的您

「深度」AI攻防技術三例

06.15 敲黑板：關於 Kubernetes 架構，運維同仁一定要懂這些

敲黑板：關於 Kubernetes 架構，運維同仁一定要懂這些

04.27 架構師詳解：Nginx 架構

靠 PR 去 IOE 架構？還是沉心技術吧

網際網路與大數據：淺談大數據與雲計算，大數據逐步「雲」化

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

「架構」kubernetes 跨集群服務註冊與發現方案探討

步步深入MySQL：架構->查詢執行流程->SQL解析順序

09.21 步步深入MySQL：架構->查詢執行流程->SQL解析順序

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪