04.21 揭祕自編碼器，一種捕捉數據最重要特徵的神經網絡（視頻+代碼）

2018-04-21 14:49:27 大數據文摘

大數據文摘字幕組作品

編譯：Jenny、analeighgui、龍牧雪

YouTube網紅小哥Siraj Raval系列視頻又和大家見面啦！今天要講的是自編碼器Autoencoder。

時長8分鐘

有中文字幕

點擊觀看

▼

首先，自編碼器是一個神經網絡。

如果我們得到的數據是正確標註的，不論是圖像或音頻或文本，我們就很幸運了。深度學習在有標註數據集上非常有效。這是因為總有一個函數代表了變量之間的關係。

比如如果我們的輸入數據是一堆數字，還有定義了輸入數據是偶數或者奇數的標籤，那麼代表這兩列數字關係的函數就很簡單：如果輸入數據能被2整除，則這個數是偶數，不然就是奇數。

所有數據類型（視頻或文本）均可用數字表示。因此總是有一個函數能映射關係。只不過比我們剛剛討論過的函數更復雜一點。

所以我們現在可以跟電腦說話，真是太不可思議了。

-OK Google, do you love me?

-Ha ha ha ha, No.

（文摘菌：這段絕對不容錯過！1'30''左右，一定要去原視頻聽聽谷歌諷刺的笑聲，是個女高音）

語音識別就是深度學習應用在標記數據集的結果。如果一個開發團隊想要創建語音識別引擎，他們會使用以其轉錄本為標籤的音頻剪輯數據集。音頻的每一個字節可以被分解成一系列數字，文字記錄也可以。一些運算組合將輸入轉換成標籤，這個組合就是函數。

神經網絡可以通過反覆的優化過程（也就是訓練的過程）來慢慢逼近這個函數，簡而言之就是每次迭代都最小化錯誤值。因此給定一個新的音頻剪輯，它可以容易地預測到它的轉錄本會是什麼樣。

深度學習本質上是在完成從a到b的映射。更準確地說，它在完成通用函數逼近。

意思是有足夠數據的話，神經網絡可以逼近任何函數。

揭秘自編碼器，一種捕捉數據最重要特徵的神經網絡（視頻+代碼）

輸入一個貸款申請，輸出客戶會償還的可能性；輸入電子郵件，輸出它是垃圾郵件或非垃圾郵件的概率……

深度學習不僅僅能用來找到未知的函數，還能找到我們是如何發現一個已知函數的。

所有神經網絡都是複合函數，也就是函數套函數。網絡上的層數越多，其嵌套函數也越多。對於一個三層網絡來說，我們要用第一個權重矩陣乘以輸入，對它應用一個激活函數，再重複這個過程。

這次我們使用輸出作為我們新的輸入。輸入時間，等待，激活，結果是我們的輸出。這可以表示為複合函數，因為我們用第一個函數的輸出作為下一個函數的輸入。

不過，假設我們的目標不是找到一個標籤Y，而是重建原始輸入X呢？

如果我們的輸入是由幾個數字組成的數組，在應用一系列運算之後，我們的網絡應該以完全相同的數字輸出這些相同的輸入。我們將第一部分，可以將壓縮輸入成更少比特數的網絡的，稱為編碼器。我們可以將第二部分，建立視覺圖像的，稱為譯碼器。

我們為什麼要關心這個呢？我們不關心輸出，因為輸出只是複製了輸入，我們關心的是隱藏層。如果一個網絡能夠重建輸入，那麼隱藏層必須包含足夠信息給輸出。如果隱藏層比輸入層和輸出層小，那麼它代表的是低密度的相同信息，是從學習中得到的輸入數據的集中代表。

揭秘自編碼器，一種捕捉數據最重要特徵的神經網絡（視頻+代碼）

也有別的更好的辦法來壓縮數據，不過自編碼器在某些領域還是很有用的，例如降維。它也可以被用在分類問題上。如果自編碼器能正確地構建示例，這個示例很可能和用於訓練的類別屬於同一類。另外一個用途是異常檢測。我們用正常例進行訓練，這樣可以很容易發現異常。如果我們訓練它檢測訓練集中的異常，它只會發現那些已經見過的異常，而通常情況下異常值是比較少的。

好啦！更多有關自編碼器的分類和代碼的內容，可以自行看視頻和通過文末的鏈接下載代碼喔。以下是視頻的重點總結：

神經網絡可以緩慢地逼近各種函數，它可以通過訓練（迭代優化過程）從而映射輸入為輸出。如果我們把輸出設置為輸入，就可以稱這個神經網絡為自編碼器。自編碼器有很多類型，包括最近出現的變分自編碼器（VAE）。

最後附上一個視頻裡有關語音助手的笑話：

貝佐斯：Alexa，買點Whole Food的吃的做晚餐。

Alexa：好的，正在買Whole Food。

（指語音助手誤會這位CEO的意思讓亞馬遜直接收購Whole Food）

揭秘自編碼器，一種捕捉數據最重要特徵的神經網絡（視頻+代碼）

原視頻鏈接：

https://www.youtube.com/watch?v=H1AllrJ-_30

代碼下載：

https://github.com/llSourcell/autoencoder_explained

分享到:

閱讀更多 大數據文摘 的文章

關鍵字: 語音識別技術 Internet 字幕組

洛陽市直屬學校普通高中例會一組“綻放青春強國擔當洛陽青年話五四”雲團課開講了

2020年5月3日，在“洛小青工作室”釘釘群，一場別開生面的主題雲團課開講了。本期雲團課由洛陽市第十四中學團委書記陳曉慶召集、例會組各學校團委書記聯合發起，洛陽市第十五中學團委書記張改霞擔任主持人，洛陽梅森高中團委書記李藝丹擔任團課群班長。雲團課在團市委學校部部長郭兵指導下進行。

貞豐中學：開展模擬演練加強防控備開學

洛陽小學生開學，家長稱神獸歸籠，校長呼籲家校共擔教育責任

大河報·大河客戶端記者

36秒｜設立體溫檢測通道、調整班級！棗莊初中畢業生開學復課紮緊防疫“安全網”

齊魯網·閃電新聞5月6日訊

2020看中考名校丨南京航空航天大學附屬高級中學：夢想領航

前行時被絆倒的傷痛，由夢想來治癒。就算被捆綁住努力，心裡的夢一樣能掙脫束縛飛翔，就算有再大的風，也擋不住勇敢的衝動。那是夢想在雲端閃閃發亮，指引著我們勇敢飛翔。

高考總複習系列-第1節課實錄-集合與函數

本視頻為高考總複習系列：第一節課實錄主要內容為集合總複習，高中指數函數，對數函數，冪函數的複習接下來會持續更新總複習系列

《聲律啟蒙》系列微課（一）

《聲律啟蒙》由清代進士車萬育按韻編寫，內容涉及歷史典故、天文地理、花草樹木……是一部豐富學生知識的百科全書，更是一部讀起來朗朗上口，利於孩子掌握聲韻格律、學習詩文對句，習得寫作技巧的啟蒙讀物。2020年4月，教育部首次向全國中小學生髮布的閱讀指導目錄裡，將《聲律啟蒙》列入其中。

答辯老師，“您批評得是”

撰文、

仙桃八千多名高中畢業年級學子今日開學，現場是這樣子的！

期待著，盼望著終於迎來了屬於我們的開學季5月6日，湖北省高三年級統一開學同學們回到了闊別已久學校今天，全市11所高中畢業年級（含中職和技校）共8685名學子先行開學啦史上“最長寒假”正式結束高三學子踏入闊別已久的校園為復課做足準備所有高三畢業年級的學校全都開啟“滿格電”模式對校園

被世界前1%大學（uwo）認可的線上英語課程

想上世界名校，是否也在一直找尋一個合適孩子的網課？還沒拿到大學offer，是否也一直苦惱，刷不出雅思分數？即使拿到了offer，

中國大學生的英語聽說水平不如美國3歲小孩？

試問一個土生土長中國人，英語學到什麼程度，才算是高手？過了專業八級？託福雅思考高分？其實都不是，能無障礙聽懂英語國家的電視節目，才是英語高手。能做到這一點，那麼，他在國內的英語學習領域可以說是冠絕群雄，達到了獨孤求敗的境地。因為，國人學習英語的方法，註定了大家幾乎不能做到這一點。

100個戰“疫”感動瞬間成學校鮮活教材

4月下旬，我市各小學陸續復課。天元區銀海學校的學生們收到了一份特殊的教材，由孩子們自己創作的《感動生命的100個瞬間----全民抗疫戰特輯》，記錄了疫情防控阻擊戰中孩子們的所見、所思、所感。

今日，鄭州市中學全面復學中招考試信息採集同時啟動

5月6日一早，鄭州市高一高二，初一初二年級學子重返久違的校園，

久違的校園，我們回來了！鄭州市中學今日全面復學

美麗的五月如期而至，5月6日一早，伴隨著初升的朝陽，鄭州市高一高二，初一初二年級學子重返久違的校園，和提前復課的高三、初三學長學姐們一道“重啟”校園生活

李玫瑾教授：孩子的問題是成人造成的，出現問題需從大人身上解決

孩子的問題，往往是成年人造就的。孩子的每種心理和行為，和父母的行為有關，和父母的教育方式有關。真正要解決的問題，不在於孩子，而在於父母和家庭。未成年人的問題是滯後反映。青春期的問題，癥結在12歲以前，或更早。

武漢市第十四中學：一個班級一層樓，抗疫志願者上開學第一課

楚天都市報5月6日訊高三複學返校第一天，早上6點50，武漢市第十四中學校園內已經有不少學生了。他們揹著書包，互相打著招呼，不少學生說：十分想念，所以早點來。

開學復課：柘裡渡小學：分通道進教室

在高新區柘裡渡小學，學生們則在老師的引導下，分兩個通道測溫消毒後，有序進入久違的校園。【同期聲】肖敏

濰坊青州市委書記韓幸福現場檢查初中學校畢業年級開學復課工作

齊魯網·閃電新聞5月5日訊5月5日上午，濰坊青州市委書記韓幸福現場檢查初中學校畢業年級開學復課工作時強調，要始終把師生生命安全和身體健康放在第一位，精準有效抓好學校疫情防控工作，充分做好初中學校畢業年級開學復課各項準備，切實守牢校園安全底線。

阿卡索家長課堂：孩子不願意開口？在線英語創造純英文學習環境！

以下兩個場景可能家長們並不陌生：場景一：當你和孩子在逛街的途中，這時遇到了一個問路的外國人，你希望你的孩子能夠大膽、自信地去跟外國人溝通並幫助他。但是孩子卻顯得不知所措，甚至不願意開口。

長清區萬德界首小學春意盡萬物秀盛始夏萬物長夏天系列發佈

濟南市長清區萬德界首小學——界首教育春風化雨

基於SpringBoot的城院疫情防控系統的設計與實現(ssm,mysql)

【項目包含內容】

如何看待大多青年不認可《後浪》？

今天，我在朋友圈看到了很多“唱反調”的文章、評論，比如：《為什麼朋友圈裡轉發後浪的大多是領導和老闆、叔叔阿姨？》《我不是B站所謂的後浪》“中年討好新生代”“年輕人真的喜歡嗎？

創意跑紀念五四，南航學生雲端“火炬接力”

揚子晚報網5月4日訊（通訊員

視頻丨我市組織開展初中畢業年級師生血清抗體檢測

【導語】全市初中畢業年級將於5月6號正式開學。為全面做好開學復課工作，3號、4號兩天，我市組織對初中畢業年級師生、後勤服務人員及工作組成員開展血清抗體檢測。

4000英語核心詞彙學習（2）Book1Unit2 圖解+英英釋義+例句+閱讀

如何開始一段英文對話？有時候想要和英語母語者分享自己的故事，卻不知道怎麼去述說。話到嘴邊，卻找不到一個合適的詞彙。在學習英語的過程中，好比建房子，詞彙便是磚瓦。今天接著給大家分享

深圳一線名師是怎麼上課的？中考語文：人物描寫方法及作用

福田區教科院邀請、招募全區各中學語文學科組長、名師、骨幹精心設計製作考點課件+考點學習單+講練結合的微課+考點針對性練習學習包，一共製作了72箇中考語文考點學習資料包。

深圳一線名師是怎麼上課的？中考語文：議論文拓展開放題

深圳一線名師是怎麼上課的？中考語文：論證方法及其作用

深圳一線名師是怎麼上課的？中考語文：論據的辨析

深圳一線名師是怎麼上課的？中考語文：如何找論點&開頭的作用

深圳一線名師是怎麼上課的？中考語文：議論文補充論據

在tomcat如何進行斷點調試

Eclipse會為每一個tomcat部署的項目單獨建立一份配置文件。tomcat真正訪問的是tomcat部署的web項目，tomcat部署的web項目對應著工作空間項目的web目錄下的所有資源。在tomcat裡面如何進行斷點調試。

小學數學一招教你秒懂【一位數乘99得簡便算法】看誰算的快

如果對你有幫助，關注我【嚴老師小學數學教學】，有問題的可以在留言區討論，後期會為大家帶來更多的視頻和資料！！敬請關注！！

小學數學必考【巧算題】

如果對你有幫助，關注我【嚴老師小學數學教學】，有問題可以留言，後期會為大家帶來更多的學習視頻和資料！！敬請關注！！

【社科戰疫快報－278期】濱職馬克思主義學院系列“思政課戰疫小課堂”之“全球疫情防控中的大國擔當”

★舉旗幟

基於SSM技術的高考輔助選校系統的設計與實現(SSM,MySQL)

【項目包含內容】

webservlet註解

瀏覽器訪問servlet的簡單方法前面我們是通過web.xml的配置來訪問的，太複雜了，因為每寫一個servlet都需要在xml中寫那麼多代碼Servlet3.0:好處:支持註解配置。可以不需要web.xml了。步驟:1.創建JavaEE項目，選擇Servlet的版本3.

看外教老師怎麼帶小學員幾分鐘學會表達自己喜歡的食物

今天，要給大家介紹的外教老師是老師Angie。在這節課上，安吉老師帶著小學員幾分鐘就學會了表達自己喜歡的食物。她是如何做到的呢？我們一起來看一下吧！首先，外教老師用圖片教會孩子幾個常見的食物單詞。一邊教單詞，一邊問孩子，“Do

半年300小時聽力輸入，父與子繪本的故事他能輕鬆背出來！

大思英語小達人755期：元寶

放飛春天！東南大學手繪風箏節來啦

記者從東南大學瞭解到，五一期間，東大舉行了“春到九龍”風箏設計與放飛活動。活動採用線上預約的方式，在5月1日-5日期間分批、分時間進行，現場設有放風箏、手繪風箏、踢鍵子、跳繩等項目，來自各院系的近500名師生報名參加。

「品質白中●化雨」五四精神傳承有我—白關中學組織開展“我們的青春在白中”五四主題活動

—中國青年節—

深圳一線名師是怎麼上課的？中考語文：文言詞語解釋專題複習

濰坊錦海小學：向勞動者致敬，我有我的方式！

“民生在勤，勤則不匱”，勞動是財富的源泉，也是幸福的源泉。“夙興夜寐，灑掃庭內”，熱愛勞動是中華民族的優秀傳統，綿延至今。　　近日，濰坊錦海小學開展了“勞動最光榮”系列活動，以激發學生內心對勞動的尊重，培養勤勞的品質，爭做新時代有為青年！

深圳一線名師是怎麼上課的？中考語文：如何概括散文和小說的主題

深圳一線名師怎麼上課？中考語文閱讀《分析句子的含義和作用》

2.適用於EDIUS 8的HitFilm Ignite

在此播客中，我們介紹由FXHome推出的EDIUS

深圳一線名師課：中考語文閱讀《說明文開頭的作用和延伸拓展題》

深圳一線名師是怎麼上課的？中考《理清說明順序，篩選關鍵信息》

TED演講中英字幕：成為孩子堅定不移的支持者（視頻+演講稿）

關鍵詞（Keyword）：TED演講，潛能，支持者，相信，擁護者，演講簡介：如何把每一個孩子培養成自信、自在、努力、內心充盈的最優秀的那個自己？一個好老師能發掘出孩子的潛能，一個合格的老師，就會堅信每一個孩子都是最棒的。

Jsp+Ssm+Mysql校園二手市場交易平臺(源碼)+運行指導視頻

【功能描述】本項目是一款由jsp+ssm+mysql實現的校園二手市場交易平臺，本系統一共有三種角色

04.21 揭祕自編碼器，一種捕捉數據最重要特徵的神經網絡（視頻+代碼）

相關文章:

洛陽市直屬學校普通高中例會一組“綻放青春 強國擔當 洛陽青年話五四”雲團課開講了

貞豐中學：開展模擬演練 加強防控備開學

洛陽小學生開學，家長稱神獸歸籠，校長呼籲家校共擔教育責任

36秒｜設立體溫檢測通道、調整班級！棗莊初中畢業生開學復課紮緊防疫“安全網”

2020看中考名校丨南京航空航天大學附屬高級中學：夢想領航

高考總複習系列-第1節課實錄-集合與函數

《聲律啟蒙》系列微課（一）

答辯老師，“您批評得是”

仙桃八千多名高中畢業年級學子今日開學，現場是這樣子的！

被世界前1%大學（uwo）認可的線上英語課程

中國大學生的英語聽說水平不如美國3歲小孩？

100個戰“疫”感動瞬間 成學校鮮活教材

今日，鄭州市中學全面復學 中招考試信息採集同時啟動

久違的校園，我們回來了！鄭州市中學今日全面復學

李玫瑾教授：孩子的問題是成人造成的，出現問題需從大人身上解決

武漢市第十四中學：一個班級一層樓，抗疫志願者上開學第一課

開學復課：柘裡渡小學：分通道進教室

濰坊青州市委書記韓幸福現場檢查初中學校畢業年級開學復課工作

阿卡索家長課堂：孩子不願意開口？在線英語創造純英文學習環境！

長清區萬德界首小學 春意盡 萬物秀 盛始夏 萬物長 夏天系列發佈

基於SpringBoot的城院疫情防控系統的設計與實現(ssm,mysql)

如何看待大多青年不認可《後浪》？

創意跑紀念五四，南航學生雲端“火炬接力”

視頻丨我市組織開展初中畢業年級師生血清抗體檢測

4000英語核心詞彙學習（2）Book1Unit2 圖解+英英釋義+例句+閱讀

深圳一線名師是怎麼上課的？中考語文：人物描寫方法及作用

深圳一線名師是怎麼上課的？中考語文：議論文拓展開放題

深圳一線名師是怎麼上課的？中考語文：論證方法及其作用

深圳一線名師是怎麼上課的？中考語文：論據的辨析

深圳一線名師是怎麼上課的？中考語文：如何找論點&開頭的作用

深圳一線名師是怎麼上課的？中考語文：議論文補充論據

在tomcat如何進行斷點調試

小學數學 一招教你秒懂【一位數乘99得簡便算法】看誰算的快

小學數學 必考【巧算題】

【社科戰疫快報－278期】濱職馬克思主義學院系列“思政課戰疫小課堂”之“全球疫情防控中的大國擔當”

基於SSM技術的高考輔助選校系統的設計與實現(SSM,MySQL)

webservlet註解

看外教老師怎麼帶小學員幾分鐘學會表達自己喜歡的食物

半年300小時聽力輸入，父與子繪本的故事他能輕鬆背出來！

放飛春天！東南大學手繪風箏節來啦

「品質白中●化雨」五四精神 傳承有我—白關中學組織開展“我們的青春在白中”五四主題活動

深圳一線名師是怎麼上課的？中考語文：文言詞語解釋專題複習

濰坊錦海小學：向勞動者致敬，我有我的方式！

深圳一線名師是怎麼上課的？中考語文：如何概括散文和小說的主題

深圳一線名師怎麼上課？中考語文閱讀《分析句子的含義和作用》

2.適用於EDIUS 8的HitFilm Ignite

深圳一線名師課：中考語文閱讀《說明文開頭的作用和延伸拓展題》

深圳一線名師是怎麼上課的？中考《理清說明順序，篩選關鍵信息》

TED演講中英字幕：成為孩子堅定不移的支持者（視頻+演講稿）

Jsp+Ssm+Mysql校園二手市場交易平臺(源碼)+運行指導視頻

洛陽市直屬學校普通高中例會一組“綻放青春強國擔當洛陽青年話五四”雲團課開講了

貞豐中學：開展模擬演練加強防控備開學

100個戰“疫”感動瞬間成學校鮮活教材

今日，鄭州市中學全面復學中招考試信息採集同時啟動

長清區萬德界首小學春意盡萬物秀盛始夏萬物長夏天系列發佈

小學數學一招教你秒懂【一位數乘99得簡便算法】看誰算的快

小學數學必考【巧算題】

「品質白中●化雨」五四精神傳承有我—白關中學組織開展“我們的青春在白中”五四主題活動