「摘抄」詳解:數據,算法,模型之間的關係

媽媽教孩子認字,那一個個的漢字就是數據,媽媽教孩子的過程就是訓練的過程,媽媽用的方法就是算法,孩子最後就成了一個能夠認識不同字的模型。

首先每個漢字有不同的形態,這些偏旁、部首就是漢字的特徵,媽媽給孩子講解每個漢字的這些特徵,讓孩子識記的過程就是一個訓練的過程。媽媽用的教育方法就是訓練過程中使用到的算法,比如告訴孩子哪個漢字具體有哪些特徵,什麼樣的特徵是這個漢字,什麼特徵不是這個字,這就是監督學習過程,告訴孩子對錯和判斷的標準(主要的數據特徵),並通過孩子的反饋不斷地糾正孩子的錯誤來糾正孩子的認知,從而使得孩子能夠不斷的提高識字的準確程度(前向傳播和反向糾錯),這個算法也就是監督學習算法。

孩子經過媽媽的一番教導和不斷地糾正錯誤(訓練過程)最後終於有了自己相對穩定的判斷(模型本身)可以識別不同的漢字了。但是還有還時會不時認錯字(誤差),這就是訓練過程不可避免的存在誤差。即便是人本身也不可能事事都能百分之百做對、做正確,金無足赤,人無完人,機器亦是如此。

從上邊的過程可以看出,媽媽教孩子識字的過程就是一個機器學習的過程,繁多的漢字作為訓練的原始數據集,孩子就是已經定義好的模型結構(這個沒得選),媽媽的教育過程就是一個有監督的數據訓練的過程,孩子的反饋和媽媽的糾正屬於前向傳播和反向傳播的算法執行過程,最終孩子學會了識記各種漢字,直白點孩子此時本身就是一個識別漢字的模型。

————————————————

原文鏈接:https://blog.csdn.net/sy20173081277/article/details/82526262


分享到:


相關文章: