03.07 為什麼人工智能工程師被戲稱為“調參俠”?

i外貿


這裡準確來講應該是一部分人被稱為調參數俠。


本質原因

在於機器學習是從數據中提取信息,解決實際生產。學習的過程就是不斷調整模型參數的過程。人工智能領域:算法、數據、算力做為主要的三個方面。算力一般有專門的人維護,所以算法實現和數據處理、模型訓練是從事人工智能領域工程師的主要工作。算法實現一般都有現成的代碼,如果沒有,基於pytorch、tensorflow等框架實現起來也非常快。最難的是數據處理和模型訓練,這一塊需要花費大量的時間,所以人工智能工程師不是在調參,就是在調參的路上。


次要原因

1.企業為了創造業務收益,需要工程師快速完成工作,人工智能領域作為當下最熱門的領域,很多算法模型都有現成的實現,所以只需要複製粘貼過來,快速修改模型參數,輸入數據訓練即可,即所謂的“調參俠”。

2.在一個領域,個人能力和經驗有高低,所以對應者完成不同難度的工作。公司需要一部分人做業務開發,一部分人做研究。所以根據興趣和能力的不同,一部分工程師被分到業務領域,每天面對的絕大多數工作都是調參數。


城東的花開了


確實,現在做人工智能方向的工程師,有不少被稱為“調參俠”,但也並不全是。

以我自己為例,我做cv方向(計算機視覺)的, 調參在我日常工作中佔的比例並不大。

在CV這塊,除了超參數外,影響模型效果的主要還是要網絡結構、數據和損失函數,這三方面確定下來後,調參基本花不了多少時間。


迴歸正題!


調參俠,到底調什麼參?

在人工智能裡面,參數大致可分為2大類:

  1. 參數(parameters)/模型參數:由模型通過學習得到的變量,比如權重w和偏置b,這個多半是不能調節的,它是由神經網絡自己學習出來的。

  2. 超參數:在機器學習中,超參數是在神經網絡訓練之前設置值的參數,而不是通過訓練得到的參數數據。常見的有學習率、迭代次數、隱藏層的層數、每層神經元的個數等。通常情況下,需要對超參數進行優化,給學習機選擇一組最優超參數,以提高學習的性能和效果。這一般是根據經驗進行設定,影響到權重w和偏置b大小的數值。


為什麼會被稱為“調參俠”?

主要原因有以下2個:

  1. 多半是剛入門的算法工程師做的事情,他們不是很懂神經網絡的結構、數據分佈等等,只能通過調整超參數,以期望獲得較好的結果,這樣有時候是可行的;

  2. 更重要的原因是,GitHub上開源了很多模型,並附上了預訓練參數,如常用的檢測、分割、分類等等,這些模型都非常成熟,大部分直接調用就可以,然後根據自己的訓練數據,稍加修改,就可以得到非常好的結果。公司只要結果,不要求創新,開源項目已經可以做到這點了,所以大多數只要調參即可。

怎麼避免成為“調參俠”

目前AI人才競爭越來越激烈,“調參俠”的時代已慢慢過去,這些事情其實根本不需要AI工程師來做,未來的研發工程師就可以承擔這些了! 幾年前如果熟練使用TensorFlow,同時掌握基本的AI算法就可以很容易找到一份高薪的工作,但現在不一樣了,AI崗位的要求越來越高,對知識的深度也提出了更高的要求。

要想跟上時代,得武裝自己,才能不被淘汰。

對於真正的人工智能工程師而言,他們往往是從數據和特徵下手的,同時還需要豐富的行業經驗。一定要記住一句行業內的諺語,數據和特徵才決定算法 的上限,而選擇的算法和參數只是決定了已逼近這個上限的速度。


來自Z時代


調參俠其實和寫程序所說的碼農差不多的意味,是對從事這個行業人員的調侃。比如寫程序的,剛開始都會接觸增刪改查的業務,做多了都會說curd一樣。從事人工智能還有許多的其他名稱,比如調包俠,指標奴。

人工智能的技術和知識還是很廣泛的,並不只是調參。還有數據和特徵工程,數學算法知識等。



代碼接盤俠


人工智能產品開發包括數據採集、預處理、數據探索、選擇算法訓練模型。訓練模型主要選擇梯度下降算法,通過調整激活函數、隱藏層、池化層等不同參數,達到最優解。


人工智能和數字經濟


其實也是調參,算法就那些,主要做參數優化,數據分析。


Mok666


本來就是,有幾個能提出來新模型,新思路的,太難了,都是煉丹師,也很難解釋為什麼


冰釋凝眸


因為提出新結構、新思路、有真正創新的人鳳毛麟角


投我以桃報之以李


煉丹師好啊嗎?


分享到:


相關文章: