如何構建一個器學習項目來找到工作?

雷鋒網 AI 科技評論按:如何找到一份機器學習的工作?對於這個問題, SharpestMindsAI 創始人、物理學家和機器學習專家 Edouard Harris 寫了一篇博客,雷鋒網 AI 科技評論整理。

我是一個在 YC 初創公司工作的物理學家。我們的工作是幫助剛畢業的學生得到他們的第一份機器學習工作。

前一段時間,我寫了一篇關於如何才能獲得第一份機器學習工作的文章。我在那篇文章中說,有一件你應該做的事是建立個人機器學習項目。但我並沒有說明如何去做這件事,所以在這篇文章裡,我會告訴你怎麼做。

由於工作原因,我看到過成百上千的個人項目的例子,它們有的非常好,有的很糟糕。下面我將給你講講其中的兩個非常好的項目。

全力以赴地投入項目

下面是一個真實的故事,只是為了保護隱私,我改了名字。

當雜貨店需要更新庫存的時候,X 公司使會用人工智能去提醒它們。我們有一個名叫 Ron 的學生,他真的很想去 X 公司工作。Ron 實在是太想去 X 公司工作了,因此,他投入所有的精力建立了一個個人項目,這個項目讓他得到了 X 公司的面試機會。

像這樣全力以赴地為進入一家公司做準備是一件冒險的事情,我們通常不建議這樣做。但是我在前面說過,Ron 真的非常想去 X 公司工作。

那麼 Ron 建立了一個什麼樣的個人項目?

如何构建一个器学习项目来找到工作?

紅色的矩形框表示缺貨

  1. Ron 先把手機綁到購物車上,之後他推著購物車在雜貨店的過道上來回走動,同時用相機把雜貨店的貨架拍攝下來。他在不同的雜貨店做了 10 到 12 次這樣的工作。

  2. Ron 一到家,就開始著手建立機器學習模型。他的模型可以識別出雜貨店貨架上沒有貨物的地方,這些地方的玉米片(或其他東西)被拿走了。

  3. Ron 在 GitHub 上實時構建模型,並完全公開。每天,他都會對自己的模型進行改進來提高它的準確性,並記錄其中的變化。

  4. 當注意到 Ron 所做的事情時,X 公司表現出了極大的興趣。事實上,X 公司甚至對此感到緊張。他們為什麼會緊張?因為 Ron 不知不覺地在幾天內重構了他們的專有的技術棧的一部分。

X 公司實力強勁,他們的技術在同行業中首屈一指。儘管如此,在 4 天之內,Ron 的項目已經引起了 X 公司 CEO 的注意。

試驗項目

這是另一個真實的故事。

Alex 是歷史系的學生,同時他輔修了俄語研究。不同於其他歷史專業的學生,他對機器學習特別感興趣。更不尋常的是,儘管從未寫過一行 Python 代碼,他決定去學習機器學習。

Alex 選擇通過實踐來學習。他決定建立一個分類器來檢測飛機上的飛行員是否失去意識。Alex 想通過觀看飛行員的視頻來探索這個問題。人們很容易通過觀察就能判斷一個飛行員是否失去意識,所以 Alex 認為機器也有可能做到這一點。

以下是 Alex 花了幾個月做的事情:

如何构建一个器学习项目来找到工作?

Alex 的意識喪失感應探測器模型 G-force

  1. Alex 在 YouTube 上下載了從駕駛艙裡拍攝的飛行員駕駛飛機的每個視頻片段。

  2. 接下來,他開始標記數據。Alex 創建了一個 UI,他可以在上面滾動觀看數千個視頻片段,這個 UI 上有兩個按鈕,按其中一個按鈕顯示「有意識」,按另一個按鈕顯示「無意識」。按下按鈕後,當前視頻片段會被自動保存在正確標記的文件夾中。這個過程非常無聊,花了他很多很多天的時間。

  3. Alex 為這些圖像建立了一條數據管道,可以將飛行員從駕駛艙的背景中裁剪出來,以便使他的分類器更容易地將注意力集中在飛行員身上。最後,他建立了他的意識喪失分類器。

  4. 在做這些工作的同時,Alex 也在社交活動中向招聘經理展示他項目的照片。每次當他拿出手機展示他的項目時間,他們問會他是怎麼做到這些的,關於他如何建造管道,以及他如何收集數據。但是他們從來沒有抽出時間去問過他的模型的精確度--低於 50%。

Alex 當然打算提高他的準確性,但是在做這個事情之前他就被錄用了。事實證明,他的項目所帶來的視覺衝擊,以及他在數據收集方面不屈不撓、足智多謀的特質,對公司來說比他的模型實際有多好更重要。

我提過 Alex 是主修歷史輔修俄語研究嗎?

他們有什麼共同點?

是什麼讓 Ron 和 Alex 如此成功?因為他們做到了下面四點:

  1. Ron 和 Alex 沒有花太多精力去建模。我知道這聽起來很奇怪,但是對於現在許多用例來說,建模是一個已經解決的問題。在真正的工作中,除非你做的是最先進的人工智能研究,否則無論如何,你將花費 80-90% 的時間來清理數據。是什麼讓你的個人項目與眾不同?

  2. Ron和Alex收集了他們自己的數據。正因為如此,它們最終得到的數據比 Kaggle 或 UCI 數據庫中的數據更混亂。但是這些混亂的數據教會了他們如何處理混亂數據。相比從學術服務器下載數據,這種方式讓他們更好地理解了他們的數據。

  3. Ron 和 Alex 創造了可以被看到的東西。面試不是讓你的技能被一個通曉一切的面試官客觀地評估,而是一個向別人推銷自己的過程。人類是視覺動物。所以,拿出你的手機,向面試官展示你所做的一切吧,確保你所做的看起來很有趣是值得的。

  4. Ron 和 Alex 的所作所為看起來很瘋狂,實際上也很瘋狂。一般人不會把手機綁在購物車上。普通人不會花時間從 YouTube 視頻中裁剪飛行員,你知道誰會幹這種事情嗎?想盡所有辦法都要達到目標的人。而公司真的很想僱傭這些人。

Ron 和 Alex 看起來似乎做了太多的工作,但實際上,這並不比你在一份真正的工作中所需要做的事情多。這就是最關鍵的一點:當你沒有做 X 的工作經驗時,招聘經理會從你做過的事情中尋找那些和 X 相關的事情。

幸運的是,你只需要構建一兩個項目---Ron 和 Alex 的項目在他們所有的面試中被反覆使用。因此,如果要我用一句話概括一個偉大的機器學習項目的秘密,那就是:構建一個帶有一個有趣的數據集的項目,這個數據集必須是花費了顯而易見的努力收集來的,並使這個項目儘可能給人以深刻的視覺印象。

雷鋒網


分享到:


相關文章: