專訪|雲腦科技張本宇:尋找跨行業跨場景的技術航道

這裡用到了具有可解釋性的深度學習模型,同時因為是語義模型,也涉及序列學習。因為搜索關鍵詞已經無法滿足人崗匹配需求,因此一定要深入理解語義,才能獲得可解釋性。

使用了人崗匹配應用後,HR 的面試邀約率提高了五倍。

機器之心:雲腦如何選擇切入的行業?

張本宇:最核心的是我們的算法是否能為行業創造價值。細分來看,首先,我們關注行業是否在一個上升通道中。第二,行業中的痛點是否和我們的技術主航道相匹配,我們的技術能否為行業解決問題。第三,我們是否能足夠理解行業的需求,無論是團隊本身還是合作伙伴,是否能切入行業生態,轉變的時間點是不是到了。

機器之心:雲腦在解決問題過程中主要應用了哪些深度學習模型?

張本宇:我們並沒有利用 ResNet 等開源模型,而是根據場景中數據的特點、計算資源的約束,把需要的算法組件重新打散拼接。

例如 LSTM 是常見的處理序列的單元,但是在我們看來它不夠快,我們要清楚它比普通 RNN 模型好在什麼地方,這個好是通過門這個結構實現的,但是門太多了,影響了效率。進一步探索,究竟哪個門用處最大,發現是遺忘門,那麼我們把遺忘門抽取出來和其它更容易並行的模型結構,例如卷積,相結合。結合的方式很簡單:遺忘的反面就是注意力,把遺忘門變成注意力,與其它結構結合在一起。

深度學習並非一個特定的網絡結構,也不存在一個算法通吃所有場景的情形,即使是卷積神經網絡,也要在 CNN 後面加一個 s。用多少層的網絡、需不需要進行批正則化處理,在哪裡加,都是設計變量。因此根據需求和約束研發新模型新算法的能力是解決問題的一個核心能力。


分享到:


相關文章: