谷歌開源可擴展的TensorFlow庫,可用於排名學習|論文+代碼

銅靈 發自 凹非寺

量子位 出品 | 公眾號 QbitAI

最近,谷歌新開源了可擴展的TensorFlow庫TF-Ranking,可用於學習排序。所謂學習排序,也就是對項目列表進行排序,從而將整個功能最大化的過程。

TF-Ranking中有一套完整的學習排序的算法,包含成對或列表損失函數、多項目評分、排名度量優化和無偏見的學習排名。

谷歌在官方博客表示,TF-Ranking在創建高質量排名模型時速度快且易於使用,這套統一的框架能幫助ML研究人員、從業者和愛好者能夠在單個庫中評估和選擇一系列不同的排名模型。

谷歌還提供了靈活的API,用戶可以在其中定義和插入自己的自定義損失函數、評分函數和衡量標準,開發自己的自定義模型。

支持現有算法和衡量標準

TF-Ranking的適用性很廣,既可支持目前廣泛使用的排序學習算法,還能通過嵌入和擴展到數億個訓練示例來處理稀疏特徵。

TF-Ranking支持許多常用的排名衡量標準,包括平均倒數排名(MRR)和NDCG,還可以在TensorBoard(開源TensorFlow可視化儀表板)上顯示這些標準。

谷歌開源可擴展的TensorFlow庫,可用於排名學習|論文+代碼

多項目評分

TF-Ranking支持與以往不同的評分機制,比如,可以挑戰一把多項目評分。這是此前的一個難以進行推理的行業瓶頸。

TF-Ranking提供的List-In-List-Out(LILO)API能將所有這些邏輯包裝在導出的TensorFlow模型中。

谷歌開源可擴展的TensorFlow庫,可用於排名學習|論文+代碼

研究人員在論文中介紹說,讓TF-Rankin在公共LETOR基準測試中進行多項目評分,進而與RankNet、MART和LambdaMART等最先進的學習模型相比,TF-Rankin具有競爭力。

優化排名標準

學習排名中的一個重要研究挑戰是排名標準的直接優化。在TF-Ranking中,研究人員提出了一種新方法LambdaLoss,是為排名標準優化準備的概率框架。

在此框架中,可以通過期望最大化過程來設計和優化標準驅動的損失函數。

除了上述特徵外,研究人員最後再次強調, TF-Ranking也是一個無偏見的排序學習庫。

這篇新博客就醬,對TF-Ranking感興趣的話,可進一步探索以下官方資料:

傳送門

博客地址:

https://ai.googleblog.com/2018/12/tf-ranking-scalable-tensorflow-library.html

論文地址:

https://arxiv.org/abs/1812.00073

谷歌開源可擴展的TensorFlow庫,可用於排名學習|論文+代碼

代碼地址:

https://github.com/tensorflow/ranking

教程地址:

https://github.com/tensorflow/ranking/tree/master/tensorflow_ranking/examples

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態


分享到:


相關文章: