搜狗搜索榮獲MIND新聞推薦競賽冠軍

近日,搜狗搜索在由微軟亞洲研究院和微軟新聞產品團隊聯合舉辦的“MIND新聞推薦比賽”中技壓群雄,擊敗來自加拿大、法國、韓國等全球各地的技術團隊,榮獲國際比賽第一名。

搜狗搜索榮獲MIND新聞推薦競賽冠軍

(圖片:比賽官網截圖)

眾所周知,推薦技術在新聞資訊(今日頭條),短視頻(抖音,快手),商品推薦(淘寶)等領域取得了巨大的成功,得到了工業界和學術界的廣泛關注。與產品推薦、電影推薦或是餐廳推薦領域通常有一些公認的基準數據集不同,在新聞推薦領域,高質量的基準數據集比較匱乏,一定程度阻礙和制約了這一領域的深入研究。

為此,微軟亞洲研究院聯合微軟新聞產品團隊在ACL 2020上發佈了規模最大的英文新聞推薦數據集MIND,並舉辦了 MIND 新聞推薦比賽。此次的比賽正是基於MIND新聞推薦數據集展開,在全球範圍內徵集最優秀的個性化新聞推薦解決方案,更好地推動新聞推薦領域的技術發展,以改善用戶的新聞閱讀體驗。

而作為本次國際比賽的冠軍隊伍,搜狗搜索在本次競賽中再次彰顯出了專業的技術實力。憑藉著自身在搜索領域和推薦算法方面多年的技術深耕和積累,搜狗搜索在本次比賽中採用了多角度信息綜合建模的方案,單一模型通過融合多個降採樣數據集取得較好效果。搜狗搜索提供的解決方案各項指標數據均領先,最終在本次國際競賽中奪冠

具體而言,在數據處理方面,針對正負樣本不平衡,正樣本率只有4%的情況,搜狗搜索做了1/5負樣本降採樣,並由此構建了5份不同數據集(負樣本不同),有效節約了單模型訓練時間,並且單模型效果和使用全量數據相比並沒有明顯效果衰減。除此之外,在文本建模方面,利用BERT的BPR分詞器,採用文檔內部詞彙Attention,文檔間利用要預測的目標新聞進行Attention綜合建模。最後,通過DNN+DIN注意力機制+DLRM(特徵交叉)的結合進行多角度特徵融合,包括用戶ID、文檔ID、類別、實體、標題、摘要和正文特徵等,對多角度信息進行有效融合,使得新聞推薦做到更加精準和個性化。更值得一提的是,搜狗搜索的這些領先技術目前已在包括搜狗搜索APP、搜狗手機瀏覽器等多款產品中落地應用。

搜狗搜索榮獲MIND新聞推薦競賽冠軍

(圖片:技術原理示意)

作為連接人、服務,信息甚至是知識之間的橋樑,搜索技術和推薦技術應用場景雖有差異,但是背後的技術有很大的關聯。搜狗搜索作為國內領先的搜索引擎,在推薦技術和搜索技術有長足的積累和領先優勢,才使得搜狗搜索能在與世界各地的技術團隊競賽較量中脫穎而出,一舉奪冠。


分享到:


相關文章: