參加人工智能大賽,什麼獎品最有吸引力?

AI小師弟


筆者認為, 對於本科生來講,獲得一二三等獎者,獎品沒幹麼吸引力,獲得保研資格應該最有吸引力。


LaoHuang188



嘮悟聊齋


2018數博會組委會消息,2018中國國際大數據融合創新·人工智能全球大賽總決賽暨頒獎禮,將於5月25日在貴陽舉行,10支進入總決賽的團隊,將在9位評委的評判下,為這場為期4個月的大賽劃下句點,一等獎將獲得100萬獎金。


縱橫交錯兮天下之局


看完這篇文章你就知道價值何在。

我們來分析一下要較好的完成一個賽題,需要經過哪些關鍵環節,如果參賽者的能力水平已經足夠支撐其完成這些環節,那麼就基本具備參賽的能力要求。一般而言,參與一場AI競賽主要的動作包括:

第一, 對賽題進行理解,尤其是大致瞭解企業提供的數據,包括數據特徵變量、目標變量的分佈,並分析變量之間的相關度,發現一些高相關或共線性的特徵。

第二, 數據處理和清洗,數據特徵值缺失的處理,如果數據中包含文本則需要進行數據清洗。

第三, 特徵工程,包括特徵變換和特徵編碼。針對一些長尾分佈的特徵,需要進行冪變換或者對數變換,使得模型能更好的優化。對於離散的類別特徵,往往需要進行必要的特徵轉換/編碼才能將其作為特徵輸入到模型中。

第四, 算法模型的選擇、融合和驗證,對於某類AI問題比如計算機視覺、語音識別、自然語言理解等,有大量開源算法模型,每個模型都有其優勢和侷限,要解決特定的問題往往需要多個算法模型進行融合,而不同算法模型的選擇和融合對結果的影響很大,這也是一個解決方案的關鍵。當然,比較厲害的團隊可以根據問題開發一些新的算法模型。

第五, 參數設置。選好了算法模型後,最重要的工作就是參數設置,不同的參數往往導致結果差異巨大,也是區分不同參賽團隊實力的重要因素。

在上面的幾個步奏中,前面兩個步奏屬於準備工作,關鍵的是後面三步。區分不同方案優劣的關鍵,是特徵工程、算法模型的選擇和融合、參數設置,這也是不同團隊實力的主要體現。回到開始那個問題,要參加這樣一個AI競賽,或者說要用AI技術解決企業的業務問題,需要具備哪些知識和能力,學生群體具備這樣的知識和能力嗎?

大體上來看,一個合格的AI開發者需要具備的能力包括:計算機科學基礎和編程能力,這需要學習一些計算機的基礎課程並學習一些編程語言;數理基礎,主要是概率論和數理統計,大學在本科一二年級時一般會開設相關的課程;數據處理、數據建模的基本能力,這個學習一些相關課程也能基本具備,關鍵的是培養對數據的敏感度和分析能力;一些通用算法的學習和理解,尤其是機器學習、深度學習方面的算法,大部分算法都可以通過開源渠道獲得,入門門檻不高,學習的時間和本身天賦導致最終能力的差異;軟件工程能力,要解決一個業務問題,需要具備一定的軟件工程能力,這個門檻也不高,並且隨著經驗的積累能力也逐步提高。事實上,企業內部要用AI技術來解決其業務問題、開發新的應用程序,對開發人員也基本是這些要求,只是他們具有更多的業務知識並且技術更熟練而已。

通過與參賽團隊與企業的溝通,改變了我對開發AI技術方案的看法。在我原來的認知中,覺得AI技術方案的開發是一個進入門檻很高的事情,即使不是某個大企業的技術大牛,也得是某個名校的博士。其實,AI開發這件事情,進入門檻並不是那麼高,具備基本的編程能力、數據處理分析能力,並能應用機器學習算法,原則上就可以進行類似的開發。當然,進入門檻不高並不代表誰都可以做,更不代表誰都能做的好。

不是“過家家”,而是真實AI應用場景解決方案

通過這次賽事,我獲得的另一個感受就是,比賽不是“過家家”,大部分的賽題都有真實的業務內涵。多數企業都是帶著問題來的,想借助優秀的方案解決自己的困惑,至少能得到一些解決問題的思路。

以螞蟻金服出的賽題“商場中精確定位用戶所在店鋪”為例,目前手機端的定位主要是GPS,但是GPS定位偏差達到10米以上,並且室內的GPS定位能力不好,目前室內精準的用戶定位還沒有成熟的解決方案。但是,室內精準用戶定位本身是具有很大應用價值的,基於此可以衍生出廣泛的商業應用前景。比如當用戶走入商場的某家餐廳時,手機會自動彈出該餐廳的優惠券;走入商場服裝店時,手機可以自動推薦這家店裡用戶喜歡的衣服;路過商場一家珠寶店時,手機可以自動提示用戶想買的一款鑽戒已經有貨了;離開商場停車場時,手機在用戶的許可下可以自動交停車費總。總之,在正確的時間、正確的地點給用戶最有效的服務,是各大互聯網公司智能化拓展的新戰場,而室內精準的用戶位置定位則是關鍵。

把視角放大一點看, 應用場景已經成為AI企業商業落地的關鍵。

相對於企業獨立研發,AI競賽是一種高性價比的互補方案

依據一定的技術基礎和業務場景需求,企業大多通過獨立組織相關人才與資源,進行技術研發並給出解決方案。AI競賽給企業提供了另一種選擇——將自身的問題、數據打包成賽題,通過競賽來收集大量的解決方案,從中篩選合適的方案和團隊。誠然,很多時候通過競賽得到的答案並不能全部解決企業的業務需求,但收集的解決方案依然是有價值的,至少能給企業提供最終解決問題的思路。那麼,AI競賽作為一種替代方案,對企業而言其性價比如何?在此我們還是以螞蟻金服為例進行分析,要獲得室內精準定位方案,螞蟻金服可以獨立研發,即使採取騰訊的套路,多個團隊分別研發進行競賽,由於人才和資源的限制團隊數量不會超過5個。另一方面,通過這次CCF“大數據與計算智能大賽(Big Data & Computing Intelligence Contest, BDCI)”,有1545支隊伍為其提供解決方案,這在企業內部是不可想象的。

賽題、歷練和友誼,是比獎金更有吸引力的東西

上面從企業角度,分析了AI競賽的價值,下面我將從參賽選手角度,來看看這類競賽的價值。為什麼要參加競賽,這是參賽者關心的問題,也是主辦方需要回答的問題,因為這直接決定了AI競賽對優秀人才的吸引力,而參賽者的質量直接決定了整個競賽的質量。

在一般的認知中,吸引參賽者的因素首先是獎金,其次是進入理想企業的機會。通過與這次BDCI大賽選手的廣泛交流,我對這個問題也有了一些全新的認識。其實,相比於獎金和職業機會,參賽者更關注賽題本身的質量、整個競賽過程給自己的歷練,以及收穫的來自隊友和對手的友誼。

對於AI競賽,不只是企業和賽事舉辦方篩選參賽者,參賽者本身也會對賽事和賽題進行選擇。對於一個AI競賽,參賽者首先關注的就是賽題本身:這個賽題是不是有實際的業務價值,賽題難度如何,與自己的專業、研究領域或者目前工作是否相關,出題的企業背景如何,該賽題給出的數據質量如何等,這些是參賽者最關心的問題。那些互聯網巨頭髮布的本身具有一定業務內涵且富有挑戰、企業能給出大量高質量數據的賽題,往往更能獲得參賽者的親睞。

這裡,我重點分析一下出題方給出的數據對於參賽者的價值。在AI領域,數據與算法是科學研究與產品技術研發的核心。高質量訓練數據對機器學習模型的建立和優化有關鍵性的作用。大規模、高水準且具有真實場景內涵的標註數據集,是推動AI科研和技術前進的關鍵驅動力。對於有志於投身AI相關領域的人員,這些高質量的數據是珍貴的,尤其是在校學生,很難接觸到這些來自真實商業世界的高質量數據。以語音識別為例,對於學校這類學術單位來說,最大的問題是沒有足夠的資源收集、清洗、標註大量的語料;而對小公司和創業團隊來說,語料和計算力都是問題。

通過參加BDCI這類AI競賽,出題企業會提供大量相關數據,供參賽選手分析使用。以室內商家精準定位賽題為例,螞蟻金服提供在2017年8月份大概100家商場的詳細數據,包括用戶定位行為和商場內店鋪等數據(已脫敏),參賽隊伍可以對其進行數據挖掘和必要的機器學習訓練。另外,螞蟻金服還提供2017年9月份的商場內用戶數據來做評測,檢測參賽者的算法是否能準確的識別出當時用戶所在的店鋪。對於在校學生、科研人員以及其他企業的研發人員而言,這些數據是非常難得的。

在採訪的參賽隊伍中,大部分都是由學生或在職人員獨立參賽、獨立組隊,有一個參賽團隊比較獨特,他們是由一個輔導老師帶領團隊,團隊內部既有研究生也有本科生。其輔導老師認為,參與這類AI競賽並不是對學生學業的耽擱,相反是一個很好的學習機會。他坦言,隊伍中一些低年級學生還不具備獨立參與這類競賽的能力。但是,他認為不是因為有足夠的能力才來參賽,而是通過參賽來快速培養相應的能力。


小小趙湯圓


不論你面向的參賽選手是社會人還是學生,有吸引力的獎品一定是能夠滿足對方物質需求和精神需求雙重層面的。有錢出錢,有資源談資源。

【物質層面】:

1.現金

2.針對參賽選手的大致取向可以選擇人工智能大廠的實習/工作推薦名額

3.預算充足的情況下可以是高端電子產品。比如適合工作學習的MacBook、iPad、iPhone;

4.或是各種機器人產品比如優必選家的機器人系列

【精神層面】

可以讓選手有充分的分享欲去凸顯自己的價值。比如:

1.設計高端的獎盃和證書,這個是必備選項。

2.某知名人工智能行業的一對一對話(這個就像有一個有著豐富的同行業前輩為你領路一樣,這種經驗也不是錢能買來的)

3.獲獎選手一般都是這一領域的佼佼者,還可以為Ta頒發聘書,組建一個相關領域的專家和獲獎選手的社群,日後一可以作為前輩返場分享經驗;二可以作為積累人脈、樹立個人品牌的途徑。對於比賽主辦商來說也是一件兩全其美的好事。

以上兩個層面缺一不可,可以根據自己的預算和資源自由組合。這種獎品搭配方式除了可以吸引更多的參賽選手,讓參賽選手爽到之外,長期進行下去還有助於主辦商提高自己的品牌,建立行業公信力,積累更多行業資源。


分享到:


相關文章: