倍賽:3項舉措確保數據標註與採集服務高質輸出

近年,人工智能技術發展迅速,其應用場景遍佈於交通、金融、文娛、教育、醫療以及零售等各領域。“AI普及”除得益於算法技術獲取層層突破,位於“基礎層”的“結構化數據”也功不可沒。

作為AI算法的“導師”——結構化數據幫助模型理解數據特徵以及背後意義,最終實現智能化。然而,“導師”的水平差異同時影響“學生”擁有不同的能力表現,即結構化數據的量級和標註精度,將決定模型識別與認知的準確性。


倍賽:3項舉措確保數據標註與採集服務高質輸出

倍賽BasicFinder


作為人工智能數據基礎設施及服務供應商的頭部玩家,倍賽BasicFinder自創立之初始終致力於幫助AI企業通過更低的成本獲取高質量的結構化數據,經過長時間的市場實踐和創新,倍賽BasicFinder“精煉”出3項服務與產出舉措以保證“低成本,高質量”的服務承諾:

1. 追求應用專業設備和專業人員;

2. 應用數據標註與數據採集一體化工具平臺;

3. 高度定製化數據採集與數據標註服務。

下面倍賽BasicFinder將通過3個案例來解讀各舉措效應

語音合成(TTS)數據定製案例

——追求應用專業設備和專業人員舉措解讀

如倍賽BasicFinder曾為某媒體平臺提供有聲讀物的語音合成(TTS)數據定製方案。


倍賽:3項舉措確保數據標註與採集服務高質輸出

語音合成(TTS)數據定製方案

在整體數據解決方案的執行過程中,倍賽BasicFinder充分考慮到客戶語音數據的質量要求、安全性和效率,採取了進一步的控制措施。數據質量方面,倍賽為合作媒體選擇了專業的男女聲優,聲優必須達到普通話一級以上水平(包括一級甲等和一級乙等),同時為聲優選擇配備高品質硬件設備的專業錄音棚錄音。其次,倍賽BasicFinder的語料文本設計師,均為國內知名語言學專家。數據安全方面,我們為媒體平臺提供受採人的授權書,避免客戶受到版權問題困擾。標註效率上,倍賽應用自主研發的標註工具平臺——BasicFinder SaaS,該平臺擁有的語音合成標註工具套件,極大地提升了標註的效率。

短視頻行動識別場景案例

——應用數據標註與數據採集一體化工具平臺舉措解讀

某短視頻平臺曾向倍賽BasicFinder發出數據採集和標註工具採購需求。客戶方的數據採集需求為人的定製動作圖像採集,對於採集環境和設備沒有特殊要求,對工具的要求需支持相應採集數據的語義分割標註作業,而且採集與標註作業將分多個批次,並且每個批次對採集和標註標準都有部分調整。經過詳細溝通,倍賽BasicFinder提出BasicFinder SaaS數據採、標一體化方案。


倍賽:3項舉措確保數據標註與採集服務高質輸出

BasicFinder SaaS 數據標註、採集方案

案例執行過程中,客戶通過使用BasicFinder SaaS 數據標註與採集一體化工具平臺,直接將編制好的需求文檔從平臺發佈,SaaS平臺系統將需求自動同步至“倍賽APP”數據採集眾包平臺。接下來,“倍賽APP”上遍佈於全國各地的10萬+用戶根據項目介紹領取感興趣的任務。“倍賽APP”數據採集眾包平臺的用戶需要通過在線培訓和系統考核合格後方可執行任務。在採集項目的執行過程中亦或尾聲,客戶都可以通過BasicFinder SaaS 工具平臺對數據進行審核、驗收以及下載,當然也可以再次應用BasicFinder SaaS 執行數據標註作業。

該案例客戶通過使用BasicFinder SaaS數據標註與採集一體化工具平臺,客戶降低了尋找數據採集供應商並與之溝通的時間成本,同時增加採集作業和標註作業的連貫性,通過眾包平臺也進一步壓縮了數據採集成本,並增加了數據樣本的多樣性、泛化性。

新零售數據綜合解決方案

——高定製化服務舉措解讀

在倍賽BasicFinder與某零售商的合作中,該零售商希望通過AI技術獲得貨架商品管理能力和營銷分析能力。例如,客戶希望通過實時跟蹤貨架商品庫存變化及時補貨,並對熱銷商品進行AI營銷分析。倍賽BasicFinder基於客戶的場景需求為其提供數據採集和數據標註的綜合解決方案。


倍賽:3項舉措確保數據標註與採集服務高質輸出

新零售數據標註與採集綜合解決方案

首先,倍賽BasicFinder與該零售商開展有效溝通,深度還原應用場景,精準理解客戶需求。


倍賽:3項舉措確保數據標註與採集服務高質輸出

標註數據應用場景還原

其次,倍賽BasicFinder根據數據採集需要搭建環境。倍賽團隊考察數據採集現場,尋找最佳數據採集位置並部署設備。


倍賽:3項舉措確保數據標註與採集服務高質輸出

數據採集環境搭建方案

然後,執行數據採集與數據清洗。數據採集過程中會產生無效或重複數據,通過數據清洗將其去除,為數據標註做好準備。

第四步,對清理完成的數據進行標註。並對已經標註數據進行雙層質檢,確保數據標註精度達標。


倍賽:3項舉措確保數據標註與採集服務高質輸出

標註數據映射應用場景

最後,數據交付。倍賽BasicFinder將標註完成的數據與採集的原始數據交付給客戶進行驗收,驗收滿意後,與客戶確認是否已經備份好數據,為保證客戶數據獨有性,倍賽將清除所有相關數據。

在該案例中,倍賽BasicFinder根據客戶的具體AI應用場景量身定製數據採集與數據標註解決方案,其發揮的重要優勢是直接在貼合場景中採集數據縮減採集時間成本,提升了採集數據的有效率。與此同時,在高效溝通下,標註員也更加理解標註需求,數據標註的質量得到保障。

綜合以上三個案例,可以看出倍賽BasicFinder “精煉”的三項舉措分別對應著“服務態度”“技術工具”“人才與硬件配置”。倍賽通過深度提升相應舉措的輸出標準為客戶提供具有低成本和高品質的產品及服務。


分享到:


相關文章: