AI時代,語你同行。如何打造一個智能的機翻引擎?

本月語言橋集團參加成都新經濟企業創新加速營·三期CTO Day。本次CTO Day聯合了亞馬遜AWS雲創計劃及成都市動漫遊戲協會,邀請機器學習領域專業導師團隊通過主旨分享、圓桌論壇、實戰訓練、分組討論等形式,帶領新經濟企業瞭解並掌握機器學習應用,幫助企業更高效率地解決問題,加速實現創新戰略。

分享討論

本次論壇交流嘉賓:中文知識圖譜zhishi.me創始人王昊奮、四川大學計算機學院副院長章樂、AWS雲計算解決方案架構師、AWS雲計算華西區首席架構師、AWS雲計算業務發展經理等。各位導師為企業家們帶來創新文化分享、技術講解以及實戰指導。

與會代表就新經濟企業的創新戰略、機器學習基本流程、前沿趨勢、未來機遇等內容進行了深入學習和探討,共同挖掘機器學習在當前新經濟發展趨勢下的應用前景。

AI時代,語你同行。如何打造一個智能的機翻引擎?

(新經濟發展研究院iNED創新中心總監李穎女士主持現場)


上午的主題為創新領導力工作坊,由中文知識圖譜zhishi.me創始人王昊奮率先開講,從企業創始人的角度先對人工智能的發展困境與行業優勢進行分析,之後剖析優秀產品經理需要具備的品質,最後以智能客服為例,從市場調研開始講述設計AI產品的全步驟,幫助企業形成較為全面的行業認知。

AI時代,語你同行。如何打造一個智能的機翻引擎?

(中文知識圖譜zhishi.me創始人王昊奮先生進行現場分享)

AWS亞馬遜雲計算業務發展經理則以亞馬遜創新的四個信條:用戶至上、長期效益優先、創新發明的前提是接受失敗、接受長期被誤解為指引,輔以生動細緻的事例進行解讀。並從四個角度提出確保創新不偏離方向的關鍵:機制上可以採取逆向工作法流程,架構上嘗試構建微服務架構、松耦合應用和自服務平臺,文化上需重視創新簡化、崇尚行動、勤儉節約,組織上力求打造目標一致而又松耦合的、為速度而優化的雙披薩團隊。

AI時代,語你同行。如何打造一個智能的機翻引擎?

(“新經濟企業創新文化”分享)

聚焦熱點話題DevOps(研發運維一體化),AWS亞馬遜雲計算華西區首席架構師將其解構為組織架構和文化、工程實踐和模式以及工具,以Amazon、Netflix、Airbnb的部署為例,帶領企業總結持續交付的要點,如保留模版以供內部知識分享、自動化一切、建立自服務門戶等。

AI時代,語你同行。如何打造一個智能的機翻引擎?

(“研發運維一體化(DevOps)的落地實踐”分享)

立足“CTO——企業管理中的硬實力”,王昊奮先生認為CTO要同時注重對內和對外的職能,對外應知道企業在產業鏈中的位置,對內應提升開發效率、開拓眼界、平衡團隊人員。就AI機器學習與成都結合的應用場景,AWS亞馬遜雲計算業務發展經理認為最為關鍵的是要把控解決什麼問題、受眾是否買單和受眾出資金額三個要點。四川大學計算機學院副院長章樂先生指出,成都因其地理及人文環境,在醫療、無人駕駛、5G等行業蘊藏潛在發展空間。


機器學習動手訓練營

在“機器學習動手訓練營”中,由AWS亞馬遜雲計算解決方案架構師帶領新經濟企業技術人員完成客戶流失預測的動手實驗,涵蓋數據的探索和轉換,模型的訓練、託管、優化及部署全過程。他同時指出,高質量的數據是構建良好數據模型的基礎,如何設置考慮了真陽性,假陽性和假陰性結果成本的最佳閾值是建立最佳推理模型,使企業獲得最高收益率的關鍵。


對於機器翻譯項目,我們面臨的是快速迭代、快速試錯的需求。數據蒐集->數據清洗->數據預處理->訓練模型->模型測試->模型部署是一整套的流程,分離職責,關注接口,CICD這種自動化測試部署的流程規範貫穿始終。這樣可以使我們專注於代碼功能的改進與開發,對於固定的流程要形成標準化的流水線任務作業。對於後期開發,公司內部也將建立一套DevOp式的開發管理工作流。

AI時代,語你同行。如何打造一個智能的機翻引擎?

AI時代,語你同行。如何打造一個智能的機翻引擎?

(機器學習動手訓練營)


牽手AI,語你同行

機器翻譯是AI發展三次浪潮中都得到快速發展的領域,對於分享中提到的工業界落地AI的三大困境,語言橋設立了三項指導要求。


1

深挖行業痛點。對於機器翻譯項目來說,有效的將機器翻譯與行業需求緊密結合,在做產品的過程中應當著重解決人工翻譯中發現的痛點。

2

清楚AI的邊界,管理期望。目前AI畢竟還無法做到真正理解語言,作為產品經理和技術人員應當清楚認識AI的邊界,對於產品有正確的目標預期。


3

建立清晰評價標準,質量體系。對於機器翻譯項目來說,我們不能僅僅以BLEU值作為評價標準,應當建立綜合機器、人工、用戶評價的綜合評價體系,可以為產品迭代提升指明方向。


為了讓翻譯服務高效化、流程化、多元化,公司自主研發併成功發佈了多款技術產品,其中與機器翻譯相關聯產品有:

在線翻譯輔助平臺LanCAT、機翻平臺MT.doc和會議雲同傳“手機聽會”。

展望未來,公司將以“翻譯智能化”為目標打造AI之路。我們將結合公司自身語料數據特性打造一個在垂直領域精準度和相關度方面都很高的“機器翻譯”引擎(確定AI邊界),通過優化垂直領域相關度和準確率來提升翻譯質量,將“機翻引擎”應用在其他有語言服務需求的教育、醫療、遊戲動漫、影音製作等領域,開拓“垂域機翻”系列產品道路。


分享到:


相關文章: