10.22 基於NLP的商務文本數據清洗關鍵技術研究項目招標公告

從中國電力集採招標網(www.dljczb.com)瞭解到:中國水利電力物資集團有限公司基於NLP的商務文本數據清洗關鍵技術研究項目招標公告

項目名稱:基於NLP的商務文本數據清洗關鍵技術研究項目招標-2019年11月中國水利電力物資集團有限公司項目

招標編號:CWEME-1910ZSWZ-2J039

招 標 人:中國水利電力物資集團有限公司

招標方式:國內公開招標

所屬地區:北京

所屬行業:能源電力受中國水利電力物資集團有限公司的委託,就基於 NLP 的商務文本數據清洗關鍵技術研究項目招標-2019 年 11 月中國水利電力物資集團有限公司項目進行國內公開招標,歡迎滿足資質要求的單位參加。

項目簡介:

中國水利電力物資集團有限公司(以下簡稱“物資集團”)是中國大唐集團公司全資子公司,註冊資本10.12億元。主要經營招標代理、進出口代理、管道及油料供應、工程技術諮詢、備品配件、設備監理、工程物資管理、碳資產開發、安全性評價、煤化工綜合服務、電子商務等業務。

本項目結合物資公司關於從海量文檔中提取有價值信息的現實需求,以物資公司歷年積累的商務文本數據作為研究對象,內部數據包括採購計劃、物資採購、工程建設、合同履約、供應商和用戶綜合管理數據,結合外部環境數據包括行業已購買的第三方商務通用供應商數據,通過研究機器學習和知識圖譜的文檔預處理,文本分類(聚類)、抽取、清洗、轉換、存儲和推理等數據處理關鍵技術,採集文本中蘊含的潛在相關因素,發現主要原因和次要原因,尋找普遍的模式和規律等(如計劃規劃分析、價格趨勢、設備參數、供應商行為分析、用戶採購行為分析以及風險預警等)的方法與技術,並開發相應原型系統。具體研究需求包括:

1.1文本數據挖掘關鍵理論與技術研究

基於機器學習的海量文檔預處理方法研究

文本分類與聚類方法研究

基於機器學習的文本信息抽取方法研究

基於知識圖譜的文檔知識存儲和推理研究

1.2商務文本數據清洗原型系統開發

實現商務文檔的清洗、分析功能。提供對文本的詞頻、詞雲分析,且提供至少兩種以上算法供選擇,並能比較不同算法的效果;能自動生成文本的結構樹、摘要;提供核心詞彙的權值分佈分析功能。

商務文件內容的關聯查詢。通過知識圖譜技術的應用,實現文本內容的關聯查詢,即自動將相關信息推薦給用戶。

1.3商務文本數據挖掘原型系統實證測試

商務文本數據挖掘原型系統實證測試:基於物資公司的商務文本數據對原型系統進行實證測試。

1.4研究成果交付

項目形成的研究報告

基於NLP的商務文本數據清洗關鍵技術研究報告

項目形成的論文(級別、數量、時間)

項目研究週期內發表學術論文不不低於1篇(EI檢索或中文核心)

項目形成的專利(級別、數量、時間)項目研究週期內申請國家發明專利不低於1項

項目形成的原型系統

開發基於NLP的商務文本數據清洗原型系統,技術成熟度達到TRL4。

項目形成的測試報告原型系統的測試報告

項目研究過程中形成的其他技術文檔

其他包括但不限於系統概要設計、詳細設計、彙報材料和測試報告、成果評審等相關文檔材料。

招標範圍:

中國水利電力物資集團有限公司“基於NLP的商務文本數據清洗關鍵技術研

究”項目招標。

具體工作內容以招標文件為準。


分享到:


相關文章: