智通分享 | 知識圖譜是人工智能的基石

智通分享 | 知識圖譜是人工智能的基石

進入21世紀以來,人工智能依靠機器學習和深度學習取得了快速進展,但對於機器的訓練,需要人類的監督以及大量的數據來餵養,而這些數據需要大量的人工去堆砌,對於強人工智能而言,這是不可取的。要實現真正的類人智能,機器還需要掌握大量的常識性知識,以人的思維模式和知識結構來進行語言理解、視覺場景解析和決策分析。

知識圖譜是人工智能的基石

知識圖譜用節點和關係所組成的圖譜,為真實世界的各個場景直觀地建模。通過不同知識的關聯性形成一個網狀的知識結構,對機器來說就是圖譜。

形成知識圖譜的過程本質是在建立認知、理解世界、理解應用的行業或者說領域。每個人都有自己的知識面,或者說知識結構,本質就是不同的知識圖譜。正是因為有獲取和形成知識的能力,人類才可以不斷進步。

知識圖譜對於人工智能的重要價值在於,知識是人工智能的基石。機器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動物也具備感知能力,甚至某些感知能力比人類更強,比如:狗的嗅覺。

而“認知語言是人區別於其他動物的能力,同時,知識也使人不斷地進步,不斷地凝練、傳承知識,是推動人不斷進步的重要基礎。” 知識對於人工智能的價值就在於,讓機器具備認知能力。

而構建知識圖譜這個過程的本質,就是讓機器形成認知能力,去理解這個世界。

知識圖譜的技術:

知識圖譜以語義分析技術為基礎,以模型為核心,基於數據,利用深度神經網絡、NLP框架語義理解等智能處理技術對輸入的字、詞、篇章進行多層次、多維度的信息分析,提供可遠程調用的實體抽取、關係抽取和屬性抽取等算法服務接口能力。領域知識圖譜構建平臺能夠服務不同行業和應用場景。

構建知識圖譜是一個迭代更新的過程,根據知識獲取的邏輯,每一輪迭代可分為三個階段:

  • 信息抽取:從各種類型的數據源中提取出實體、屬性以及實體間的相互關係,在此基礎上形成本體化的知識表達;
  • 知識融合:在獲得新知識之後,需要對其進行整合,以消除矛盾和歧義,比如某些實體可能有多種表達,某個特定稱謂也許對應於多個不同的實體等;
  • 知識加工:對於經過融合的新知識,需要經過質量評估之後(部分需要人工參與甄別),才能將合格的部分加入到知識庫中,以確保知識庫的質量。
智通分享 | 知識圖譜是人工智能的基石

知識圖譜的未來發展

“純粹的通用型人工智能沒有任何意義,人工智能未來的方向一定是行業化。”

因此行業知識圖譜的構建顯得尤為重要,首先,構建行業知識圖譜系統應以海量數據匯聚融合、快速感知和認知、強大的分析和推理、自適應與自優化和行業智能決策為導向。

通用知識圖譜和行業知識圖譜構建區別:

通用知識圖譜以互聯網開放數據為基礎,以三元組事實型知識為主,較多的面向開放域的Web抽取,對知識抽取的質量有一定容忍度,以知識融合提升數據質量,應用領域主要在搜索和問答方面,對推理要求較低。

行業知識圖譜以領域或企業內部的數據為主要來源,通常要求快速擴大規模,構建行業壁壘,知識結構更加複雜。知識抽取的質量要求很高,較多的依靠從企業內部的結構化、非結構化以及半結構化數據進行聯合抽取,需要依靠人工進行審核校驗,來保證質量。通常多來源的領域融合是數據擴大規模的有效手段。行業知識圖譜的應用形式很全面,除搜索問答外,還包括決策分析、業務管理等,對推理的要求更高,並有較強的可解釋性要求。

大數據的採集分析和計算力已經不再是阻礙,難點在於算法背後的知識圖譜構建。實際中,企業數據和業務變化靈活,因此數據源、數據結構、數據內容隨時會發生變動,對業務的理解以及對數據的解讀也隨之發生變化。因此,建立實時敏捷、靈活可擴展、智能自適應的動態知識圖譜尤為重要。

行業知識圖譜的重要性

由於IT時代的快速發展,形成了數據的聚集,促進了DT時代的來臨,數據與算法作為基礎為知識圖譜的構建提供了新的可能性,而知識圖譜作為AI的支撐基礎,雖然發展緩慢,卻是人工智能的必經之路。其在語義搜索、智能問答、數據分析、自然語言處理、視覺理解等方面已展現出越來越大的價值。

基於語音對話系統構建的機器人,要想機器人好玩有趣,就需要建立通用知識圖譜,使機器人具有強大的邏輯,瞭解人與人的關係,人與物的關係,人的屬性、物的屬性,理解人類世界的關係鏈,靈活應對用戶的各種聊天需求,使機器具有類人智能。而

行業知識圖譜則幫助用戶解答關於行業的任務型需求,輔助用戶決策,反向幫助人類學習。

智通科技為某油田專屬打造的智能問答機器人,基於油氣知識圖譜並使用分詞、實體識別與消歧等自然語言處理技術,將用戶輸入的自然語言中包含的實體與知識圖譜中的實體進行準確鏈接,使機器人可以理解用戶輸入的自然語言中包含的真正意圖,從行業知識圖譜中抽取精確的內容對用戶進行直接問答、統計問答、推理問答。


智通分享 | 知識圖譜是人工智能的基石

智通科技智能問答機器人小K

如今,人工智能屬於發展初期,主要以技術驅動行業發展,企業在以行業+AI為核心的同時,更應重視行業+知識圖譜。未來技術肯定不是公司的核心競爭力,而多年積累的行業數據才是壁壘,數據養育AI,AI反哺數據。

智通分享 | 知識圖譜是人工智能的基石

智通科技構建石化行業知識圖譜,建立千萬級的知識網絡關聯節點

智通科技研發團隊擁有近十年行業浸潤與技術積澱,形成了行業知識圖譜構建與應用的解決方案,

並已在石油石化、軍工、政府等行業應用。智通科技為中國石化建立了集團級知識管理平臺,從百萬數據與信息中抽取知識點,基於勘探開發知識體系的框架,構建行業知識圖譜,形成勘探開發科研特色知識庫。實現了知識圖譜在複雜業務中實現多源異構大數據的融合匯聚、分析挖掘,並通過搜索、問答、推薦等智能化知識服務,幫助業務人員快速、全面、準確解答關於行業的知識需求,有效提升業務洞察力、提高整體工作效率與質量。

智通科技作為專注於利用人工智能技術賦能企業智慧化轉型的國家高新技術企業,利用先進的知識圖譜、自然語言處理、大數據、物聯網等技術與產品,構築智慧語義、智能製造兩大核心業務,並打造語義魔方、知識工程平臺、數字工廠平臺三大旗艦產品,為行業用戶提供領先的產品和解決方案,是基於新一代AI技術的智能製造領航者。

未來智通科技將充分利用新一代AI技術,賦能更多的企業在智能化轉型的路上走的更高更遠。


分享到:


相關文章: