創新,讓雲藏與世界“對話”

創新,讓雲藏與世界“對話”

雲藏藏文信息技術孵化基地全景。

创新,让云藏与世界“对话”
创新,让云藏与世界“对话”

工作人員正在忙碌工作。本報記者 欒雨嘉 攝

2019年12月27日,走進海南藏族自治州雲藏藏文信息技術孵化基地,討論區、多功能會議室、咖啡屋、健身房等基礎設施一應俱全;進入辦公區,員工們正在格子間忙碌,技術部的工作人員正在研發新版APP,數據建設部的正在錄入資料,安靜的只聽得見鍵盤敲擊的聲音;屋內的走廊、辦公區擺滿了綠植,讓人感受到張揚的巨大生命力。

其實,雲藏的成長也如這綠植般,生機勃勃而又充滿希冀。

藏文信息技術研究中心主任才洛瞥了一眼放在辦公室桌上“改革創新獎”的獎牌,笑著說:“我知道,你一定是為它而來。”

2013年4月,由藏文信息技術研究中心實施的雲藏藏文搜索引擎建設項目正式啟動,2016年8月22日,“雲藏”作為全國首個藏文搜索引擎正式上線。

“雲藏”一詞由藏文音譯而來,有“全面抓取”之意,也有“老師”之意,即全面抓取各種信息後為用戶們提供個性化的網絡檢索服務。“雲藏”主要包括網頁搜索、新聞搜索、圖片搜索、音樂搜索、視頻搜索、百科系統、文庫系統、知道系統、輿情監測系統、廣告系統等。目前,雲藏搜索用戶訪問總量已突破35億次,日平均訪問量達到1000萬次左右,用戶覆蓋全國31個省市自治區以及70多個國家和地區。

“研發一個藏文的搜索引擎,這本身就是一個創新。”藏文信息技術研究中心的網絡安全技術部負責人官卻多傑說。

“設想一下,如果你的生活裡沒有‘百度’‘搜狗’等搜索引擎,搜索一個東西就得記網址,那麼對用戶來說獲取網絡信息就是一件非常痛苦的事情。而‘雲藏’就是我國各大藏文網站的統一入口,也是一個藏文資源的共享中心,這就為想要查閱藏文資料、歷史古籍以及想要了解藏文化的用戶提供了便利”官卻多傑解釋。

“雲藏”正式上線後,研究中心的工作人員們層層攻克了與之相伴相生的一些技術難題。他們成功研發了藏文自動分詞與語言智能分析系統,實現了藏文同義詞搜索、藏文拉丁轉寫搜索、藏文拼寫檢查系統、藏文語義檢索系統、藏文不同編碼自動轉換等功能,攻克了藏文智能信息處理的核心技術,併成功實現與搜索引擎系統的集成,使“雲藏”搜索引擎有了本土化或藏語化的人工智能特點。這一系統的創新性研發及應用,填補了藏文信息處理應用領域的一大空白。

“打個比方,比如你在‘百度’裡搜‘中華人民共和國’,那麼搜索引擎就會進行分詞,根據你所輸入的關鍵字進行查詢處理後匹配。‘雲藏’的道理相同,藏文自動分詞與語言智能分析系統的作用就是為了使搜索結果更準確、更豐富。”官卻多傑說。

除此之外,創新還體現在研究中心開闢了雲藏百科、雲藏文庫和雲藏知道等共享藏文化的基礎工程,建構了藏文信息資源庫與大數據庫,將卷帙浩繁的藏文文獻典籍數字化。同時還研發了藏文網絡輿情檢測分析系統,為藏區穩定和諧起到推動作用。

隨著雲藏數據量的不斷增加擴充,以前的基礎設施和機房場地等已不能滿足快速發展的需要。2019年10月,研究中心正式入駐到了現在這個集創業、技術孵化、人才培養於一體的雲藏藏文信息技術孵化基地。

改革創新需要只爭朝夕。“雲藏”縮小了藏族和漢族、藏區與內地的信息化水平,我國藏文信息技術發展有了質的飛躍,藏文大跨步進入了搜索時代。互聯網時代,每個人都應該享受到信息化所帶來的成果。這是奮起直追中的藏區的需要,是保護和傳承民族文化的需要,是豐富藏族群眾精神生活、增強團結穩定的需要。同時,這也是解決人民日益增長的美好生活需要和不平衡不充分的發展之間的矛盾的充分體現。

改革創新需要不負韶華。2019年12月,研究中心邀請了西北民族大學的教師針對“雲藏”生態系統建設進行研討,大家一起為“雲藏”未來發展出謀劃策。同時將現有的藏文信息技術和分散的人力財力進行有效整合,目前第一批六家從事藏文信息技術產業的小微企業已入駐。官卻多傑說:“目前我們正在升級新版APP,使它更穩定,功能更強大、更人性化。另外,2019年9月我們在廣州市天河區創業谷創立了分公司,招聘了5個人,團隊的實力大大增強了。依託那裡的技術、IT人才以及工作氛圍,我們創新的意識就更強了!”


分享到:


相關文章: