華為開源“河圖引擎”:像使用“數據庫”一樣使用“大數據”

經濟日報-中國經濟網深圳11月19日訊(記者 李方) 今日,華為在深圳舉辦2019全球數據基礎設施論壇,面向鯤鵬計算產業,宣佈全面啟動數據基礎設施戰略,並開源數據虛擬化引擎HetuEngine(河圖引擎),希望讓合作伙伴像使用“數據庫”一樣使用“大數據”,讓數據治理、使用更簡單。這是繼今年9月基於“鯤鵬+昇騰”雙引擎全面啟航計算戰略後,華為從數據角度對計算戰略的再度闡述。華為數據基礎設施戰略圍繞數據“採-存-算-管-用”的全生命週期,通過提供融合、智能、開放的數據基礎設施使能各行業釋放數據價值。

隨著5G、AI和雲的普及,數據量正以驚人的速度增長:從1080P到4K、8K,視頻數據量將提升40倍,從4K到4K VR要增加6倍以上;未來每輛自動駕駛汽車每天就會產生高達64 TB數據;深圳一個城市有超過200萬攝像頭,每天將產生80 PB數據,平均保存30天;大量數據過去只需存幾天,現在需要保存幾個月甚至永久保存。根據預測,全球數據量將從2018年的33 ZB快速增長到2025年的180 ZB。但是,產生的數據中僅有不到2%被保存,而被保存的數據中僅有不到10%被應用。

面對找數難、取數難、用數難等挑戰,華為Cloud & AI產品與服務總裁侯金龍表示,“我們希望對數據的採、存、算、管、用實施端到端的整合和優化,讓數據在全生命週期內更好用,數據的每比特發揮價值最大,數據的每比特成本最優,讓合作伙伴像使用‘數據庫’一樣使用‘大數據’。”

华为开源“河图引擎”:像使用“数据库”一样使用“大数据”

華為Cloud & AI產品與服務總裁侯金龍在大會上發表主題演講

為實現這個追求,華為打造融合、智能、開放的數據基礎設施,讓數據系統從孤立走向融合,從複雜走向智能,從封閉走向開放。通過“打破數據處理與數據存儲的邊界”,實現數據高效共享和分析,降本增效;通過“AI+存儲+雲”,實現數據全生命週期內智能管理和智能運營,讓存儲越用越快,價值越來越大;通過“數據虛擬化引擎”,統一SQL語法,像使用數據庫一樣使用大數據。

華為將數據虛擬化引擎命名為河圖,就是屏蔽數據基礎設施的複雜度,讓開發者像使用數據庫一樣使用大數據,複用現有的生態、工具和技能,提升開發效率2到10倍。對於“河圖”的命名原由,侯金龍說,“大禹得河圖後始見清明”,傳說中大禹通過河圖掌握河流山川複雜的地形地貌,順利完成治水大業,河圖引擎就是要讓數據治理簡單,使用簡單,更方便的挖掘數據價值。

為了更好地發展數據產業,讓客戶和合作夥伴更簡單地對接應用與數據,華為宣佈開源HetuEngine,開源版本的河圖引擎叫openHetu,將於2020年6月上線。“我們將開源內核,開發者可以基於開源代碼進行定製,包括數據源擴展、SQL執行策略等,實現應用快速對接,提升開發效率。”侯金龍說。

华为开源“河图引擎”:像使用“数据库”一样使用“大数据”

華為Cloud & AI產品與服務總裁侯金龍宣佈開源數據虛擬化引擎HetuEngine


分享到:


相關文章: