杉巖數據對象存儲替換IBM FileNet,突破性能瓶頸

近年來隨著非結構化數據的爆發性增長,由於IBM FileNet系統架構問題出現了明顯性能瓶頸,杉巖海量對象存儲系統(SandStone MOS)採用全分佈式架構,針對海量文件場景提供可線性擴展的持續快速訪問性能,同時提供全方位的海量數據保護支持和數據生命週期管理功能,能夠完美替代IBM FileNet。

非結構化數據的爆炸式增長,使有價值的信息散落在各個“孤島”。這些非結構化信息包括辦公文檔、視頻影像與音頻、HTML網頁、電子郵件、文本、報表等等,這些信息通常被放在企業的數據庫、文件系統、網站以及門戶等等IT系統中。

企業運營中所使用的數據,80%以上是非結構的,它的增長率甚至是結構化數據的兩倍。這些數據來自於每天擁有兩千億往來的電子郵件,再加上影像、辦公文檔、音視頻文件等等,可見是海量數據。若能夠有效利用海量數據,我們便可提早發現問題,提升對客戶的服務,降低作業成本,能夠發掘新的收益機會。杉巖數據談到,“我們做了一個醫療界客戶的POC(為觀點提供證據),我們用SandStone MOS分析五千個病人的記錄,其中一個項目是找病人抽菸的習慣判斷他得心臟病的風險性。從有結構式的數據中,有35%的記錄中找到了抽菸指標;在文本數據中從81%的數據找到抽菸指標,並且準確度高了很多。所以若只對來源數據進行分析也許會錯過一些很重要的洞察。”

“企業內容分析的數據對象正在發生變化,從事務性的結構化數據轉向交互性的非結構化數據已經成為趨勢。” SandStone MOS能夠對異結構數據源進行企業級搜索及文本分析。

杉巖NAS異構特性介紹

傳統NAS設備在已經存放了數千萬級別文件數量的情況下,性能急劇下降,讀寫延遲可達到5-10秒,在杉巖對象存儲實施的過程中,由於NAS接口性能的瓶頸,導致現有數據的遷移週期長達數月之久,為此我們開發了NAS異構特性。

杉巖數據對象存儲替換IBM FileNet,突破性能瓶頸

如圖所示,SandStone MOS納管NAS設備的元數據,無需立即觸發數據內容搬遷,應用統一使用S3接口即可訪問NAS和MOS的數據,通過生命週期轉移策略,可以後期平滑遷移NAS文件到SandStone MOS,數據內容搬遷過程中無需停機,業務切割時間窗極短,完美替換IBM FileNet。


分享到:


相關文章: