數據量的大爆發,大數據時代來臨,什麼是大數據?

隨著互聯網的飛速發展,特別是近年來隨著社交網絡、物聯網、雲計算以及多種傳感器的廣泛應用,以數量龐大,種類眾多,時效性強為特徵的非結構化數據不斷湧現,數據的重要性愈發凸顯,傳統的數據存儲、分析技術難以實時處理大量的非結構化信息,大數據的概念應運而生。如何獲取、聚集、分析大數據成為廣泛關注的熱點問題。

大數據”是近年來IT行業的熱詞,大數據在各個行業的應用逐漸變得廣泛起來,那麼,什麼是大數據呢,什麼是大數據概念呢,大數據概念怎麼理解呢,現在來給大家做一下解釋。

數據量的大爆發,大數據時代來臨,什麼是大數據?

大數據概念:

大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。

大數據的4V特點:

  • Volume(大量)
  • Velocity(高速)
  • Variety(多樣)
  • Value(價值)

大數據的發展歷史:

“大數據”這個術語最早期的引用可追溯到apache org的開源項目Nutch。當時,大數據用來描述為更新網絡搜索索引需要同時進行批量處理或分析的大量數據集。隨著谷歌MapReduce和Google File System (GFS)的發佈,大數據不再僅用來描述大量的數據,還涵蓋了處理數據的速度。

早在1980年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數據熱情地讚頌為“第三次浪潮的華彩樂章”。不過,大約從2009年開始,“163大數據”才成為互聯網信息技術行業的流行詞彙。美國互聯網數據中心指出,互聯網上的數據每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數據是最近幾年才產生的。此外,數據又並非單純指人們在互聯網上發佈的信息,全世界的工業設備、汽車、電錶上有著無數的數碼傳感器,隨時測量和傳遞著有關位置、運動、震動、溫度、溼度乃至空氣中化學物質的變化,也產生了海量的數據信息。

大數據概念結構:

大數據就是互聯網發展到現今階段的一種表象或特徵而已,沒有必要神話它或對它保持敬畏之心,在以雲計算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。

其次,想要系統的認知大數據,必須要全面而細緻的分解它,我著手從三個層面來展開:

第一層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。我會從大數據的特徵定義理解行業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。

第二層面是技術,技術是大數據價值體現的手段和前進的基石。我將分別從雲計算、分佈式處理技術、存儲技術和感知技術的發展來說明大數據從採集、處理、存儲到形成結果的整個過程。

第三層面是實踐,實踐是大數據的最終價值體現。我將分別從互聯網的大數據,政府的大數據,企業的大數據和個人的大數據四個方面來描繪大數據已經展現的美好景象及即將實現的藍圖。

數據量的大爆發,大數據時代來臨,什麼是大數據?


大數據概念的特點:

大數據分析相比於傳統的數據倉庫應用,具有數據量大、查詢分析複雜等特點。《計算機學報》刊登的“架構大數據:挑戰、現狀與展望”一文列舉了大數據分析平臺需要具備的幾個重要特性,對當前的主流實現平臺——並行數據庫、MapReduce及基於兩者的混合架構進行了分析歸納,指出了各自的優勢及不足,同時也對各個方向的研究現狀及作者在大數據分析方面的努力進行了介紹,對未來研究做了展望。

大數據的4個“V”,或者說特點有四個層面:第一,數據體量巨大。從TB級別,躍升到PB級別;第二,數據類型繁多。前文提到的網絡日誌、視頻、圖片、地理位置信息等等。第三,處理速度快,1秒定律,可從各種類型的數據中快速獲得高價值的信息,這一點也是和傳統的數據挖掘技術有著本質的不同。第四,只要合理利用數據並對其進行正確、準確的分析,將會帶來很高的價值回報。業界將其歸納為4個“V”——Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)。

從某種程度上說,大數據是數據分析的前沿技術。簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業的潛力。

大數據概念的用途:

大數據可分成大數據技術、大數據工程、大數據科學和大數據應用等領域。目前人們談論最多的是大數據技術和大數據應用。工程和科學問題尚未被重視。大數據工程指大數據的規劃建設運營管理的系統工程;大數據科學關注大數據網絡發展和運營過程中發現和驗證大數據的規律及其與自然和社會活動之間的關係。

物聯網、雲計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍佈地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式。

有些例子包括網絡日誌,RFID,傳感器網絡,社會網絡,社會數據(由於數據革命的社會),互聯網文本和文件;互聯網搜索索引;呼叫詳細記錄,天文學,大氣科學,基因組學,生物地球化學,生物,和其他複雜和/或跨學科的科研,軍事偵察,醫療記錄;攝影檔案館視頻檔案;和大規模的電子商務 。

大數據的作用

對於一般的企業而言,大數據的作用主要表現在兩個方面,分別是數據的分析使用與進行二次開發項目。通過對禧金信息大數據進行分析,不僅能把隱藏的數據挖掘出來,還能通過這些隱藏的訊息,通過實體的銷售,提升自己的客戶源。至於對數據進行二次開發,在網絡服務項目中被運用的比較多,通過將這些信息進行總結與分析,從而制定出符合客戶需要的個性化方案,並營造出一種全新的廣告營銷方式,在這裡,你需要明白的是,通過大數據的分析,將產品與服務進行結合起來的並不是偶然事件,實現這種的往往是數據時代的領導者。

綜上所述,大數據的運用,不僅標誌著時代的進步,同時還激勵著人們進行更深領域的探究。此外,針對大數據的研究,除了上述內容外,還需要了解大數據的三個特徵,分別是規模大、運轉速度快及數據多樣性。通過對這三個方面的研究,不僅可以更容易的觀察到數據的本質嗎,有利於軟件處理平臺的有效運轉。

關注我,每天更新IT圈知識。


分享到:


相關文章: