企業在大數據部署前必須提出的六個問題科技頭條網

大數據在商業價值方面承諾很多，但企業很難確定如何部署利用該體系結構和工具所需的架構和工具。從描述性統計到預測建模到人工智能的所有內容都由大數據提供支持。而一個組織想要用大數據完成的事情將決定它需要推出的工具。在這個領域開始之前，每個企業都必須提出六個問題：

1.購買與構建？

第一個問題是你的組織是想要購買一個大數據系統還是從頭開始構建一個大的數據系統。來自Teradata，SAS，SAP和Splunk的熱門產品可以購買並簡單實施，而Hortonworks，Cloudera，Databricks和Apache Flink可用於構建大型數據系統。

購買提供了更短的時間價值，以及商品用例的簡單性和良好價值。然而，這種簡單性通常伴隨著更高的價格，而這些工具通常在低多樣性數據方面效果好。如果您的組織與供應商建立了現有關係，則可以更輕鬆地分階段使用新產品並嘗試使用大數據工具。

許多用於構建大數據系統的流行工具都很便宜或免費使用，並且更易於利用獨特的價值流。建設路徑提供了大規模和多樣化的機會，但這些工具可能非常複雜。互操作性往往是走這條路線的管理員面臨的最大問題之一。

2.批量與流媒體數據？

由Oracle，Hadoop MapReduce和Apache Spark等產品提供的批量數據是描述性的，可以處理大量數據。它們也可以按計劃進行安排，並且經常被用來為數據科學家建立實驗室。

像Apache Kafka，Splunk和Flink這樣的產品提供了流數據的功能，可以捕獲這些數據以創建潛在的預測模型。憑藉流媒體數據，速度勝過數據保真度，但它也提供了大規模和多樣化。

3. Kappa與lambda架構？

Twitter是lambda體系結構的一個例子。數據被分成兩條路徑，其中一條被送入速度層以便快速分析，而另一條路徑則導向批處理層和服務層。該模型使組織可以訪問批處理和流媒體洞察，並且很好地平衡有損流。這裡的挑戰是你必須管理兩個代碼和應用程序庫。

Kappa體系結構將所有內容都視為流，但它是旨在實時保持數據保真度和流程的流。所有的數據都被寫入一個不可變的日誌中，這些日誌的變化將被檢查。它硬件高效，代碼更少，而且這是建議為一個新的大數據組織開發的模型。

4.公共還是私有云？

大數據的公有云和私有云需要很多相同的考慮因素。對於初學者來說，組織必須考慮他們的人才最適合工作的環境。此外，還應該考慮數據來源，安全和合規需求以及彈性消費模型。

5.虛擬還是物理？

多年前，關於虛擬與物理基礎設施的爭論更為激烈。但是，虛擬化已經成長為與物理硬件相比具有競爭力，因為它們在大數據部署方面變得相似。這歸結於您的管理員對您的現有基礎架構更適合並且適用於您的現有基礎架構。

6. DAS與NAS？

直連存儲（DAS）曾經是部署Hadoop集群的唯一方式。但是，現在IP網絡增加了帶寬，網絡附加存儲（NAS）選項對於大數據更加可行。

有了DAS，上手很容易，模型可以很好地與軟件定義的概念一起使用。它被驅動來處理性能和存儲的線性增長，並且在流媒體數據方面表現良好。NAS可以很好地處理多協議需求，提供大規模的效率，並且還可以解決安全性和合規性需求。

分享到:

閱讀更多 華源創世智能工廠 的文章

關鍵字: 雲計算 Apache 數據

企業在大數據部署前必須提出的六個問題

相關文章:

「大數據」（一百零六）開機自動掛載

「大數據」（一百零五）文件系統使用

「大數據」（一百零四）創建文件系統掛載和卸載

「大數據」（九十九）磁盤分區類型

「大數據」（九十六）Scala之繼承

「大數據」（九十五）Scala之伴生對象

大數據•加快5G和數據中心建設政策出臺

網絡上總看到“大數據”，“大數據”到底是什麼呢？

大數據、物聯網和智慧城市的三角關係有多複雜？

大數據：數據清洗流程

大數據，到底有多大

「大數據」產業成爲集寧區新的經濟增長極

大數據，醫不醫好貴州的病？

大數據，企業數位化轉型的新思路

大數據「血本無歸」

在小指尖上舞動「大數據」

像棋譜一樣的知識庫——大數據

大齡碼農的提升的新機遇：大數據

天上掉餡餅，大數據、架構師學習資料免費分享了

大數據+AI打造網際網路金融反欺詐體系

揭祕北京大學2018級新生「大數據」

大數據：我的柔情你永遠都懂

大數據，爲物流植入智慧大腦

據說這是最有前（錢）途的專業之一——大數據

打通「人貨場」大數據 尼爾森中國力圖破解新零售難題

大數據思維，大數據技術，大數據——認識大數據的三個維度

大數據+人工智慧正以八種方式撼動商界

垃圾分類，鄭州或將開啓「大數據」時代！

物流+大數據，開啓智慧物流新的運營的模式

大數據、雲計算真的那麼難理解麼？

大數據：城市規劃與治理的新資源

大數據：氣象部門怎麼「玩」？

馬雲講分享經濟網際網路+大數據

大數據，零售商的救命稻草

“大數據”安全成為貴州新名片

大數據，值得從商業的角度看一遍

智慧城市的關鍵在於：大數據

大數據+人工智能將改變未來的社會

04.22 大數據、人工智能等工程師必備IT技能12張詳細學習路線圖

大數據、人工智慧等工程師必備IT技能12張詳細學習路線圖

大數據：美團酒旅實時數據規則引擎應用實踐

「大數據」概念是怎樣產生的？

大數據：巨頭公司擁有的人工智慧基礎優勢

讓我們一起觸摸“大數據”

大數據

小米太無恥了。

蹭熱點！說說我理解的手機包裝盒事件。

蘋果公司正式發佈iPhone SE二代手機

華為河圖、麒麟芯片和鴻蒙OS三駕馬車並行？華為生態建設佈局深遠

小米高管表示，四千毫安時 5G 手機，和三千多毫安時 4G 手機一樣

5G畫風變了：麒麟985落地首跑，榮耀坐上開往高端的「地鐵」

旗艦手機標配Wifi 6 換Wifi 6路由器的時機到了嗎？

2020年5G手機賣不動？繼蘋果砍單25%之後，華為小米紛紛跟砍？

幹翻華為P40系列 榮耀30也玩中

程序員辭互聯網工作，跨行傳統上市公司，上班第1天就蒙了

蘋果發佈新款iPhoneSE，3299元起售

我很糾結：我究竟適不適合做亞馬遜電商？看了這三條你就知道了

請仔細閱讀，關於跨境電商你想知道的都在這兒

騙子手段太“精明”：商家賠了貨物又賠款，亞馬遜平臺騙術大揭祕

做跨境電商這麼多年，今天才知道給國外客戶發文件原來這麼簡單

值得收藏！三類賣家三種選品方案，總有適合你的一個……

萬萬沒想到！亞馬遜平臺上面賣床單竟營收一個億！你還在等什麼？

做店鋪這麼多年，今天才知道我的listing突然被封，竟是因為……

亞馬遜小白看過來！請採納這些：亞馬遜選品和運營的小建議

亞馬遜賣家如何爆單？跨境精細化運營攻略必看

不收保證金、入住費、年費，還免三個月佣金，我也想入駐這個平臺

馬雲終於要辭職了，留下的話句句觸動人心

等等，明年5G手機將迎來大降價

微信公開課PRO版2019正在進行時，往屆各自都有什麼黑科技

推出「信任分」升級「閃購」，美團本地生活這盤棋有多大？

5G我們超越了6G我們也將領先! 美國為什麼會害怕失去5G領導地位呢

界讀｜華為：幫助英國共渡疫情難關，無端批評令英國蒙受損失

為什麼華為今天可以傲視群雄，在世界上立於不敗之地？

血戰「在線辦公」，阿里、騰訊、字節、華為的底牌與大殺器

2020年最強拍照旗艦來了 華為P40系列多項業界首創 香！

今天聊一聊直播

通過直播賺錢不容易，既要豁得出去，又要端得起來

AI和自動化技術聯手，最終會讓60%的工人失去現有的飯碗。

打通「人貨場」大數據尼爾森中國力圖破解新零售難題

幹翻華為P40系列榮耀30也玩中

2020年最強拍照旗艦來了華為P40系列多項業界首創香！

互聯網流量需求增大希臘民眾“宅生活”考驗網速

好像在哪見過？華為nova7官宣餘承東:何必只有一點點