一文詳解大數據技術和應用場景

說起大數據,估計大家都覺得只聽過概念,但是具體是什麼東西,怎麼定義,沒有一個標準的東西。

一文詳解大數據技術和應用場景

在我們的印象中好像很多公司都叫大數據公司,業務形態則有幾百種,感覺不是很好理解,所以我建議還是從字面上來理解大數據,在維克托邁爾-舍恩伯格及肯尼斯庫克耶編寫的《大數據時代》提到了大數據的4個特徵:

一個是數量大

一個是價值大

一個是速度快

一個是多樣性

第一個是數量比較大,只有數據體量達到了PB級別以上,才能被稱為大數據。1PB等於1024TB,1TB等於1024G,那麼1PB等於1024*1024個G的數據。

第二個是價值大,你如果有1PB以上的全國所有20-35年輕人的上網數據的時候,那麼它自然就有了商業價值,比如通過分析這些數據,我們就知道這些人的愛好,進而指導產品的發展方向等等。如果有了全國幾百萬病人的數據,根據這些數據進行分析就能預測疾病的發生,這些都是大數據的價值。

第三個就是多樣性,如果只有單一的數據,那麼這些數據就沒有了價值,比如只有單一的個人數據,或者單一的用戶提交數據,這些數據還不能稱為大數據,所以說大數據還需要是多樣性的,比如當前的上網用戶中,年齡,學歷,愛好,性格等等每個人的特徵都不一樣,這個也就是大數據的多樣性,當然瞭如果擴展到全國,那麼數據的多樣性會更強,每個地區,每個時間段,都會存在各種各樣的數據多樣性。

第四個是速度快,就是通過算法對數據的邏輯處理速度非常快,1秒定律,可從各種類型的數據中快速獲得高價值的信息,這一點也是和傳統的數據挖掘技術有著本質的不同。


大數據的行業應用

一文詳解大數據技術和應用場景

大數據無處不在,大數據應用於各個行業,包括金融、汽車、餐飲、電信、能源、體能和娛樂等在內的社會各行各業都已經融入了大數據的印跡。

製造業,利用工業大數據提升製造業水平,包括產品故障診斷與預測、分析工藝流程、改進生產工藝,優化生產過程能耗、工業供應鏈分析與優化、生產計劃與排程。

金融行業,大數據在高頻交易、社交情緒分析和信貸風險分析三大金融創新領域發揮重大作用。

汽車行業,利用大數據和物聯網技術的無人駕駛汽車,在不遠的未來將走入我們的日常生活。

互聯網行業,藉助於大數據技術,可以分析客戶行為,進行商品推薦和針對性廣告投放。

電信行業,利用大數據技術實現客戶離網分析,及時掌握客戶離網傾向,出臺客戶挽留措施。

能源行業,隨著智能電網的發展,電力公司可以掌握海量的用戶用電信息,利用大數據技術分析用戶用電模式,可以改進電網運行,合理設計電力需求響應系統,確保電網運行安全。

物流行業,利用大數據優化物流網絡,提高物流效率,降低物流成本。

城市管理,可以利用大數據實現智能交通、環保監測、城市規劃和智能安防。

生物醫學,大數據可以幫助我們實現流行病預測、智慧醫療、健康管理,同時還可以幫助我們解讀DNA,瞭解更多的生命奧秘。

體育娛樂,大數據可以幫助我們訓練球隊,決定投拍哪種題財的影視作品,以及預測比賽結果。

安全領域,政府可以利用大數據技術構建起強大的國家安全保障體系,企業可以利用大數據抵禦網絡攻擊,警察可以藉助大數據來預防犯罪。

個人生活, 大數據還可以應用於個人生活,利用與每個人相關聯的“個人大數據”,分析個人生活行為習慣,為其提供更加周到的個性化服務。

大數據的價值,遠遠不止於此,大數據對各行各業的滲透,大大推動了社會生產和生活,未來必將產生重大而深遠的影響。


大數據使用的技術

說起大數據,大數據有三個層數據採集、存儲、計算三層。

一文詳解大數據技術和應用場景

第一個是數據採集層,以App、saas為代表的服務。

大數據基礎階段需掌握的技術有:Linux、Docker、KVM、MySQL基礎、Oracle基礎、MongoDB、redis以及hadoopmapreduce hdfs yarn等。

一文詳解大數據技術和應用場景

第二個數據存儲層,比如雲存儲,需掌握的技術有:hbase、hive、sqoop等。

比如:Hadoop作為一個開源的框架,專為離線和大規模數據分析而設計,HDFS作為其核心的存儲引擎,已被廣泛用於數據存儲。HBase,是一個分佈式的、面向列的開源數據庫,可以認為是hdfs的封裝,本質是數據存儲、NoSQL數據庫。

HBase是一種Key/Value系統,部署在hdfs上,克服了hdfs在隨機讀寫這個方面的缺點,與hadoop一樣,Hbase目標主要依靠橫向擴展,通過不斷增加廉價的商用服務器,來增加計算和存儲能力。

一文詳解大數據技術和應用場景

第三個是數據計算應用層,以數據為基礎,為將來的移動社交、交通、教育,金融進行服務,涉及到大數據架構設計階段需掌握的技術有:Flume分佈式、Zookeeper、Kafka等,以及大數據實時計算階段需掌握的技術有:Mahout、Spark、storm。

成都加米穀大數據培訓機構,小班教學,免費試聽,大數據開發12月下旬提高班報名中...


大數據的崗位

1.數據分析師Data analyst

指熟悉相關業務,熟練搭建數據分析框架,掌握和使用相關的分析常用工具和基本的分析方法,進行數據蒐集、整理、分析,針對數據分析結論給管理銷售運營提供指導意義的分析意見。

2.數據架構師Data architect

對Hadoop解決方案的整個生命週期進行引導,包括需求分析,平臺選擇,技術架構設計,應用設計和開發,測試和部署。深入掌握如何編寫MapReduce的作業及作業流的管理完成對數據的計算,並能夠使用Hadoop提供的通用算法, 熟練掌握Hadoop整個生態系統的組件如: Yarn,HBase、Hive、Pig等重要組件,能夠實現對平臺監控、輔助運維繫統的開發。

3.大數據工程師Big DataEngineer

收集和處理大規模的原始數據(包括腳本編寫,網頁獲取,調用APIs,編寫SQL查詢等);將非結構化數據處理成適合分析的一種形式,然後進行分析;根據所需要的和專案分析商業決策。

4.數據倉庫管理員

Data warehousemanager:指定並實施信息管理策略;協調和管理的信息管理解決方案;多個項目的範圍,計劃和優先順序安排;管理倉庫的各個方面,比如數據外包,移動,質量,設計和實施。

5.數據庫管理員Database manager

提高數據庫工具和服務的有效性;確保所有的數據符合法律規定;確保信息得到保護和備份;做定期報告;監控數據庫性能;改善使用的技術;建立新的數據庫;檢測數據錄入程序;故障排除。

6.商業智能分析員Businessintelligence analyst

就工具,報告或者元數據增強來進行傳播信息;進行或協調測試,以確保情報的定義與需求相一致;使用商業智能工具來識別或監測現有和潛在的客戶;綜合目前的商業只能和趨勢數據,來支持採取行動的建議;維護或更新的商業智能工具,數據庫,儀表板,系統或方法;及時的管理用戶流量的商業情報。


分享到:


相關文章: