乾貨|Cloudera信用卡欺詐數據分析(視頻)

本視頻講解及演示在Cloudera Data Science Workbench 平臺上以著名機器學習競賽平臺Kaggle數據為基礎,包含前期數據探索,規劃展示,模型訓練、優化、最終部署的一個全流程的數據及學習的Demo。

乾貨|Cloudera信用卡欺詐數據分析(視頻)

Cloudera信用卡欺詐數據分析

視頻地址:https://v.qq.com/x/page/h0808bof0gm.html

本Demo採用Kaggle平臺歐洲信用卡持卡人在2013年9月的284,807條數據交易記錄為依據,在CDSW平臺運行及部署Model文件實現反欺詐監測。


數據科學家工作臺架構

乾貨|Cloudera信用卡欺詐數據分析(視頻)

數據科學家工作臺架構


應用場景和數據結構


乾貨|Cloudera信用卡欺詐數據分析(視頻)

應用場景


平臺部署演示

乾貨|Cloudera信用卡欺詐數據分析(視頻)

Fraud_Model 創建

乾貨|Cloudera信用卡欺詐數據分析(視頻)

運行界面

乾貨|Cloudera信用卡欺詐數據分析(視頻)

測試環節

Fraud_Model 創建-> 運行 -> 測試


Pandas小介紹

Pandas是python的一個數據分析包, 是基於NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。pandas提供了大量能使我們快速便捷地處理數據的函數和方法。你很快就會發現,它是使Python成為強大而高效的數據分析環境的重要因素之一。


Cloudera作為全球知名大數據分析與基於Hadoop的數據管理平臺提供商,慧都科技提供Cloudera在線諮詢,平臺定製開發,現場實施,緊急救援等相關業務。

慧都大數據與AI解決方案,以底層基於慧都大數據基礎平臺DataForce提供高效存儲和計算能力,搭建安全、高效、可靠的大數據分析平臺,我們還提供組件自定義搭配,為企業選擇滿足方案需要的大數據功能組件,使您的大數據解決方案成本降到最低,從而高品質的解決您的大數據需求問題。

↓↓↓


分享到:


相關文章: