![買不起的房,租不起的北上廣——交易平臺房價預測模型](http://p2.ttnews.xyz/loading.gif)
目的:拿到統計的房價 有房子特徵屬性
拿到一個二手房 我們要評估房子的價值
二分法 :在只有一個特徵的時候,找到一個劃分點 能夠和統計得到數據之間差值最小
![買不起的房,租不起的北上廣——交易平臺房價預測模型](http://p2.ttnews.xyz/loading.gif)
計算當前劃分點的平均平方的誤差 來找到最佳的劃分點
輸入 輸出
有很多特徵 ,那麼我們應該先從哪一個特徵開始劃分
對於每一個節點:
對每一個特徵:
對每一個特徵的值:將數據分成兩部分
計算切分切方誤差
求最佳切分點
求最佳的切分特徵
如果迴歸數特別深又枝繁葉茂,可能會過你合
避免過擬合的技術:預剪枝(設置最大深度,葉節點數據數量)
後剪枝(合併葉節點,比較合併之後在測試集上的MSE 是不是會增加)
超參數調優
劃分不同的測試集交叉驗證
集成GBDT 用多個樹來預測 每個樹超參樹
樹kaggle 29/17
縱向技術選型 爬蟲—— 聚集數據挖掘獲取
用戶特徵——特徵工程——數據分析
deeplearning——算法優化
備:想要獲取本節錄播視頻:以及美團點評獨家項目分享 關注【AI研習】公眾號對話框回覆關鍵詞:“房價預測”
—AI研習社群開始招募啦,歡迎對AI感興趣的同學,關注【AI研習】公眾號對話界面回覆關鍵字“進群”,獲取入群方式;
由國防科大退出現役的專家教授級團隊傾力打造,從事以人工智能、大數據為主的高科技教育直播,一週六節在線直播 想聽課同學回覆”進群“ 獲取聽課鏈接
閱讀更多 人工智能與大數據 的文章