![Kaggle數據科學項目索引表,10大類93項,更新中](http://p2.ttnews.xyz/loading.gif)
大數據文摘出品
作為數據科學比賽平臺,Kaggle豐富的算法、模型、項目等資源是巨大的寶藏。
為了使Kaggle上的資源獲得最大化的利用,一位來自印度的數據科學家sban設計了一個數據科學模型、技術和工具的項目索引表。
在這裡你可以查找到你所需要的數據科學資源,並超鏈接到項目頁,附有代碼展示。
整個數據科學表,一共提供了十個類別,每個類別裡面都有分支,分支裡的“詞彙”在根據投票數量排列的同時,也在右側說明了作者,項目實現所使用的編程語言以及閱讀數,評論以及獲得的投票數量。
另外,這個“索引表”還一直在更新,所以非常具有收藏的價值。
![Kaggle數據科學項目索引表,10大類93項,更新中](http://p2.ttnews.xyz/loading.gif)
下面文摘菌簡單帶大家瀏覽一下這10個類別,想要具體瞭解的同學請點擊:
https://www.kaggle.com/shivamb/data-science-glossary-on-kaggle/
1.迴歸算法
在本類別中,包括線性迴歸和邏輯迴歸兩個部分,其中每個部分分別給出了10個示例。
2.正則化算法
此類別下,包含三個分支,分別是Ridge、Lasso、Elasticnet。其中Ridge分支下有10個示例,Lasso分支下有9個,Elasticnet有4個。
3.樹形結構模型
此類別下的分支包含Decision Tree、Random Forest、Lightgbm Xgboost Catboost。每個分支下各有10個分支。
4.神經網絡和深度學習模型
此類別下包含神經網絡、自動編碼、深度學習、卷積神經網絡、膠囊神經網絡等分支,每個分支所下都有所對應的詞彙。
5.聚類算法
此類別包含Kmeans、層次聚類 、Dbscan密度聚類等。
6.Misc - Models
此類別包括樸素貝葉斯、支持向量機、臨近算法、推薦引擎等的應用和相關示例。
7.重要的數據科學工具
此類別是一個超級類別,其下屬包括處理、 維數約減、後建模技術以及模型融合這四個小類別,每個類別下包含若干分支。
8.文本數據
在這一目錄下包含了自然語言、主題模型、詞嵌入向量。
9.數據科學工具
Scikit、Tensorflow等眾多框架和工具都包含在此類別下。
10.數據可視化
Seaborn、D3.Js、Bokeh等著名的數據可視化庫和工具都能在此類別下找到。
最後文摘菌再次給出鏈接,大家請盡情享用吧!
https://www.kaggle.com/shivamb/data-science-glossary-on-kaggle/
閱讀更多 大數據文摘 的文章