Kaggle數據科學項目索引表,10大類93項,更新中

Kaggle數據科學項目索引表,10大類93項,更新中

大數據文摘出品

作為數據科學比賽平臺,Kaggle豐富的算法、模型、項目等資源是巨大的寶藏。

為了使Kaggle上的資源獲得最大化的利用,一位來自印度的數據科學家sban設計了一個數據科學模型、技術和工具的項目索引表。

在這裡你可以查找到你所需要的數據科學資源,並超鏈接到項目頁,附有代碼展示。

整個數據科學表,一共提供了十個類別,每個類別裡面都有分支,分支裡的“詞彙”在根據投票數量排列的同時,也在右側說明了作者,項目實現所使用的編程語言以及閱讀數,評論以及獲得的投票數量。

另外,這個“索引表”還一直在更新,所以非常具有收藏的價值。

Kaggle數據科學項目索引表,10大類93項,更新中

下面文摘菌簡單帶大家瀏覽一下這10個類別,想要具體瞭解的同學請點擊:

https://www.kaggle.com/shivamb/data-science-glossary-on-kaggle/

1.迴歸算法

在本類別中,包括線性迴歸和邏輯迴歸兩個部分,其中每個部分分別給出了10個示例。

Kaggle數據科學項目索引表,10大類93項,更新中

2.正則化算法

此類別下,包含三個分支,分別是Ridge、Lasso、Elasticnet。其中Ridge分支下有10個示例,Lasso分支下有9個,Elasticnet有4個。

Kaggle數據科學項目索引表,10大類93項,更新中

3.樹形結構模型

此類別下的分支包含Decision Tree、Random Forest、Lightgbm Xgboost Catboost。每個分支下各有10個分支。

Kaggle數據科學項目索引表,10大類93項,更新中

4.神經網絡和深度學習模型

此類別下包含神經網絡、自動編碼、深度學習、卷積神經網絡、膠囊神經網絡等分支,每個分支所下都有所對應的詞彙。

Kaggle數據科學項目索引表,10大類93項,更新中

5.聚類算法

此類別包含Kmeans、層次聚類 、Dbscan密度聚類等。

Kaggle數據科學項目索引表,10大類93項,更新中

6.Misc - Models

此類別包括樸素貝葉斯、支持向量機、臨近算法、推薦引擎等的應用和相關示例。

Kaggle數據科學項目索引表,10大類93項,更新中

7.重要的數據科學工具

此類別是一個超級類別,其下屬包括處理、 維數約減、後建模技術以及模型融合這四個小類別,每個類別下包含若干分支。

Kaggle數據科學項目索引表,10大類93項,更新中

8.文本數據

在這一目錄下包含了自然語言、主題模型、詞嵌入向量。

Kaggle數據科學項目索引表,10大類93項,更新中

9.數據科學工具

Scikit、Tensorflow等眾多框架和工具都包含在此類別下。

Kaggle數據科學項目索引表,10大類93項,更新中

10.數據可視化

Seaborn、D3.Js、Bokeh等著名的數據可視化庫和工具都能在此類別下找到。

Kaggle數據科學項目索引表,10大類93項,更新中

最後文摘菌再次給出鏈接,大家請盡情享用吧!

https://www.kaggle.com/shivamb/data-science-glossary-on-kaggle/


分享到:


相關文章: