GitHub上7大最受歡迎的開源數據科學課程

GitHub上7大最受歡迎的開源數據科學課程

前言

GitHub是最著名的版本控制存儲庫之一。在其中,您可以找到很多優秀的項目和資源。

這是列出了在GitHub上最受歡迎​​的7個數據科學課程的列表。排名基於每個項目的forks數。

1. Standford TensorFlow Tutorials(4,072 forks)

GitHub上7大最受歡迎的開源數據科學課程

該存儲庫和Stanford CS 20課程相關:用於深度學習研究的TensforFlow課程相關。課程網站上提供了詳細的教學大綱,幻燈片和講義。講師使用python 3.6和TensorFlow 1.4.1。

這是課程說明:

TensorFlow是Google研究人員開發的強大的機器學習開源軟件庫。它具有許多預先構建的功能,可以簡化構建不同神經網絡的任務。TensorFlow允許在不同計算機之間以及一臺計算機中的多個CPU和GPU之間分配計算。TensorFlow提供了Python API以及文獻較少的C ++ API。在本課程中,我們將使用Python。

本課程將涵蓋Tensorflow庫用於深度學習研究的基礎知識和當代用法。我們旨在幫助學生理解TensorFlow的圖形計算模型,探索其提供的功能以及學習如何構建和構建最適合深度學習項目的模型。在整個課程中,學生將使用TensorFlow構建不同複雜度的模型,從簡單的線性/邏輯迴歸到卷積神經網絡和遞歸神經網絡,以解決諸如單詞嵌入,翻譯,光學字符識別,強化學習之類的任務。學生還將學習最佳實踐,以構建模型和管理研究實驗。

2.Deep Learning Specialization on Coursera(3,352 forks)

GitHub上7大最受歡迎的開源數據科學課程

這是一個由學生創建的資源庫,該學生髮布了課程分配的解決方案和Coursera深度學習專業化的解決方案。

它的內容沒有那麼豐富,但是,它可以用來更好地理解一些與深度學習有關的概念。將您的解決方案與該存儲庫中提供的解決方案進行比較也很有用。

這是您可以找到編程作業和測驗的課程列表:

  • 課程1:神經網絡與深度學習
  • 課程2:改善深度神經網絡:超參數調整,正則化和優化
  • 課程3:構建機器學習項目
  • 課程4:卷積神經網絡
  • 課程5:序列模型

3.Practical RL: A course in reinforcement learning in the wild (3,368 forks)

GitHub上7大最受歡迎的開源數據科學課程

這個課程的英語和俄語在線版本可用,但在高等經濟學院以俄語授課。

知識庫中還包含一些材料,可供在現場學習課程或只是想在線瀏覽課程的學生使用。

本課程側重於實用機器學習,涵蓋以下主題:

  • 引言。我們周圍的RL問題。決策流程。隨機優化,交叉熵法。參數空間搜索與動作空間搜索。
  • 基於價值的方法: 折扣獎勵MDP。基於價值的方法。價值迭代。策略迭代。折扣獎勵失敗。
  • 無模型強化學習。Q學習。SARSA。脫離策略與基於策略的算法。N步算法。TD(Lambda)。
  • 深度學習回顧。深度學習101.它附帶一個研討會,介紹pytorch / tensorflow,帶卷積網絡的簡單圖像分類
  • 近似(深)RL。無限/連續狀態空間。值函數近似。收斂條件。多人特技 體驗重播,目標網絡,雙重/決鬥/自舉DQN等。
  • 探索。情境強盜。湯普森抽樣,UCB,貝葉斯UCB。探索基於模型的RL,MCTS。“令人沮喪的”啟發式探索。
  • 策略漸變方法。基於策略的動機,策略梯度,對數導數技巧,REINFORCE /交叉熵方法,方差減少(基準),有利於參與者的批評者(包括GAE)
  • 序列模型的強化學習。順序數據問題。複發性神經痛。通過時間的反向傳播。消失和爆炸的梯度。LSTM,GRU。漸變裁剪
  • 部分觀察到的MDP。POMDP簡介。POMDP學習(具有記憶的代理)。POMDP規劃(POMCP等)
  • 基於策略的高級方法。信任區域策略優化。NPO / PPO。確定性政策梯度。DDPG
  • 基於模型的RL&Co. 基於模型的RL,總體規劃,模仿學習和反強化學習
  • 逆RL和模仿學習。本課程未講授的所有內容

4. Creative Applications of Deep Learning with Tensorflow (1,341 forks)

GitHub上7大最受歡迎的開源數據科學課程

該課程包含Kadenze學院使用TensorFlow課程進行深度學習的創造性應用的作業和講稿。

本課程包括以下課程:

  • 第一場:TensorFlow簡介
  • 第三節:無監督和有監督的學習
  • 第四節:可視化和產生幻覺
  • 第五節:生成模型

該存儲庫還包含有關設置和使用所需工具入門的大量文檔。

5. Data Science Coursera (714 forks)

GitHub上7大最受歡迎的開源數據科學課程

該項目由一位名為Michael Galarnyk的數據科學碩士學生準備。他建立了這個資料庫,以記錄他在約翰·霍普金斯(Johns Hopkins)的Coursera數據科學課程中的歷程,作為對他在加州大學聖地亞哥分校計劃的補充。

該GitHub存儲庫包含每週對應的目錄,以及每個課程的博客文章。

以下課程與相應的存儲庫和博客相關聯:

  • 統計推斷課程回購
  • 可重現的研究課程回購博客
  • 探索性數據分析課程回購博客
  • 獲取和清理數據課程倉庫博客
  • R編程課程庫博客
  • 數據科學家工具箱課程回購博客

6. Udacity’s Machine Learning Engineer Nanodegree Stanford’s Convolutional Neural Networks for Visual Recognition (69 forks)

GitHub上7大最受歡迎的開源數據科學課程

這是一個帶有一個有用的Udacity’s Machine Learning Enginee課程。

它包含有關如何使用內容的信息,與課程材料相關的超鏈接以及對學生有用的其他鏈接,例如Andrej Karpathy博客,Andrew Trask博客等。

當學生完成作業分配後,將邀請他們在資源庫中共享他們的解決方案,以便其他人可以查看並從中受益。

7. Introduction to Hadoop and MapReduce (47 forks)

GitHub上7大最受歡迎的開源數據科學課程

該項目與Udacity Hadoop和MapReduce入門課程有關。

它包含源代碼和問題集,以及有用的自述文件,說明了進行設置的方式,有關輸入和輸出數據文件的文檔以及針對該課程的問題集以及Python和Java解決方案。

總結:

這只是基於forks數量的一些最受歡迎的課程的列表。還有許多其他資源庫可以作為學習和受益的有用資源。

點擊關注,如果發現任何不正確的地方,或者想分享有關上述主題的更多信息,歡迎反饋。


分享到:


相關文章: