04.02 GitHub 上最火,最熱門的機器學習和人工智能,數據科學項目

GitHub 上最火,最熱門的機器學習和人工智能,數據科學項目

最近,普拉納夫 · 達爾(Pranav Dar)發文總結了 2018 年 2 月份 Github 上最火的 5 個數據科學和機器學習項目。

Pranav Dar,Analytics Vidhya 的編輯。數據可視化和六西格瑪從業者喜歡閱讀和深入研究數據科學和機器學習藝術。始終在尋找新的方法來改善使用ML和AI的流程。

1.FastPhotoStyle(快速轉換照片風格)

GitHub 上最火,最熱門的機器學習和人工智能,數據科學項目

FastPhotoStyle 這個項目是英偉達(NVIDIA)開發的一個 Python 庫。該模型將內容照片和風格照片作為輸入。然後它將風格照片的風格轉移到內容照片,即就是將內容照片的風格轉換為我們輸入的風格照片的風格。

開發人員舉出了兩個算法示例。首先,第一個是非常簡單的迭代算法,只需要下載一張內容圖和風格圖,重新調整他們尺寸,然後運行圖像風格化代碼。第二個樣例中,需要使用語義標籤映射來創建程式化圖像。

2.Twitter Scraper(Twitter 爬蟲)

GitHub 上最火,最熱門的機器學習和人工智能,數據科學項目

如果你在 Twitter 上發過文章,就知道 Twitter 自身的 API 有流速限制,當然,作為國內用戶大多數人都沒用使用過 Twitter ,這個 Python 庫就是考慮到這一點,它沒有 API 限流(不需要任何身份驗證),也沒有限制,並且速度非常快。開發人員可以用這個庫爬取任何用戶的任意一條 Twitter (推文)。

而且,這個項目可以用於製作馬爾科夫鏈,但是目前它只能適用於 Python 3.6 及以上版本。

3.Handwriting Synthesis(手寫體合成)

GitHub 上最火,最熱門的機器學習和人工智能,數據科學項目

這個項目來自亞歷克斯 · 格雷夫斯(Alex Graves)撰寫的論文(Generating Sequences with Recurrent Neural Networks)《用 RNN 生成序列》,正如存儲庫的名稱所示,您可以生成不同風格的手寫,是其中手寫體合成實驗的實現,它可以生成不同風格的手寫字跡。模型包括初始化和偏置兩個部分,其中初始化控制樣例的風格,偏置控制樣例的整潔度。

作者在 GitHub 頁面上呈現的樣本的多樣性真的很吸引人。他正在尋找貢獻者來加強存儲庫,所以如果您有興趣,可以研究去看看。

4.ENAS PyTorch(高效神經網絡結構搜索)

GitHub 上最火,最熱門的機器學習和人工智能,數據科學項目

該項目是對論文《參數共享的高效神經網絡結構搜索(Efficient Neural Architecture Search (ENAS) via Parameters Sharing)》的實現。ENAS做什麼?高效神經網絡結構搜索,即 ENAS 減少了計算需求,將 NAS 的 GPU 計算時間減少了 1000 倍。他們通過共享大型計算圖中的子圖模型之間的參數共享來完成此操作。

如何使用它的過程已經在GitHub頁面上得到了很好的展示。實現這個庫的先決條件是:

  • Python 3.6+

  • 需要 PyTorch

  • tqdm,imageio,graphviz,tqdm,tensorboardX

5.Sign Language(手勢語言識別)

GitHub 上最火,最熱門的機器學習和人工智能,數據科學項目

這是一個相對簡單但又十分吸引人的機器學習項目。在 Python 中使用卷積神經網絡構造模型,可以識別手勢並將其轉換為機器上的文本。

該項目存儲庫的作者用 Tensorflow 和 Keras 共同搭建了 CNN 模型,他特別詳細地說明了他是怎麼創建這個項目的,以及每一步是怎麼進行的。

是不是感覺非常不錯的,如果你對機器學習感興趣,可以去這些開源項目中去研究和學習一下。


分享到:


相關文章: