「新書推薦」入行AI，你需要一本Python機器學習入門

2020-12-18 01:32:02 佚名

目前機器學習紅遍全球。男女老少都在學機器學習模型，分類器，神經網絡和吳恩達。你也想成為一份子，但你該如何開始？

今天小編推薦這本《Python機器學習》教你快速入門。

01、什麼是機器學習？

從出生的那天起，我們就一直在學習中度過。隨著逐漸的成長，開始學習如何走路；通過傾聽周圍人的談話，學習並嘗試模仿；通過學習不同單詞的意思，使得在需要時懂得該如何進行表達；同時也開始區分事情的好壞。例如，在第一次靠近火源時，會因灼熱而後退，從而明白要與火源保持一定的距離。

那麼，現在思考一下計算機的工作原理。計算機可以在1s內遵循人類的指示處理數百萬條指令，並返回結果；它可以執行人類描述的任務，但是卻不能自行決定。

而機器學習此時就可以發揮作用了。如果給予計算機像人類一樣的思考能力，那會發生什麼呢？可以用計算機能理解的方式給出每一天的任務令其進行計算，還可以建立一些模型來幫助計算機在將來採取行動。

人類從經驗中學習知識，計算機則遵循指令執行任務。然而，其實還可以直接向計算機提供經驗讓其學習併為行動做準備。目前我們是以結構化的方式定義經驗。因此，我們將計算機從數據（經驗）中進行學習的過程稱為機器學習（Machine Learning）。

以買香蕉為例。你的母親需要你去市場上買一些香蕉，同時她告訴你鮮黃色的香蕉很好吃。你到一個水果商那裡，開始按照母親的建議挑選香蕉。你買了20根香蕉後就回家了，然而回家後你注意到有些香蕉的味道並不像其他的那樣好。事實上，有5根香蕉是壞的。你逐個拿起香蕉並開始作出假設。 20根香蕉中有12根大香蕉和8根小香蕉。這8根小香蕉都很美味，但是大香蕉就不一樣了，在12根大香蕉中有5根味道不如預期。

你已經掌握了挑選香蕉的知識。第二天，當你到達市場時，注意到有個水果商在打折出售香蕉，這些香蕉和昨天的不同，它們的皮帶有一些綠色。從這裡買完香蕉回到家後，根據之前的經驗將每一根香蕉分為好與壞，會發現大的綠色香蕉很好吃，但是小的綠色香蕉的味道不如其他的好。這樣，你就學會了新規則。

你開始將自己看作是香蕉專家。有一天，你不得不去另一個城市參加表親的婚禮。現在你驚訝地發現這裡所有的香蕉都很小，但是味道卻都很好。在這裡你瞭解到來自這個區域的香蕉是暢銷商品。

現在你確實已經是一名專家了。但如果你的姐姐很長時間沒有回家了，並且她喜歡石榴而討厭香蕉。你要怎麼辦呢？為了找到美味的石榴，你需要重新開始你的學習。

現在這個任務就可以由機器學習負責指引計算機完成了。可以使用數據點的形式向計算機提供知識。數據點的屬性稱為特徵（Feature），這裡的特徵是香蕉的大小（小、中、大）、顏色、產地等。輸出（Output）就是味道（好或者壞）。將這些數據輸入到機器學習程序中，就可以讓計算機學習如何區分香蕉的好與壞。

機器學習算法是一種根據經驗來給予你決策能力的智能算法。

P.S. 小編給大家整理了一些Python人工智能的資料，從入門到高級都有，關注頭條號，私信回覆“資料”獲取，下圖為部分截圖。

02、為什麼選擇Python

Python在數據科學家中是非常受歡迎的編程語言。

第一，它免費且易學，不必為了小任務而浪費大量注意力；
第二，它是面向對象的語言，這也是其被大型開發者社區支持的原因；第三，巨大的開源庫支持。 Python具有相當數量的開源庫，能夠更迅速地實現數據科學和機器學習解決方案，而無須從頭開始編寫每一個算法。像Pandas、 scikit-learn、 SciPy、 NumPy、 Keras這樣的庫對於快速實現機器學習算法非常有用。

首先，通過一個例子瞭解如何使用編程語言來解決現實世界的問題。

假設舉辦一個聚會。你為每個進入聚會的人分配一個唯一的1～100之間的號碼。現在聚會結束了，你宣佈了一個消息。

“會從1～200之間獲取一個隨機數。如果有兩個人的號碼之和與這個數字相等，就會獎勵這兩個人。”

現在瞭解到，已經向x個人分配了號碼。如何確定能否給其中兩個人獎勵呢？

可以嘗試使用Python來解決這個問題。首先，從列表中獲取輸入數據。

1numberList = list([43,23,1,67,54,2,34,56,23,65,12,9,87,4,33])

現在選擇一個隨機數並將其存儲在一個變量中。

1sumSelector = raw_input()

為了解決這個問題，必須先對數據進行排序。在Python列表中排序很簡單，可以通過sort函數來完成。

1numberList = numberList.sort()

通過上述語句，將排序後的數字賦值給變量。現在使用兩個指針：一個指向開始處（前指針）；另一個指向結束處（後指針）。檢查兩指針所指變量的和。如果和小於給定值（意味著當前的總和小於所需的總和），前指針向前移動一步並再次檢查；如果和大於給定值（意味著當前的總和大於所需的總和），將後指針向後移動一步並再次檢查。無論在任何位置，如果當前的總和等於要求的總和，便可以說，存在兩個人的數值之和與給定的數值相同，需要給予獎勵；如果兩個指針相交併且仍然沒有達到所需的總和，則可以聲稱並不存在兩個人的數值之和與給定的數值相等。

以下是完整的解決方案。

 1def isPrizeGiven(numberList,sumSelector):
 2
 3sumOfTwo = sumSelector
 4
 5 i=0
 6
 7 j = len(numberList) -1
 8
 9 if(i>=j):
10
11 return False
12
13 while(i<=j):
14
15 currentSum = numberList[i]+numberList[j]
16
17 print(i,j,currentSum)
18
19 if(currentSum==sumOfTwo):
20
21 return True
22
23 if(currentSum>sumOfTwo):
24
25 j=j-1
26
27 else:
28
29 i=i+1
30
31 return False

為獲得所需答案，必須向函數傳遞排序列表和給定的數值（即兩數值的期望和）。

1if (isPrizeGiven(numberList,sumSelector):
2 print("No Escape. Give Prize to Everyone")
3else:
4 print("You Saved Yourself!!")

即使現在不能理解此代碼，也不要擔心。接下來我們還會對這段代碼進行解析，並介紹程序設計語言的基本原理。

03、機器學習過程

機器學習不僅僅是一種簡單的算法，還可以將其放在其他任何地方以獲得奇妙的結果。機器學習是一個從定義數據開始，最終獲得一定準確率的模型的過程。

1．問題定義

機器學習的過程從定義一個商業問題開始。機器學習的需求是什麼？這個任務真的需要高級的預測算法來解決嗎？

問題定義是非常重要的，它提供了更正式地思考解決方案的方向。它基本上處理兩個問題。

A．問題是什麼？

這個問題涵蓋了問題的定義，並使問題變得更加正式。假設我們想要確認圖像中是否包含人。

現在定義這個任務，將其分為任務（T）、經驗（E）和性能（P）。

任務（T）：根據圖像中是否包含人對圖像進行分類。
經驗（E）：帶有是否包含人的標籤的圖像。
性能（P）：錯誤率。在所有的分類圖像中，錯誤預測的百分比是多少。錯誤率越低，準確率越高。

B．為什麼這個問題需要解決方案？

這個問題更側重於商業方面，它包括解決問題的動機和益處。

假如你是一個研究者，希望解決某個問題並發表論文，使之成為他人解決問題的基準，這可能就是你的動機。

關於你的問題其他需要確定的是，在沒有安全措施的情況下，夜間在銀行的自動取款機上是否有人類活動（假設所要解決的問題與自動取款機的安全有關）。

還需要定義可以使用此解決方案的場景。這是一個通用型的解決方案，還是為特定任務（ATM傳感器中的檢測人員）所設計的呢？解決方案的失效日期是什麼時候（它是終身的還是在特定的期限內）？

2．數據採集

在定義問題之後，開始進行數據採集。收集數據有多種不同的方式，如果想把評論與評級聯繫起來，就要從抓取網站開始。為了分析Twitter數據並將其與情感聯繫起來，就要從Twitter提供的API入手，收集標籤數據或者與某個公司相關聯的數據。市場調查人員通過創建不同的調查表格，並將其放在網站上來收集數據。對於像Amazon、 Facebook這樣擁有眾多用戶的公司，其數據是巨大的，而根據問題的不同，還需要收集數據和標籤。假設要建立一個新聞分類器，將新聞劃分為體育新聞、市場新聞和政治新聞。因此，收集到的每一條新聞都需要一個與之相關的標籤，通過這些數據可以構造機器學習的分類器。

正確的數據是解決機器學習問題的關鍵。即使是基本算法，高質量的數據也會產生令人滿意的結果。

3．數據準備

在採集數據之後，需要專注於數據準備。收集的數據要準備成機器學習算法所能使用的格式。算法不是魔術表演，數據必須以正確的形式輸入到機器學習算法中才能獲得結果。根據算法庫的不同，算法可以適應不同類型的輸入格式。

數據準備是從數據選擇開始的，並不是收集到的每個數據都對問題的解決有幫助。假設你正在分析服務器上的日誌，在每個用戶活動之後會生成許多與系統相關的信息，如果正在預測的是營銷活動的市場反應，那麼這個日誌可能就不起作用了。所以，基於所要解決的問題，應將無關數據從之後的操作中刪除。

在更高層次的基礎上識別數據後，需要對數據進行轉換或預處理，使之能更好地應用於機器學習算法。以下是數據預處理過程中的一些過程。

清理（Cleaning）：
數據可能含有需要移除的錯誤。假設數據中缺少某些屬性的數值，由於目前並沒有適合的算法能夠處理值缺失問題，因此可以用一些值（數值的均值/中值和分類值的默認值）代替缺失值。如果數據包含敏感信息，如電子郵件的ID和用戶的聯繫號碼，則需要在與團隊共享數據之前刪除數據中的敏感信息。
格式化（Formatting）：算法需要預定義格式的數據。基於Python機器學習庫的要求，採用Python列表的形式表示數據。一些實時的機器學習庫使用的是JSON格式的數據，而Excel文件使用CSV格式的數據。根據使用工具或技術的不同，需要對數據進行格式化，使其滿足使用工具或技術對數據格式的要求。
採樣（Sampling）：並非所有的數據都是有用的。一些在模型中存儲數據的算法很難實時生成預測，可以從數據中刪除類似的實例。如果是分類模型，可以按照標籤進行等比例採樣。
分解（Decomposition）：分解會使得一些特徵更加有用。以數據庫中的日期屬性為例，可以把日期分解成日、月、年，還可以創建諸如週末或工作日、季度、閏年或日期等特徵，使其在預測中更有用。
縮放（Scaling）：不同的屬性遵循不同的單位和值。假設通常以釐米為單位測量一個人的身高，而對於一些數據，可能是以英寸為單位。所以，需要先將其換算成釐米。另外，一個屬性的高/低值可能會影響到其他屬性。例如有3個特徵，如人的年齡、體重和年收入，現在希望根據它們預測醫療保險計劃。如果直接使用這些數據，模型將高度依賴於工資，因為工資的數值遠遠高於其他屬性的值。所以，需要對每個屬性的值進行縮放，調整為[0,1]或[-1,1 ]。

這個過程也稱為特徵處理（Feature Processing），它包括特徵選擇、預處理以及將其轉換為對於機器學習算法有益處的格式。

4．數據分割——訓練數據和測試數據

機器學習算法的目標是對未知的新數據進行預測。我們使用訓練數據來建立模型。在訓練數據時，算法將逐漸減少訓練的誤差。但是，不能將訓練數據的準確率（Accuracy）視為廣義的準確率，其原因在於該算法可能會記住實例並對其進行相應的分類。所以，為了評估生成的模型，需要將數據分為訓練數據和測試數據。利用訓練數據進行算法訓練，利用測試數據來計算生成模型的最終準確率。測試數據並不參與算法訓練。

一般將60%～80%的數據作為訓練數據，剩餘的部分作為測試數據。所以，在測試數據中獲得最好結果的模型可以作為目標模型。

5．算法選擇

我們從一組機器學習算法開始，並將訓練數據的特徵應用到算法中，算法選擇依賴於問題的定義。如果從電子郵件中收集數據，並將郵件分為垃圾郵件或非垃圾郵件，則這時所需要的算法是在輸入變量後輸出相應的結果（垃圾郵件或者非垃圾郵件），這類算法稱為分類（Classification）算法（如決策樹、樸素貝葉斯、神經網絡等）。如果想預測某一任意連續變量（如預測即將到來的季度銷售量），則使用迴歸（Regression）算法（如線性迴歸、核迴歸等）。如果所解決的問題並沒有相關的任何輸出或反應，則可以使用聚類（Clustering）算法，根據它們的特性對其分組。每種類別中都有大量的算法，我們將在後續的章節中給出示例。

6．算法訓練

在選擇算法之後，開始訓練模型。訓練模型是在訓練數據集上進行的，大多數算法的權值/參數在訓練開始時都是隨機分配的，並在每次迭代中加以改進。算法訓練過程中，在訓練數據集上多次運行以產生結果，如圖1.1所示。例如，在線性迴歸的情況下，算法在開始時隨機放置分離線，在每次迭代之後不斷地改進自身（也就是移動分離線）。

7．測試數據評估

利用訓練數據生成最佳算法後，在測試數據集上對算法的性能進行評估。測試數據集並不能參與算法訓練，因此測試數據並不能影響算法的決策。

8．參數調整

在選擇正確的算法後，可以嘗試對其進行改進以獲得更好的性能。每個算法都有不同的參數設置方式，可以對其進行配置從而更改算法性能，這稱為參數調整（Parameter Tuning）。例如可以改變算法學習的速率（學習率）來提高算法性能，這些參數稱為超參數（Hyper Parameter）。對於機器學習來說，參數調整更像是一門藝術。

9．模型使用

上述所有步驟完成之後，就可以獲得在訓練集上訓練生成，並在測試集上完成評估的模型。現在可以使用這個模型來預測新數據的值。對於生產環境，可以將模型部署到服務器，並通過API接口使用模型的預測功能。當然，這個模型並不總一樣的，每當獲得新數據時，都要將上面所列出的步驟重新進行一遍，以改進模型的性能。

因此，在機器學習中，從問題開始，最後以一個解決問題的預測算法結束。

通過下面的問題，我們開始嘗試瞭解機器學習算法是如何解決問題的。

假設你需要購買一棟房子，現在開始查看市場上正在出售的房屋，並據此核對你的預算。你對將要購買的房子有多個要求，首先就是房子的面積。

在圖1.2的情景中，你先考查了一棟600平方英尺（約56m2）的房子，價格是220 000英鎊（約1 942 578元）。這個房子的確很不錯，但是它並不滿足你的要求——你將和你的家人一同居住，而這個房子面積太小，並不能讓每個人都住得舒適。所以，你繼續研究並找到一棟1700平方英尺（約158m2）的房子，價格是730 000英鎊（約6 445 827元）。這個房子滿足你的要求，但是它的價格有些超出你現在的預算——你的預算與小面積房子的價格相比要高一些，但也不像大房子的價格那麼高。然而，只有當你與業主或代理人見面並提交詳細資料後，才能得到房子的實際價格。但是你並不想與每一個業主或者代理人見面。

在二維（2D）平面上分析一下你所考查的兩個屬性，如圖1.3所示。

現在，你在城市裡閒逛，找到一棟面積在這兩棟房子之間的房子。

這棟新房子的面積大約有1 250平方英尺（約116m2），但你還不知道價格。所以，你想預測房子的價格，看其是否符合預算和要求。

將新房子的信息放在同一個二維平面上，試著預測這個房子的價格，如圖1.4所示。

為了預測房屋的價格，將設置一條符合已知結果（即房屋價格和房屋面積）的直線，這裡得到了如圖1.5所示的一條直線。

通過這條直線，可以預測出1250平方英尺（約116m2）的房子的價格是475 000英鎊（約4 194 202.5元）。所以，我們得到了一條根據房子面積來預測房子價格的直線，這種技術稱為線性迴歸（Linear Regression）。可以把這種技術理解為在現有數據點上尋找最佳直線。

比如，計算3個點到直線距離之和的最小值。首先，隨機選擇一條線，直線上方有A、B、C共3個點，如圖1.6所示。

然後，計算每個點到直線的距離，如圖1.7所示。

可以得到總距離是a+b+c。現在，移動直線的位置（向下移動）並再次計算點到直線的距離，如圖1.8所示。

改變了線的位置，但總距離a+b+c增加了。顯然，這不是我們想要的結果。讓我們將直線朝另一個方向（向上移動）移動，如圖1.9所示。

這條直線（見圖1.9）比第一條直線（見圖1.7）要更符合要求。現在移動這條線，並試著重複進行同樣的步驟。最終通過這種方式結束直線的選擇，從而確定直線位置，如圖1.10所示。

對於給定的3個點（A、 B、 C）來說，圖1.10所示的直線是最符合條件的。在這裡取3個點到直線的非負距離，找到這條線的方法稱為梯度下降法。

有時在所有數據點上擬合一條直線並沒有多大意義。現在思考圖1.11所示的點集。

如果嘗試使用線性迴歸技術來擬合一條直線，它看起來如圖1.12所示。

很明顯，這條線不適合用來預測。相反，可以用圖1.13所示的曲線來對數據建模。

這就是所謂的多項式迴歸（Polynomial Regression） —— 因為其參數是多項式。

再來看另一個例子，例如有一個售鞋網站，其中包含來自不同公司的各種鞋子，可以通過其網上商店訂購鞋子。鞋子成功交付後，公司將發送電子郵件獲取顧客的反饋。顧客在評論區內留言，其中有些評論是正面的，有些評論則是負面的。

該公司每天銷售數千雙鞋，需要跟蹤每一個評論並採取相應的行動。如果顧客評論說鞋子質量不佳，則需向生產商詢問有關產品的質量問題；有些鞋子反響很好，則最好將它們放在網站的首頁。

為了解決這個問題，首先需要從一組顧客評論開始，將每個評論分為負面評論或者正面評論，下面給出部分示例。

正面評論

A1：質量不錯！我很喜歡這雙鞋子。

A2：非常好的產品。

A3：給我爸爸買的，他很喜歡。

負面評論

B1：材質不好，不適合。

B2：很不喜歡這個產品，包裝也很不好。

B3：千萬不要買這個產品。

分析示例中的正面評論和負面評論，會發現，如果評論中包含“喜歡”這個詞，那麼它更可能是一個正面評論。因此，創建這條規則並檢查所有數據集，會發現60%的正面評論中包含“喜歡”這個詞；另一方面，只有10%的負面評論中包含“喜歡”這個詞。

同樣，其他詞語所佔的比例如表1.1所示。

因此，對於將來可能獲得的評論，根據其所包含的詞的複合概率，可以判定該評論是正面評論還是負面評論，這就是樸素貝葉斯分類器（Naïve Bayes Classifier）。

再列舉一個向不同的人推薦雜誌的例子。假設已經記錄了用戶的年齡、性別、位置以及他們閱讀的雜誌類型，表1.2所列為記錄的數據。

現在，通過對這些數據進行觀察，可以發現小於15歲的人喜歡閱讀兒童雜誌。根據其製作一個節點和它的決策，如圖1.14所示。每個圓節點表示決策節點，圖的邊緣（箭頭）則表示相應的決策，每個矩形節點表示通過圖分支之後採取的決策。

因此，可以說每個年齡小於或等於15歲的人都有可能閱讀兒童雜誌。現在再來處理大於15歲的讀者的分支。

現在，第二個觀察特徵是男性，他們喜歡閱讀政治雜誌。為其創建相同的決策節點和分支，如圖1.15所示。

接下來，需要看一下年齡在15歲以上的女性的選擇。還有一個信息可以利用——地區。因此，可以說，來自美國的女性喜歡閱讀體育雜誌，而其他地區的女性則喜歡商業雜誌。在這裡形成的節點如圖1.16所示。

正確地對每個數據點進行分類，這個過程中形成了決策樹。可能存在多種創建決策樹的方法。根據現有的數據，這些方法可以做出正確的預測。

圖1.17所示的這棵樹對數據進行了準確的分類。

再來舉另一個例子，有幾個人每年申請貸款，銀行根據他們的收入和貸款額從而決定是否對其提供貸款，目標是向那些在規定時間內償還債務，且沒有任何違約的人提供貸款。

如果一個人月收入是20 000美元，他申請了100 000美元的貸款，銀行根據他的收入來源可以批准貸款；如果一個人月收入是3 000美元，他申請了600 000美元的貸款，則銀行可能會早早地拒絕他。

因此，銀行基於以往違約者的歷史創建了一個數據，如圖1.18所示。紅點表示銀行拒絕受理的申請，綠點表示銀行批准的申請。橫座標是請求的貸款額度，縱座標是月收入。

現在，一個月收入10 000美元的人想要貸款300 000美元，銀行是否會給予批准呢？可以通過一條直線來分割數據，如圖1.19所示。

根據上面的直線，可以預測銀行將同意月薪20 000美元的人申請300 000美元的貸款申請。

現在，已經有一條合適的直線來分割現有的數據點。我們使用的算法（梯度下降法）與在線性迴歸過程中使用的算法相同。在這裡，目標變量是類別而不是在線性迴歸情況下連續的預測值，這種技術稱為邏輯迴歸（Logistics Regression）。

現在，銀行來了一位新的經理，他要檢查所有記錄，他認為銀行批准或拒絕貸款申請的參數是荒謬的，一些像10 000美元或20 000美元的貸款申請並沒有風險，銀行可以同意這部分貸款申請。所以，他改變了規則和數據，如圖1.20所示。

顯然，僅僅使用一條直線並不能將紅點和綠點分開，既然這樣，那使用兩條直線呢？如圖1.21所示。

與一條直線相比，使用兩條直線可以將紅點和綠點分開。這種技術被稱為神經網絡（Neural Network）。神經網絡是基於大腦中的神經元的概念提出的。大腦中的神經元收集信息並將其傳遞給其他神經元。簡單來說，就是基於先前神經元的輸入，下一個神經元接收要求並決定輸出，它還將信息傳遞給其他神經元。最後，通過處理不同的神經元，大腦做出決定。

這個概念可以用下面的模型（見圖1.22）來理解。在這個模型中，兩個神經元通過使用不同的假設建立模型，並且將它們的發現發送給另一個神經元。根據收集到的信息，輸出神經元做出決策。

在處理數據時，對於一條分割數據點的直線，可能有不同的選擇。如圖1.23所示的兩個例子。

與直線1相比，直線2的邊距更大，其在分割數據方面似乎更好，如圖1.24所示。

現在我們要尋找最佳分割路線，而梯度下降並不能解決這個問題，需要線性優化才能實現。這種技術被稱為最大間隔分類器或支持向量機（Support Vector Machine， SVM）。

在現實世界中，數據並不能完全分割開。它可能會如圖1.25所示的那樣。

所以，不能通過一條直線就把紅點和綠點分開。但是如果通過一個平面來區分紅點和綠點，就可以用一個分類器對它們進行分類。創建一個新的維度並用這個平面來分割紅點和綠點，如圖1.26所示。

現在使用一個新的維度將紅點和綠點分開。這種技術被稱為核函數（Kernel Trick）。

真實的數據非常複雜，而且有很多維度。帶有支持向量機分類器的核函數可以用來解決這些複雜的問題。

現在來看另一個問題。如圖1.27所示，有一家雜貨店A2A。他們提供電話送貨服務，每當接到電話時，他們就會將地址發送給派送員，派送員會趕赴送貨地點並交付商品。他們設法將辦公室設在城市的中心，以便為越來越多的人及時提供服務。

這裡的點代表A2A的服務需求。現在他們意識到，這種一個配送中心處理所有的需求的做法並不明智。於是，他們決定在城市中開設4個配送中心，依照不同地區來接受需求並提供服務。

因此，為了解決這個問題，首先可以隨機地添加4個配送中心並給予其商品派送需求，如圖1.28所示。

顯然，這不是配送中心的最佳分配位置。接下來，將每個點移動到分類點的中心。然後，將所有點分類到最近的配送中心，並將配送中心的位置移動到之前的分類中心。經過多次迭代，將得到圖1.29所示的分配位置。

因此，每個點的分配都是基於點到中心的距離。這種技術稱為K-均值聚類（K-Means Clustering）。

也可以使用另一種方法進行聚類。把所有的點看作是獨立的集群，而不是首先將它們分組到集群中再對其進行重新分配。然後，將兩個最近的點進行分組，形成一個簇。一直這樣操作，直到出現較大的距離或者形成最小數量的簇。這種技術稱為層聚類（Hierarchical Clustering）

。

本文摘自《Python機器學習》

分享到:

關鍵字: 學習隨機數機器學習

【學習】凝心聚力抗擊疫情，踐行參政黨使命擔當

林口縣人民檢察院召開檢委會學習《人民檢察院檢察委員會工作規則》

學習“圓方精神”堅定發展信心總書記回信讓河南民營企業家倍受鼓舞

自己總結出來，送給學習差的人，值得擁有、學習，其實自己很優秀

品讀經典滌盪思想堅定信念——學習《馬列主義經典著作選編》的心得體會

【社區矯正】烏拉特中旗司法局組織開展《社區矯正法》學習

每天堅持看書、學習，但總感覺啥也沒學？四個方法教你好好學習

富裕縣司法局組織《黑龍江省優化營商環境條例》學習

【動態】雲巖區司法局黔靈鎮司法所組織社矯人員學習《社區矯正法》

新管理思想鍛造新時代創新創業幹部隊伍

賺錢，變美，學習，精緻小女人生活三重奏

《易經》學習，變易、不易、簡易

教育部：不建議佔用假期補課，學習“來日方長”，學生：太暖心！

“黨建+團建”走進汀州 “學習+服務”匯聚能量

孔子談「學習」：學習是你自己的事情

學習“中國精神”？快到“屋”裡來！

無界大學丨如何激發孩子對於“學習”的內驅力？

【學習“四史”】毛澤東《永久奮鬥》告訴青年什麼？

學習+培訓，功夫不負“納稅服務人”

學習 | 在國內如何學習俄語……

學習 | 帶你從零開始認識俄語……

如何快速積累工作經驗：向身邊的“老鳥”學習

察右後旗交管大隊聯合察右後旗司法局在轄區內開展學習交通法規、學習《民法典》宣傳活動

合陽縣甘井鎮：學習《條例》強業務，依法信訪促規範

怎樣利用 iPad 學習？

學習，研究，運用

看看差生，就看到了自己的進步

夢之橋·49、學習、成長、分享

直播、創業、工作、學習、生活你有目標嗎？

學習，是為了更高級的享樂

提升自己比什麼都重要！

加V、原創、運動、學習、上班和帶娃等等，我們都可以做到

【涇檢快訊】學習《社區矯正法》，提升執檢工作能力

學習《民法典》規範“思與行”

學習，父母or孩子？

果敢小學：強化“八嚴格、八嚴禁”學習全面提升果敢小學形象

二戰各參戰國主要領導人的學歷大比拼：才能面前，一切都是虛無。

學習，啟程

【學習】這樣的蠢事決不能做！

冬訓在“疫”線學習“不打烊”

學習：最高法劉貴祥專委談公司對外擔保問題

學習：最高法劉貴祥專委談金錢之債的裁判思路

學習：最高法劉貴祥專委談案外人救濟制度

學習：最高法劉貴祥專委談公司清算責任問題

致知班家書

學習 000

學習，不能只問不學

#卡帥上課or下課# 學習？學個屁！#中超# #廣州恆大#

學習！

小夥子學習了

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

記者從河北省公安廳獲悉，日前公安部通緝的13名A級通緝犯中的2號通緝犯魯某某近日向河北邯鄲警方投案自首，這是公安部A級通緝令後又一通緝犯主動投案。

當我們在談 SaaS 的時候，在談什麼？

當我們在談SaaS 的時候，在談什麼？什麼是 SaaSSaaS 優缺點SaaS 銷售模式SaaS 產品指標SaaS 業務指標SaaS 收入計算一、什麼是 SaaS這個模式讓軟件變得和水電氣很相似，只需要每月繳納固定的費用即可享受服務。

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

現階段，隨著國家供給側結構性改革的不斷深入，人們在市場中的互易行為日益頻繁，合同在經濟活動發揮的作用也日漸凸顯。

5月西安招聘會時間安排來了！找工作的別錯過

乘車路線:西安市內乘坐12路、14路、14路區間、26路、215路、215路區間、216路、224路、229路、239路、31路、36路、321路、323路、521路、600路、603路、616路、701路、704路、709路、教育專線、K605路、K616路、遊6路、遊8路61

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

基於以太坊區塊鏈的主要穩定幣包括：Tether、TrueUSD、GeminiDollar、Paxos Standard、Binance USD、USD Coin、Huobi USD和MakerDAO等。

“幫助當地居民解決用水難題”-今日頭條-手機光明網

晨曦初露，9歲的米格爾和弟弟妹妹們抱著水罐，穿過一片田野，到達安哥拉首都羅安達郊區的指定取水點。葛洲壩安哥拉有限公司市場部負責人劉世軒介紹說，公司每天派出送水車兩次，一次3車，將潔淨水從羅安達水廠直接運往指定取水點。

灌籃高手無水印壁紙，每一張都是回憶

那些年，我們追過的灌籃高手，你更喜歡誰呢？流川楓櫻木花道赤木剛憲宮城良田三井壽你喜歡哪個球員呢？歡迎評論區留言。

通遼藍天救援隊成功解救遼河公園水上被困群眾

2020年5月1日，通遼藍天救援隊假期例行在遼河公園水域進行安全巡邏任務，下午15時10分，巡邏隊員發現遼河水面有被困群眾向巡邏船隻求救，接到求救信號後，巡邏隊員緊急前往事故現場展開研判、救援準備工作。

5月6日·武漢要聞及抗擊肺炎快報

今天零時起高速公路恢復收費了，這些車輛還能免費5月6日零時起全國高速公路恢復收費在武漢北收費站ETC和人工車道全部可通行零時左右通過收費站的車輛並不多以大貨車為主有工作人員在一旁引導貨車進入高速收費站前要通過入口稱重檢測車道進入沒有超重超限便可順利通過現場沒有出現排隊的現象全省聯

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

2020年4月29日下午，肖副省長等省市領導來到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作，肖副省長等省市領導在學校領導陪同下，重點對校門口出入、保健室、教室、學生心理輔導室、洗手池等進行了非常細緻的檢查，對孝感市楚澴中學的復學和疫情防控工作給予充分的肯定。

相聲界的顏值擔當張雲雷稱號大揭祕

這個播放量就連師傅身為相聲演員的張雲雷卻有著堪比娛樂圈小鮮肉的顏值，一個相聲演員長成這樣，張雲雷不火誰能火。

美國百年薅羊毛攻略

當德國向法軍陣地傾洩400多萬發炮彈，揚言要讓凡爾登成為「碾碎法軍的絞肉機」時，遠在大西洋的美國人。

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

近日，由楊洋、江疏影主演的劇版《全職高手》在騰訊視頻正式開播了，該劇改編自蝴蝶藍同名小說，先前還被改編成動畫版。

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

前言：IG這隻老牌戰隊在我們LPL賽區以來都擁有著非常高的人氣，特別是在2018年之後，他們幫助我們LPL賽區奪得了第一個寶貴的S賽世界冠軍，而IG戰隊的打法一直以來也是非常有觀賞性的。

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

Doinb表示："可以的話我不想參加，首先這場比賽沒有任何意義，獲得勝利既不會有獎金也不會有榮譽，但萬一輸掉比賽FPX就會成為大家吐槽的焦點"。

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

大家都知道天后王菲和前夫李亞鵬他們育有一個女兒，名叫李嫣。於是李嫣因為偷偷的開了直播從而也導致了她被大家所發現，但李嫣的樂觀和開朗卻也讓李亞鵬放下心來，決定放飛女兒，讓她自由的去探索她想要的世界。

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

天王郭富城近日參加活動，首度承認妻子方媛懷有二胎的消息。從去年2017年兩人結婚，低調的愛情讓媒體都捕捉不到邊際，天王嫂31歲兩人相差了20歲的愛戀，始終不少人不看好啊。

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

演員在我們眼中一直都是光鮮亮麗、收入頗高的職業，並且現在有很多靠流量躋身一線，卻毫無演技以及實力的演員。

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

曾經賈乃亮是“陽光”的代名詞，大家看到他都覺得很暖，只不過後來就不是了。今天早上，他發了一條微博“人生的美好就是每天醒來都能看到上帝賜予我的那一米陽光”，這句話當中，賈乃亮用到了“一米陽光”這個詞。

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

當一名理髮師也不容易這是一隻有航天夢想的老鼠寶寶！什麼？這麼貴！把我賣了得了。小朋友，你贏了，我甘拜下風！

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

程瀟可謂是才女，她是中韓宇宙少女的成員之一，今年她只有20歲。不要看程瀟年紀比較小，但是她身材還是挺好的，身材也是典型S型曲線，魅力不小。

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

張柏芝是許多80後90後心目中的女神，除了顏值高有演技外，她和謝霆鋒的婚姻和戀情也曾是吃瓜群眾津津樂道的事。

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

前言：目前各大賽區的春季賽都已經結束了，T1戰隊在重組之後再度拿下了lck賽區的冠軍，這讓很多的玩家非常意外，這也從側面反映出來了，核心選手和主教練的個人能力，同時faker的實力再度被玩家們認可，最近一段時間他也是一直在直播，很多的人都在詢問，今年李哥的目標是什麼？

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

上線之後迅速引發了大量玩家的好評，就在最近，官方也是迎來了10.9版本，可是在目前的版本中再度出現了太多的畸形玩法了，應該是有史以來最不平衡的版本，因為一費卡的爆率大大提升，導致遊戲成為了三星的天下，全員搶一費卡，運氣成為吃雞的關鍵。

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

在本期節目中會評選出一位最美麗LPL女解說，其中瞳夕、Rita、餘霜等都在名單之中，最有趣的是管澤元居然也出現在了“女解說”名單中，全因餘霜一張P過的照片，論梗的話，管澤元第一，若是輪顏值，估計這也排不上名次。

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

不過要是像唐嫣和羅晉那樣用公費談戀愛的故事不多，大多數還是和不是心愛的人拍得多，但要是遇上岳雲鵬和佟麗婭拍親熱戲的話，那個畫面或許大家想象不出來吧。

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

LPL賽區的春季賽結束也有一段時間了，作為冠軍戰隊JDG，並沒有因為拿到冠軍而出現“人氣”的高漲，依舊平平淡淡，熟悉LPL賽區的玩家都知道，在LPL賽區中，一直以來都是由RNG、IG、EDG三家從“遠古”時期就開始統治LPL賽區，期間也有OMG和LGD、WE幾個戰隊打破了這個規律

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

學習結束，回到家後，在武大短暫學習的那段時光時常讓我懷念，並曾立下誓言，抽個暑假一定要帶著老婆孩子一起去“逛”武大。機會就這麼悄然而至！2019年第28屆世界腦力錦標賽全球總決賽的舉辦地就是武漢，比賽的日期是12月6日到8日，三天的時間。其實，我也沒有想到第一次參加這樣比賽的女兒

T1提議中韓友誼賽，但LPL隊伍都不想參加？理由其實很簡單

這不今天就有網友在論壇中聊起了這個話題，有網友表示“LPL隊伍其實都不想參加中韓友誼賽，LPL隊伍才剛結束春季賽，18天之後就要打夏季賽了，像IG可能會有人員變動FPX TES 應該也會利用這段時間來檢討分析，也許只有JDG 比較願意參加，doinb只是第一表態的選手，可能還有很

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽，於2020年04月28日上線，由信陽本地聯盟上傳。西瓜視頻為您提供高清視頻，畫面清晰、播放流暢，看豐富、高質量視頻就上西瓜視頻。

2020最佳韓劇追起來~《愛的迫降》僅排名第二，TOP 1絕對實至名歸

TOP20 - 「優雅的家」這部由林秀香、李章宇、裴宗玉等人所主演的《優雅的家》，當時一播出就引起不少話題，雖然劇情有點浮誇，但卻莫名好看，而當時該劇還刷新了MBN電視臺的記錄呢~《優雅的家》主要講述一位擁有完美外貌和身材的MC集團獨生女毛碩熙，為了查明15年母親去世的真相，因此

搞笑GIF開心一刻：我正在睡覺，誰敢打擾我

我這暴脾氣，等你剝完我能吃五個你帶著你家貓去做演員吧！這貓太有前途了！這是我見過最牛的啦啦隊！自從有了弟弟，老大就和家務結緣了狼狗：要不是主人在，我非吃了你兩個小子！

備考消防的幾大錯覺，你有這個情況嗎？

講真，很多時候我們會把事情想當然，並因為這些錯覺而採取錯誤的舉動，一消備考是一場毅力和心智的戰鬥，大家難免會產生一些錯覺，從而影響自己的備考效率，甚至導致備考失敗。

“頂流”李敏鎬啞火，渣男出軌劇出圈，韓劇觀眾也長大了？

豆瓣開分8.3，漸漸跌到7.7分，熱門短評寫道：“同樣是金編，差距怎麼這麼大”、“看了四集節奏真的是一團糟，比起隔壁《夫妻的世界》真的差一大截”。

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患

隨著“五一”期間氣溫大幅回升全國大部分地區已經進入初夏在享受小長假春日美景的同時森林火險等級也隨之明顯提升新疆森林消防提示您春季氣溫回升快野外草木乾燥你的一個失當用火行為就有可能引發森林大火勿念蔥林繁似海一星燃盡只塵埃

搞笑GIF開心一刻：拍照啦，趕緊看鏡頭

弟弟：姐姐你能利索點嗎家裡有個熊孩子，說實話心很累同學感覺你好可伶，一個人跳舞多尷尬啊！看我病好了怎麼收拾你們！真的是以迅雷不及掩耳之勢啊。姑涼，你……掉毛啊！小姐姐你是想找男朋友嗎用這樣的方式，結局很意外此處注意安全！

工程發承包、工程造價條款，或迎來大調整

第二章建設規劃與設計第一節建設規劃第八條建設規劃的體系第九條建設規劃的編制與審批第十條建設規劃的內容第十一條建設規劃的實施與評估第二節城市設計第十二條城市設計的基本要求第十三條城市設計的編制和審批第十四條城市設計的實施和管理第三節建築設計第十五條建築設計的基

新增四省！關於2019年一級建造師考試證書、複核發佈公告

快來看看吧~青海關於恢復專業技術人員職業資格證書的發放、補辦工作的通知各位考生：隨著疫情防控進入常態化，青海省新冠疫情得到有效控制，專業技術人員職業資格證書的印製、發放工作正在逐步恢復，為方便廣大考生辦理證書業務，4月28日起青海省人力資源和社會保障服務中心一樓大廳65、66號辦

學霸也會復讀？朱廣權這個圈粉無數的國民段子手是如何煉成的！

“煙籠寒水月籠沙，不止東湖與櫻花，門前風景雨來佳，蓮藕魚糕玉露茶，鳳爪藕帶熱乾麵，米酒香菇小龍蝦，守住金蓮不自誇，趕緊下單買回家，買它買它就買它，熱乾麵和小龍蝦。”

幸福的人，總會忘記舊愛

幸福從來不可能是有個人幫你搞定所有的一切，而你只需要坐享其成。她喜歡喝銀耳蓮子羹而且必須是上好的銀耳，用小火慢慢燉到砧稠那一日，他去看她，她冷冷地從屋裡走出來，丟給他一本書.對他說:"廚房裡小鍋燉著東西，你幫我去看看。”他真真地守了一個多小時，端到她面前。

真人芭比：一直說自己“沒整容”最後晒出舊照，打臉的卻是自己

俗話說的好“愛美之心人人都有”而讓自己快速變美的方法無疑就是“整容”如今的社會整容看起來似乎很平常。

驚了！這件事沒有做，一消證書等於白考！

不要慌，同學們，遇到問題不要怕，拿到證書不去註冊，相當於證書無效，今天就為大家一一解答註冊證書的相關問題。

8年後，有哪些人會留在農村生活？以下4類人群或將留下，有你嗎

從九十年代末開始，在我國農村地區就興起了一股“進城潮”，記得那個時候，農村的經濟發展相對滯後，村民生活條件艱苦，鄉親們為了擺脫貧困，只能告別親人，遠離家鄉去外面打拼賺錢。

唯一回絕張藝謀力捧的女生，被報送上清華，25歲有上百億身家

25歲有上百億身家文/娛樂深扒爆姐圖/網絡張藝謀是一位非常有實力的導演，同時非常出名，而且他拍攝的作品中有不少獲獎無數的經典影片，同時也捧紅過不少藝人。

疫情下的悲劇：買不起手機上網課，那個女孩決定吞藥自殺

有人為了生計不顧自身安危，有人躲在家中安然度日，還有人僅僅因為一個手機，就要放棄自己的生命...這個女孩，今年上初三，因為疫情的原因，全國各地都展開了網課線上教育，女孩的學校也不例外。

李棟旭劉仁娜新劇開拍，互對臺詞歡樂多，終於要開始撒狗糧了嗎？

這部劇是2016年年底播出的，熱度一直持續到了2017年，相關的周邊和景點都相當熱門，像是池恩卓跟鬼怪大叔相遇的海邊、劇中出現的鬼怪玩偶、還有鬼怪大叔的拔劍特效等等。

高考延期：七月的高考，最熱的天，做最難的題！

後來，由於7月份氣候較差，極端天氣頻發，尤其是南方地區，要麼極端高溫，要麼就是颱風，對於高考來說非常不友好，不僅考生的考試質量會下降，而且閱卷老師、高考工作者也不方便，因此，從2003年開始，高考日期都固定在了每年的6月7日、8日。