一份完備的集成學習手冊！（附Python代碼）

2018-10-11 10:09:08 機器學習與數據挖掘

引言：

試想一下，當你想買一輛新車時，你會直接走到第一家汽車商店，並根據經銷商的建議購買一輛車嗎？這顯然不太可能。

你可能會瀏覽一些門戶網站，在那裡查看人們對於不同車型的比較和評論，瞭解它們的特點和價格。你也可能會向朋友和同事徵求一下他們的意見。簡而言之，你不會直接給出一個結論，而是會綜合考慮其他人的意見再做出決定。

機器學習中的集成模型（Ensemble Models）採用了類似的思想。集成模型結合多個模型的決策，以提高整體性能。這可以通過多種方式來實現，本文將一一介紹。

本文的目的是介紹集成學習的概念，並理解使用這種技術的算法。為了加強您對不同算法的理解，我們將對實際問題的案例使用 Python 來解釋這些高級算法。

注意：弄懂本文需要對機器學習算法有一個基本的瞭解，我建議你通過這篇文章來熟悉一些基本概念：

一份機器學習的自白書

1. 集成學習簡介

讓我們通過一個例子來理解集成學習的概念。假設你是一個電影導演，你對一個非常重要和有趣的話題都創作了一部電影短片。現在，你想在公映之前對這部電影進行初步的反饋（打分）。該怎麼做呢？

A: 你可以諮詢一個好朋友來對電影進行打分

這種方法完全有可能會出現一種情況，就是電影很糟糕，但是你的好朋友不忍心傷你的心，因此不會打一星。

B: 你可以諮詢 5 位同事來對電影進行打分

這種方法要好些，可以為你的電影提供較誠實的評價。但問題依然存在，這 5 個人可能不是該電影主題的專家，雖然他們可能知道攝影、鏡頭、音頻等一些電影知識。

C: 你可以諮詢 50 個人來對電影進行打分

其中一些可能是你的朋友，有些可能是你的同事，有些甚至可能是陌生人。

這種打分方法，反應會更加普遍和多樣化，因為打分的人更多更多樣了。事實證明，相比 A 和 B，C 更加科學。

通過這些例子，你可以推斷出相比一個人的意見，綜合多個人的意見可能做出更好的決定。這個例子對於多模型和單模型的比較也是成立的。機器學習中的這種多樣化是通過一種稱為集成學習的技術實現的。

現在，你已經掌握了集成學習的要點。接下來讓我們看看集成學習中的各種技術及其實現方法。

2. 基本的集成技術

在本節中，我們將介紹一些簡單但功能強大的技術：

最大化
平均化
加權平均

2.1 最大化

最大化通常用於分類問題。這種技術，所有模型都對該實例進行預測，每個模型的預測都可以看成是一次投票。獲得投票數最多的那一類別就是最終的預測結果。

例如剛才的例子，5 個同事給你的電影打分，其中 3 人打了 5 星，2 人打了 4 星。則根據最大化原則，打 5 星的人數更多，最終判斷電影評分為 5 星。

示例代碼：

model1 = tree.DecisionTreeClassifier()
model2 = KNeighborsClassifier()
model3= LogisticRegression()
model1.fit(x_train,y_train)
model2.fit(x_train,y_train)
model3.fit(x_train,y_train)
pred1=model1.predict(x_test)
pred2=model2.predict(x_test)
pred3=model3.predict(x_test)
final_pred = np.array([])
for i in range(0,len(x_test)):
 final_pred = np.append(final_pred, mode([pred1[i], pred2[i], pred3[i]]))

或者，你也可以使用 sklearn 庫中的 VotingClassifier：

from sklearn.ensemble import VotingClassifier
model1 = LogisticRegression(random_state=1)
model2 = tree.DecisionTreeClassifier(random_state=1)
model = VotingClassifier(estimators=[('lr', model1), ('dt', model2)], voting='hard')
model.fit(x_train,y_train)
model.score(x_test,y_test)

2.2 平均化

類似於最大化投票方法，平均化的做法就是對所有的預測結果求平均值，平均值作為最後的預測結果。平均化可以應用於迴歸問題的預測或者在分類問題中計算概率值。

還是剛才的例子，5 個同事給你的電影打分，其中 3 人打了 5 星，2 人打了 4 星。則根據平均化原則，計算最終打分為：

(5 + 5 + 5 + 4 + 4) / 5 = 4.6

示例代碼：

model1 = tree.DecisionTreeClassifier()
model2 = KNeighborsClassifier()
model3= LogisticRegression()
model1.fit(x_train,y_train)
model2.fit(x_train,y_train)
model3.fit(x_train,y_train)
pred1=model1.predict_proba(x_test)
pred2=model2.predict_proba(x_test)
pred3=model3.predict_proba(x_test)
finalpred=(pred1+pred2+pred3)/3

2.3 加權平均

這是平均化方法的一個擴展，所有的模型被賦予不同的權重（定義為在預測中不同模型所佔的重要性）。例如，如果你的兩個同事在這方面比較專業，那麼他們兩人的意見所佔的比重就更大一些。假設這兩人佔的比重均為 0.23，其他三人佔的比重均為 0.18，則加權平均後的結果為：

5*0.23 + 4*0.23 + 5*0.18 + 4*0.18 + 4*0.18 = 4.41

示例代碼：

model1 = tree.DecisionTreeClassifier()
model2 = KNeighborsClassifier()
model3= LogisticRegression()
model1.fit(x_train,y_train)
model2.fit(x_train,y_train)
model3.fit(x_train,y_train)
pred1=model1.predict_proba(x_test)
pred2=model2.predict_proba(x_test)
pred3=model3.predict_proba(x_test)
finalpred=(pred1*0.3+pred2*0.3+pred3*0.4)

3. 高級集成技術

上文我們已經瞭解了基本的集成技術，接下來將介紹一下高級的集成技術。

3.1 Stacking

Stacking 是使用多個模型（例如決策樹、KNN、SVM）來構建新的模型的集成技術。該模型在測試集上進行預測。下面是一個簡單的 Stacking 集成的詳細步驟解釋。

1）將訓練集劃分為 10 個子集。

2）在其中 9 個子集上訓練一個基本模型（例如決策樹模型），在第 10 個子集上進行測試。遍歷每個子集，重複進行 10 次。得到的 DT 長度與 Train set 相同。

3）在整個訓練集上使用該模型（決策樹）進行建模。

4）使用建模的模型在測試集上進行測試。

5）使用另一種算法（例如 knn），重複步驟 2～4，作用在 Train set 和 Test set 上，得到另一組值。

6）使用得到的 DT 和 knn 組合作為新的特徵 TRAIN PREDICTION SET，訓練新的模型（例如邏輯迴歸）。

7）使用訓練好的模型對 TEST PREDICTION SET 進行預測。

示例代碼：

首先，我們需要定義一個函數對 n 折訓練集和測試集進行預測，該函數返回每個模型對訓練集和測試集的預測結果。

def Stacking(model,train,y,test,n_fold):
 folds=StratifiedKFold(n_splits=n_fold,random_state=1)
 test_pred=np.empty((test.shape[0],1),float)
 train_pred=np.empty((0,1),float)
 for train_indices,val_indices in folds.split(train,y.values):
 x_train,x_val=train.iloc[train_indices],train.iloc[val_indices]
 y_train,y_val=y.iloc[train_indices],y.iloc[val_indices]
 model.fit(X=x_train,y=y_train)
 train_pred=np.append(train_pred,model.predict(x_val))
 test_pred=np.append(test_pred,model.predict(test))
 return test_pred.reshape(-1,1),train_pred

然後，我們構建兩個基本模型：決策樹和 knn。

model1 = tree.DecisionTreeClassifier(random_state=1)
test_pred1 ,train_pred1=Stacking(model=model1,n_fold=10, train=x_train,test=x_test,y=y_train)
train_pred1=pd.DataFrame(train_pred1)
test_pred1=pd.DataFrame(test_pred1)

model2 = KNeighborsClassifier()
test_pred2,train_pred2=Stacking(model=model2,n_fold=10,train=x_train,test=x_test,y=y_train)
train_pred2=pd.DataFrame(train_pred2)
test_pred2=pd.DataFrame(test_pred2)

最後，使用邏輯迴歸，進行訓練和預測。

df = pd.concat([train_pred1, train_pred2], axis=1)
df_test = pd.concat([test_pred1, test_pred2], axis=1)
model = LogisticRegression(random_state=1)
model.fit(df,y_train)
model.score(df_test, y_test)

為了將問題簡單化，我們所創建的 Stacking 模型只有兩層。第一層是建立決策樹和 knn 模型，第二層是建立邏輯迴歸模型。實際應用中可以使用多個層次的複雜結構。

3.2 Blending

Blending 與 Stacking 類似，但是僅從訓練集上劃分一部分作為 holdout（驗證集），沒有使用 k 折驗證。Holdout 集結果作為下一層的訓練數據。下面是 Blending 的詳細步驟解釋。

1）將所有的訓練數據劃分為訓練集和驗證集。

2）在訓練集上訓練模型。

3）在驗證集和整體測試集上進行模型測試。

4）驗證集和測試結果作為元特徵，進行第二層的模型訓練。

5）使用該模型在整體測試集的元特徵上進行模型驗證。

示例代碼：

首先，我們在訓練集上訓練兩個模型：決策樹和 knn，以便在驗證集上作出預測。

model1 = tree.DecisionTreeClassifier()
model1.fit(x_train, y_train)
val_pred1=model1.predict(x_val)
test_pred1=model1.predict(x_test)
val_pred1=pd.DataFrame(val_pred1)
test_pred1=pd.DataFrame(test_pred1)
model2 = KNeighborsClassifier()
model2.fit(x_train,y_train)
val_pred2=model2.predict(x_val)
test_pred2=model2.predict(x_test)
val_pred2=pd.DataFrame(val_pred2)
test_pred2=pd.DataFrame(test_pred2)

然後，結合驗證集的元特徵，訓練邏輯迴歸模型，在測試集上進行驗證。

df_val=pd.concat([x_val, val_pred1,val_pred2],axis=1)
df_test=pd.concat([x_test, test_pred1,test_pred2],axis=1)
model = LogisticRegression() 

model.fit(df_val,y_val)
model.score(df_test,y_test)

3.3 Bagging

Bagging 背後的思想就是將多個模型（例如決策樹）的結果結合得到泛化的結果。這裡有一個問題：在同樣的數據集上訓練得到不同的模型有用嗎？有很大幾率這些模型將給出同樣的結果，因為它們的輸入都是一致的。因此，如何解決這一問題呢？常用的方法就是 Bootstrapping。

Bootstrapping 是一種採樣技術，從原始數據集中有放回地採樣，創建觀測子集。子集的大小與原始集合的大小相同。

Bagging（Bootstrap Aggregating）技術使用這些子集（bags）來得到一個相對公平的分佈（完全集）。子集的大小也可能少於原始集。

1）從原始數據集中創建多個子集，有放回地進行採樣。

2）在每個子集上訓練一個基本模型（弱模型）。

3）這些模型相互平行且獨立。

4）最後的預測結果由所有模型共同決定。

3.4 Boosting

在我們進一步討論之前，還有一個問題：如果一個數據點被第一個模型預測錯誤，那麼下一個模型（可能是所有的模型）組合預測會預測正確嗎？這樣的情況可以通過 boosting 來處理。

Boosting 是一個循序漸進的過程，其中每一個後續模型都試圖糾正前一個模型的錯誤。後一個模型依賴於先前的模型。下面讓我們來了解 Boosting 的工作方式。

1）從原始數據集中創建一個子集。

2）起始狀態，所有數據點都賦予相同的權重。

3）在這個子集上訓練一個基本模型。

4）使用該模型在整個數據集上進行預測。

5）根據實際值和預測值計算誤差。

6）對預測錯誤的數據點給予更高的權重（如上圖中預測錯誤的藍色的“+”將賦予更大的權重）。

7）在此數據集上訓練一個新的模型並預測（該模型試圖糾正上一個模型中的錯誤點）。

8）類似地創建多個模型，每個模型校正前一個模型的錯誤。

9）最終的模型（強學習器）是所有模型（弱學習器）的加權平均。

因此，Boosting 算法結合了一些弱學習器，形成一個強大的學習器。單個模型在整個數據集上表現不好，但是它們在部分數據集上可能表現得很好。因此，每個模型實際上提升了集合的性能。

4. 基於 Bagging 和 Boosting 的算法

Bagging 和 Boosting 是機器學習中最常用的兩種技術。在這一節中，我們將詳細地研究它們。以下是我們將重點研究的算法：

Bagging 算法：

Bagging 元估計
隨機森林

Boosting 算法：

AdaBoost
GBM
XGBM
Light
GBM
CatBoost

或者在本節中討論的所有算法，我們將遵循這個過程：

算法介紹
示例代碼
參數

這篇文章中，我將討論貸款預測問題。您可以從這裡下載數據集：

https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/

請注意，對於每個算法，一些代碼（讀取數據、分割訓練集、測試集等）是相同的。為了避免重複，我已經在下面寫下這些相同的代碼，之後只會深入討論算法的核心代碼。

#importing important packages
import pandas as pd
import numpy as np
#reading the dataset
df=pd.read_csv("/home/user/Desktop/train.csv")
#filling missing values
df['Gender'].fillna('Male', inplace=True)

類似地，關於數據填充、缺失值、異常值的處理，本文不做具體介紹。可參閱這篇文章瞭解相關內容：

https://www.analyticsvidhya.com/blog/2015/04/comprehensive-guide-data-exploration-sas-using-python-numpy-scipy-matplotlib-pandas/

#split dataset into train and test
from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size=0.3, random_state=0)
x_train=train.drop('Loan_Status',axis=1)
y_train=train['Loan_Status']
x_test=test.drop('Loan_Status',axis=1)
y_test=test['Loan_Status']
#create dummies
x_train=pd.get_dummies(x_train)
x_test=pd.get_dummies(x_test)

接下來，讓我們開始 Bagging 和 Boosting 算法吧！

4.1 Bagging 元估計

Bagging 元估計是一種集成算法，可用於分類（BaggingClassifier）和迴歸（BaggingRegressor）問題。它遵循典型的 Bagging 技術進行預測。下面是 Bagging 元估計算法的步驟：

1）從原始數據集中創建隨機子集（Bootstrapping）。

2）子集包含所有特徵。

3）用戶指定的基本估計器在這些子集上進行訓練。

4）每個模型的預測結合形成最終的結果。

代碼：

from sklearn.ensemble import BaggingClassifier
from sklearn import tree
model = BaggingClassifier(tree.DecisionTreeClassifier(random_state=1))
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.75135135135135134

對於迴歸問題：

from sklearn.ensemble import BaggingRegressor
model = BaggingRegressor(tree.DecisionTreeRegressor(random_state=1))
model.fit(x_train, y_train)
model.score(x_test,y_test)

參數：

base_estimator:
它定義了基本的學習器，缺失時默認使用決策樹。
n_estimators:
它定義基本學習器的數量。學習器數量需要選擇合適的值，太大影響訓練速度，太小影響訓練精度。
max_samples:
每個子集最大樣本數量。
max_features:
每個子集最大特徵數量。
n_jobs:
並行運行的任務數量。將該值設置為與系統中的內核相等。如果設置為 -1，任務數量等於內核數。
random_state:
它指定了隨機劃分的方法。當兩個模型的隨機狀態值相同時，它們的隨機選擇相同。比較不同的模型時，這個參數是有用的。

4.2 隨機森林

隨機森林遵循 Bagging 技術的另一種集成機器學習算法。它是 Bagging 估計算法的一個擴展。隨機森林中的基本學習器是決策樹。與 Bagging 元估計不同，隨機森林隨機選擇一組特徵，這些特徵用於在決策樹的每個節點處決定最佳分割。

隨機森林算法的詳細步驟如下：

1）從原始數據集中創建隨機子集（Bootstrapping）。

2）在決策樹中的每個節點，使用隨機特徵來決定最佳分割。

3）在每個子集上訓練一個決策樹模型。

4）最後的結果是對所有決策樹的預測計算平均值。

注：隨機森林中的決策樹可以建立在數據和特徵的子集上。特別地，sklearn 中的隨機森林模型將所有特徵用於決策樹，並且隨機選擇特徵子集用於在每個節點處分割。

總之，隨機森林隨機選擇數據點和特徵，並建立多個樹木（森林）。

代碼：

from sklearn.ensemble import RandomForestClassifier
model= RandomForestClassifier(random_state=1)
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.77297297297297296

你可以使用 model.feature_importances_ 來查看特徵的重要性。

for i, j in sorted(zip(x_train.columns, model.feature_importances_)):
 print(i, j)

結果如下：

ApplicantIncome 0.180924483743 CoapplicantIncome 0.135979758733 Credit_History 0.186436670523. . . Property_Area_Urban 0.0167025290557 Self_Employed_No 0.0165385567137 Self_Employed_Yes 0.0134763695267

迴歸問題的示例代碼：

from sklearn.ensemble import RandomForestRegressor
model= RandomForestRegressor()
model.fit(x_train, y_train)
model.score(x_test,y_test)

參數：

n_estimators:
它定義了在隨機森林中創建的決策樹的數量。一般來說，較多的決策樹使預測更強、更穩定，但是過多會導致更長的訓練時間。
criterion:
它定義了用於分裂的函數。該函數測量每個特徵的分割質量，並選擇最佳分割。
max_features :
它定義了每個決策樹中分割所允許的最大特徵數。增加其值通常會提高性能，但是過高會降低每顆樹的多樣性。
max_depth:
隨機森林具有多個決策樹。此參數定義樹的最大深度。
min_samples_split:
定義葉節點分裂所需的最小樣本數。如果樣本數量小於改值，則節點不被拆分。
min_samples_leaf:
定義在葉節點上需要的最小樣本數。較小的值使得模型更容易捕獲訓練數據中的噪聲。
max_leaf_nodes:
此參數指定每個樹的最大葉節點數。當葉節點的數量等於該值時，停止分裂。
n_jobs:
這指示並行運行的任務數量。如果您希望它在系統中的所有內核上運行，則將值設置為 -1。
random_state:
此參數用於定義隨機選擇。比較不同的模型時，這個參數是有用的。

4.3 AdaBoost

自適應 Boosting（AdaBoost）是最簡單的 Boosting 算法之一。通常，決策樹用於建模。順序創建多個模型，每個模型校正前一個模型的錯誤。AdaBoost 為上一個模型中預測錯誤的數據點分配更大的權重，在此模型工作以便能夠正確地預測。

下面是 AdaBoost 算法的步驟：

1）最初，對數據集中的所有數據點賦予相同的權重。

2）在數據子集上建立模型。

3）使用該模型，對整個數據集進行預測。

4）通過比較預測值和實際值來計算誤差。

5）在創建下一個模型時，對預測不正確的數據點給出更高的權重。

6）可以使用誤差值確定權重。例如，誤差大的賦予更大的權重。

7）重複這個過程直到誤差函數不改變，或者達到學習器的最大數量。

代碼：

from sklearn.ensemble import AdaBoostClassifier
model = AdaBoostClassifier(random_state=1)
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.81081081081081086

迴歸問題的示例代碼：

from sklearn.ensemble import AdaBoostRegressor
model = AdaBoostRegressor()
model.fit(x_train, y_train)
model.score(x_test,y_test)

參數：

base_estimator:
它有助於指定基本估計器的類型，也就是說，被用作基礎學習器的機器學習算法。
n_estimators:
它定義了基本學習器的數量。默認值為10，但應設置更大的值以獲得更好的性能。
learning_rate:
該參數控制最終組合中學習的貢獻率。learning_rate 和 n_estimators 之間需要權衡。
max_depth:
定義單個估計器的最大深度。調整此參數以獲得最佳性能。
n_jobs:
指定允許使用的處理器的數量。設置為 -1 時允許使用所有的處理器。
random_state:
它指定了隨機劃分的方法。如果給定相同的參數和訓練數據，相同的 random_state 值總會產生相同的結果。

4.4 Gradient Boosting (GBM)

梯度提升（GBM）是另一種集成機器學習算法，它同時適用於迴歸和分類問題。GBM 使用提升技術，結合一些弱學習器形成一個強大的學習器。迴歸樹作為基礎學習器，每個後續的樹是建立在由前一棵樹計算的誤差上的。

我們將使用一個簡單的例子來理解 GBM 算法。使用以下數據來預測一組人的年齡：

1）平均年齡被假定為在數據集中的所有觀察值的預測值。

2）使用該平均預測值和實際年齡值計算誤差。

3）使用上面計算的誤差作為目標變量創建樹模型。我們的目標是找到最佳的分割，以儘量減少誤差。

4）該模型的預測結果與 predicion1 相結合。

5）上面計算的值就是新的預測值。

6）利用該預測值和實際值計算新的誤差。

7）重複步驟2到6直到達到最大迭代次數（或者誤差函數不改變）。

代碼：

from sklearn.ensemble import GradientBoostingClassifier
model= GradientBoostingClassifier(learning_rate=0.01,random_state=1)
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.81621621621621621

迴歸問題的示例代碼：

from sklearn.ensemble import GradientBoostingRegressor
model= GradientBoostingRegressor()
model.fit(x_train, y_train)
model.score(x_test,y_test)

參數：

min_samples_split:
定義在節點中用於分裂的樣本（或觀測）的最小數目，用於控制過擬合。更高的值可以阻止模型對樹選擇的特定樣本具有高度特異性的關係。
min_samples_leaf:

定義終端或葉節點所需的最少樣本。一般來說，對於不平衡的類問題，應該選擇較小的值，因為少數類居多的區域將會比較小。
min_weight_fraction_leaf:
類似於 min_samples_leaf，但定義為佔所有樣本點的分數大小，而不是整數。
max_depth:
樹的最大深度。用於控制過擬合，因為更高的深度可能使得模型學習特定於某些樣本之間的關係。應該使用 CV 調試選擇最佳深度。
max_leaf_nodes:
樹中的終端節點或葉子的最大數目。可以用 max_depth 定義。由於創建二叉樹，N 的深度會產生最多 2 的 N 次方的葉子。如果定義了這一參數，GBM 可以忽略 max_depth。
max_features:
在尋找最佳分割時要考慮的特徵數量，一般是隨機選擇的。作為一個經驗法則，取特徵總數平方根數量的特徵效果不錯，但是我們一般選擇總特徵數的 30-40%。較高的值可能導致過擬合，但一般視情況而定。

4.5 XGBoost

XGBoost（extreme Gradient Boosting）是一種先進的梯度提升算法的實現。XGBoost 已被證明是一種高效的 ML 算法，廣泛應用於機器學習競賽中。XGBoost 具有較高的預測能力，比其他梯度提升技術速度快 10 倍。它還包括各種正則化技術減少過擬合來提高整體性能。因此，它也被稱為“regularized boosting”技術。

讓我們看看 XGBoost 是如何比其他技術更好的：

1）正則化

標準 GBM 沒有像 XGBoost 那樣的正則化。因此 XGBoost 有助於減少過擬合。

2）並行處理

XGBoost 實現並行處理，並且比 GBM 更快。XGBoost 還支持在 Hadoop 上實現。

3）高靈活性

XGBoost 允許用戶自定義優化目標和評價標準，為模型添加一個新的維度。

4）

處理缺失值

XGBoost 有一個內置功能來處理缺失值。

5）樹修剪

XGBoost 進行分割到最大深度後，然後開始由下到上修剪樹，移除沒有正增益的分割。

6）內建交叉驗證

XGBoost 允許用戶在提升過程的每次迭代中運行交叉驗證，因此很容易在一次運行中獲得最佳提升迭代次數。

代碼：

由於 XGBoost 可以處理缺失值，所以不必在預處理中對缺失值進行填充。你可以跳過上述代碼中缺失值的填補步驟。按照其餘的步驟進行：

import xgboost as xgb
model=xgb.XGBClassifier(random_state=1,learning_rate=0.01)
model.fit(x_train, y_train)
model.score(x_test,y_test)
0.82702702702702702

迴歸問題的示例代碼：

import xgboost as xgb
model=xgb.XGBRegressor()
model.fit(x_train, y_train)
model.score(x_test,y_test)

參數：

nthread:
用於並行處理和系統中的允許使用的內核數量。如果希望在所有內核上運行，請不要輸入此值，該算法將自動檢測。
eta:
類似於 GBM 中的學習速率。通過縮小每個步驟的權重使模型更加健壯。
min_child_weight:
定義子節點樣本點所需的最小加權和。用於控制過擬合。更高的值可以阻止模型對樹選擇的特定樣本具有高度特異性的關係。
max_depth:
定義最大深度。更高的深度可能使得模型學習特定於某些樣本之間的關係。
max_leaf_nodes:
樹中的終端節點或葉子的最大數目。可以用 max_depth 定義。由於創建二叉樹，N 的深度會產生最多 2 的 N 次方的葉子。如果定義了這一參數，GBM 可以忽略 max_depth。
gamma:
只有當分裂節點能減小損失函數一定值的時候，才分裂一個節點。參數 gamma 指定了分裂所需的損失函數減少的最小值。使得算法保守，gamma 可以根據損失函數而變化，並且應該調試。
subsample:
與 GBM 的 subsample 相同。表示每個樹隨機採樣的數據點的分數。較低的值使算法更保守，並防止過擬合，但值太小可能導致欠擬合。
colsample_bytree:
它與 GBM 中的 max_features 特徵相似。表示要為每個樹隨機抽樣的列的分數。

4.6 LightGBM

在討論 LightGBM 如何工作之前，讓我們先了解為什麼需要這個算法。我們已經有這麼多 Boosting 算法了（如上面介紹的），當數據集非常大時，Light GBM 則優於其它所有的算法。與其他算法相比，Light GBM 在巨大的數據集上運行所消耗的時間更少。

LightGBM 是一個梯度增強框架，它使用基於樹的算法，並遵循 leaf-wise 方式，而其他算法以 level-wise 方式工作。下面的圖片將幫助你更好地理解差異。

level-wise 在數據量少的時候可能會導致過擬合，但是可以通過使用參數 max_depth 可以避免這種情況發生。你可以閱讀下面的文章瞭解更多 Light GBM 及其與 XGB 的比較：

https://www.analyticsvidhya.com/blog/2017/06/which-algorithm-takes-the-crown-light-gbm-vs-xgboost/

代碼：

import lightgbm as lgb 

train_data=lgb.Dataset(x_train,label=y_train)
#define parameters
params = {'learning_rate':0.001}
model= lgb.train(params, train_data, 100) 
y_pred=model.predict(x_test)
for i in range(0,185):
 if y_pred[i]>=0.5: 
 y_pred[i]=1
 else: 
 y_pred[i]=0
0.81621621621621621

迴歸問題的示例代碼：

import lightgbm as lgb
train_data=lgb.Dataset(x_train,label=y_train)
params = {'learning_rate':0.001}
model= lgb.train(params, train_data, 100)
from sklearn.metrics import mean_squared_error
rmse=mean_squared_error(y_pred,y_test)**0.5

參數：

num_iterations:
它定義要執行的 boosting 迭代數。
num_leaves:
此參數用於設置樹中要形成的葉子的數量。對於 Light GBM，由於分裂發生在 level-wise 方向而不是 depth-wise 方向，所以num_leaft必須小於 2 的 max_depth 次方，否則可能導致過擬合。

min_data_in_leaf:
該值過小可能導致過度擬合。它也是處理過擬合的最重要的參數之一。
max_depth:
定義樹可以生長的最大深度或高度。這個參數過大會導致過擬合。
bagging_fraction:
它用於指定每次迭代要使用的數據比例。這個參數通常用於加速訓練。
max_bin:
定義特徵值將被插入的容器的最大數目。較小的 max_bin 值可以節省大量時間，因為它將特徵值存儲到離散的容器中，計算代價小。

4.7 CatBoost

處理分類變量是一個乏味的過程，尤其有大量這樣的變量。當分類變量的標籤太多（例如高度基數）時，對它們進行獨熱編碼會指數地增加維度，這讓數據處理非常困難。

CatBoost 可以自動處理分類變量，並且不需要像其他機器學習算法那樣進行額外的數據預處理。下面是一篇詳細介紹 CatBoost 的文章：

https://www.analyticsvidhya.com/blog/2017/08/catboost-automated-categorical-data/

代碼：

CatBoost 算法能有效地處理分類變量。因此，不需要對分類變量進行獨熱編碼。只需加載文件，填入缺失值，就可以了。

from catboost import CatBoostClassifier
model=CatBoostClassifier()
categorical_features_indices = np.where(df.dtypes != np.float)[0]
model.fit(x_train,y_train,cat_features=([ 0, 1, 2, 3, 4, 10]),eval_set=(x_test, y_test))
model.score(x_test,y_test)
0.80540540540540539

迴歸問題的示例代碼：

from catboost import CatBoostRegressor
model=CatBoostRegressor()
categorical_features_indices = np.where(df.dtypes != np.float)[0]
model.fit(x_train,y_train,cat_features=([ 0, 1, 2, 3, 4, 10]),eval_set=(x_test, y_test))
model.score(x_test,y_test)

參數：

loss_function:
定義用於訓練的指標。
iterations:
可以生成的樹的最大數量。最終樹的數量可以小於或等於這個數。
learning_rate:
定義學習率，用於梯度下降優化中。
border_count:
它指定了數值特徵的分裂數，類似於參數 max_bin。
depth:
定義樹的深度。
random_seed:
這個參數類似於我們先前看到的參數 random_state，它是一個整數，定義用於訓練的隨機種子。

結語

集合建模可以指數地提高模型的性能！在本文中，我們介紹了各種集成學習技術，並瞭解了這些技術在機器學習算法中的應用。此外，我們實現了我們的貸款預測數據集的算法。

如果覺得文章還可以的話，煩請關注、點贊、轉發，謝謝！

分享到:

閱讀更多 機器學習與數據挖掘 的文章

關鍵字: 隨機森林學習自白書

本田CBR300R對比鈴木GSX250R，何去何從，聽我一言

這應該是我從12年第六輛摩托車了，最近因為銀刃250日常騎行動力表現實在不盡如人意，而我因為沒有四輪駕照，需要每天騎行上下班，所以就產生了再換一輛動力表現不錯的小車，於是就開始了琢磨換車。

拿下二手2016款川崎ER6N，作為Z650的前身，此車性價比真高

2016款川崎ER6N是川崎Z650的前身，本人非常喜歡川崎的造型，最其品質也是很放心。無奈的是錢包不夠鼓，只能選購了一輛車友換代的車，川崎ER6N，這車在上任車主手裡保養的還是很不錯的。

手把手教你給自己的摩托換機油，愛車怎麼能不會保養它

平時的更是愛護有加，說到保養，摩托車就比較簡單了，而且自己來的話，也放心，更能體會其中的樂趣。此次更換機油，包括更換機油濾芯，有少數車友從來只換機油不換濾芯，甚至不知道要換濾芯，這是極其傷車的行為。

十五萬的大綿羊，YAMAHA的T-MAX530入手，物有所值

喜歡上T媽媽還是07年的事情，當時坐騎是yamaha majesty125，珠峰歐洲霸王，第一次在雅馬哈巡展看到T媽媽後就欲罷不能了，超級喜歡，可是十幾萬的價格在當時無疑是天價，根本沒人會買。

豪爵街車DR300終版亮相：配置、動力全曝光，看看值不值34580元？

大概從兩年前開始，豪爵旗下就曝光了一款中央級別的運動街車DR300，但是隨著時間的推移，這款車型一直都沒有亮相，讓很多車友都感到遺憾。

售價16.98-24.98萬 2019款福特翼虎上市

日前，長安福特正式宣佈2019款福特翼虎上市。新車相比老款增加了全新的互聯網汽車智能系統，售價區間為16.98-24.98萬元。

運動性能一目瞭然全新起亞K5 GT諜照曝光搭載2.5T發動機

【佰咖汽車·進口新車資訊】近日，有海外媒體曝光了一組全新起亞K5GT的路試諜照，外觀方面與全新K5相比差距不大，內飾融入更多運動化元素，動力上採用更為強勁的2.5T發動機，新車內外運動性能一目瞭然。

寶馬3系也拿它沒轍！奔馳狂降到25.18萬

提到豪華品牌的入門級車型，相信很多人都會首先想到寶馬3系、奧迪A4L以及奔馳C級這3款車吧，沒錯，師哥腦海中首先想到的也是這些車型。

辣評：史上“最冷”9月自主SUV誰能挺過寒冬？

今年一直萎靡的SUV市場再度跳水，同比兩位數下滑。據乘聯會數據，9月SUV批發銷量87.7萬輛，同比下滑10.2%。

比亞迪宋MAX長測外觀時尚

1外觀介紹去年比亞迪宋MAX剛上市的時候，我覺得這真是很符合我這種二胎家庭需求的車型。如果它能早一年上市，說不定我會成為第一批車主。

一降再降的日系車，與豐田C-HR同級，百公里油耗5.9L，已不足8萬

通常日系車的價格比較堅挺的，比如豐田凱美瑞在中型轎車領域就很強勢，所以價格一直沒有多少優惠，而在小型SUV中，豐田C-HR自從上市以來的優惠幅度就很有限，基本上只有幾千元，所以雖然它很受歡迎，但是預算有限的人，就只能關注別的車型了。

傳感器和5G通信技術開發智能化重型卡車

目前，三一集團正與中國移動合作，基於5G網絡在三一重卡置入5G模塊、傳感器、激光雷達，實現重卡的智能駕駛，讓重卡車隊實現軟連接、無人駕駛編隊，這也意味著，以後一個重卡車隊，只要一個司機就可以駕駛好幾輛重卡上路。

@溫江人走這兒也可以上成溫邛高速咯！

溫江便捷高效暢通之城建設再添喜訊新增一條進入成名高速匝道圖@黃豔@溫江交通運輸局消息為提升通行效率緩解江寧南路、天鄉路調頭車輛擁堵情況將在魚鳧路開設一條新的高速入口匝道就是紅箭頭指的地方圖@黃豔成名高速溫江北入口優化改造工程項目簡易單向匝道，限高2.5米限速20KM/h限制貨車、

對話比亞迪葉庭文關於比亞迪漢你還不知道的事

在聊比亞迪今年推出的重磅車型——比亞迪漢之前，葉總對於疫情之下的2月份能取得這一成績是非常意外，甚至曾一度以為“是數據出了錯”。

從0到1再到∞ 得數據者得自動駕駛天下

特斯拉曾在 2018 年 11 月公佈過一個數據：全球所有的特斯拉車主在自動駕駛 Autopilot 啟動下駕駛的總里程數已經突破 10 億英里。

廣新Aion V渲染圖曝光逸動E-Life諜照長安發佈 2019年業績

001/ NEDC 續航里程 600 km 廣汽新能源 Aion V 渲染圖曝光據國外媒體報道，特斯拉在去年 11 月份推出了電動皮卡 Cybertruck ，預計 2021 年年底開始生產。

蠢事做絕？于漢超當街塗改車牌原因揭曉！恆大俱樂部人士首度發聲

在於漢超因為當街塗改車牌，而被恆大俱樂部開除並且解約之後，不少網友至今仍不解，已經33歲作為成年人的他，為何會知在街上公然知法犯法？眾所周知，于漢超是大連人，即便在恆大已經效力6年，他也一直開車那輛大連牌照的奔馳大G。

80年代的A組寶馬635 FIA，寶馬迷看過來！

在20世紀80年代的芬蘭房車錦標賽上，這款1983年的寶馬635FIA在A組的領獎臺上佔據了統治地位。

1967年推出的保時捷911 Targa，我賭你肯定沒看過！

從1963年誕生以來，共經歷了七代車型，因其獨特的風格與極佳的耐用性享譽世界。保時捷911系列是整個保時捷乃至於整個德國整個世界最傳奇的車型之一，同時也是中後置引擎跑車的代表作之保時捷911是最具標誌性的交通工具之一。

留著博世血統德國藍寶電器，堅持創新和品質的核心精神美譽全球！

有著近百年曆史的“世紀品牌”德國藍寶，以創新和品質為基礎，它的良好聲譽是經得住時間的考驗的。Blaupunkt從1933年成為德國Bosch博世集團旗下全資子公司，自2009年開始成為獨立運維的德國品牌。

奔馳沒違停，沒擋路，卻被鎖上1百多把防盜鎖！網友：太仁慈了

奔馳沒違停，沒擋路，卻被鎖上1百多把防盜鎖！網友：太仁慈了！生活中，大家可能都見過停放在街邊的電動車、摩托車上面鎖著一把防盜鎖，至於原因，顧名思義就是為了防盜。而汽車由於自身防盜系統完善，沒有鎖防盜鎖的必要，所以汽車上鎖防盜鎖的情況基本沒有。

“不用剎車，直接撞！”4S店帶客戶體驗助剎車，結果真撞上了

4s店的銷售帶客戶試乘車，沒想到用前車人的性命當障礙物，說“不用剎，直接撞”，在這之後就發生了嚴重的交通事故。

經典培訓PPT｜通用汽車是如何穩步前進－持續改進！

沒有一個企業是沒有問題的，關鍵是如何看待問題和解決問題。很多企業，將問題解決之後就停止了，沒有進行問題的原因分析，制定短期或長期的對策，徹底消除這些問題的根本原因。

特斯拉進駐天貓不賣車，1200元的車鑰匙賣得最好

1200元的車鑰匙賣得最多南都記者登錄天貓看到，暫時擁有2萬粉絲的特斯拉天貓旗艦店，並不會直接售賣車輛，目前售賣的主要還是汽車配件以及周邊，例如車鑰匙、充電樁、腳墊、車載充電套件等。

國產降價冠軍！打五折都沒人買？奔馳旗艦SUV換個標就沒人要了？

北京品牌是個奇葩的存在，BJ40-Jeep牧馬人、BJ80-奔馳GClass，說是逆向開發也好，說是抄襲模仿也罷，不可否認的是它兩都蹭上了原型車的熱點，加上產品本身的產品力尚可並非眾泰那類樣子貨，所以BJ40還能有兩千臺左右的月銷量。

第50萬輛整車下線成都造沃爾沃成功出口54個國家和地區

昨日，沃爾沃汽車成都工廠第50萬輛整車下線，據悉這是一輛沃爾沃XC60，已被歐洲車主預訂，將搭乘中歐班列運抵歐洲並交付到車主手中。

在咸陽汽車胎壓檢測儀器報警器真的有用？輪胎胎壓表開箱安裝視頻

如今我們都知道隨著汽車的普及，在我們駕駛汽車中，安全問題越來越重要。下面讓瘋子帶你來看看：1.胎壓胎溫實時精準檢測2.高壓、底壓、漏氣、高溫報警3。

3月銷量只有5千出頭，日產奇駿開始承壓了！

再來看看日產和馬自達，這“哥倆”就有些相形見絀了，日產本來還有一個奇駿可以挑大樑，不過進入2020年後銷量情況迅速下滑，剛剛過去的3月份只有5千出頭的成績，可要知道日產奇駿去年銷量可是能跟哈弗H6相比較的，擠進前五不在話下，現在開始承壓了，而馬自達CX-4還是一如既往的“穩定”。

要想人記得住，就得有特點，汽車也不例外！

這年頭想要給人留下印象，不管是好的還是壞的，能讓人記住你那你可能就算是成功了。現在的車企想辦法在車子外觀上換著花樣的出新招，就是為了得到消費者的注意，也有些車企開始採用家族的前臉，不管是什麼型號，一看車頭就知道是什麼車，全系一樣的臉，你說霸道不霸道。

看臉的世界，高顏值的SUV代表

現在人們對顏值的要求是越來越高，職場上，學歷相當、工作能力差不多的人在一起，長得好看的脫穎而出的機會會大些。

上市不足半年，降價50萬，這樣一款國產豪華你心動嗎？

同樣是“腰斬”的價格，但這樣的車就不一定就會熱銷，原因很簡單，就是這種50萬級以上的豪華車，市場註定是小眾的，並且今天要說的這款車還是一款國產車，即便它降價50萬，但消費者依舊會左右權衡一下，這款車到底值不值得為之付出50萬！

疫情過後，你還準備買車嗎？

前言因為新冠疫情，這次長達兩個月餘的春節假期遠遠超出了很多人的預期，還是讓人猝不及防。貪圖安逸是人的天性，沒錢是客觀現實，因為這年頭，就算你想成為廢物，也要有足夠的經濟能力支撐你的頹廢，否則連墮落都會變成一種奢侈。

國產車三巨頭3月份銷量出爐，長安汽車一馬當先，差距已經拉開！

進入2020年之後，汽車行業的兩極分化進一步凸顯，頭部車企的競爭也進入白熱化階段，隨著疫情過去，汽車行業漸漸轉好，近日國產車三巨頭3月份的銷量也已經出爐，那麼它們在3月份的銷量表現又如何呢？

25.99萬元起售，全新開拓者上市！是迎難而上還是底氣十足？

近段時間凡是說起7座中型SUV，似乎都離不開二胎、離不開二胎政策。但是，在汽車市場正迎來的年輕化趨勢下，中型SUV卻成為了車市近兩年市場份額增長最快的細分市場，這點，其實足以讓我們打破7座中型SUV乃至7座SUV的原有市場定位和固有印象了。

2020品牌影響力得分，前十被合資進口占據，日產竟排在了最後？

J.D.Power發佈了2020中國新車購買意向研究結果，這項研究裡面還包括了品牌影響力得分的排名。

選第一輛車魅力十足的君越

前前後後選了一年多的車型，於今終於買了，糾結了一年多的心病也算是好了！最早想買君威，後來陸續看了雅閣、天籟、凱美瑞、帕薩特、邁騰。

平安"金融+生態"模式下的優等生平安好車主信用卡正式上線

1月8日，中國平安保險（集團）股份有限公司（下稱"平安集團"）旗下的平安銀行與平安產險聯合，在行業內率先推出"集大成"的車主服務方案——平安好車主信用卡，該卡不僅自帶"平安行"保障，還覆蓋了加油、洗車、代駕、接送機等車主服務，為車主提供一站式、全生命週期的用車服務；此外，平安信用

網約車的春天來了：“分時經營”上新規，兼職跑只要人證！

其實這種類似模式，棗莊不是先例，早在2019年6月份，大慶市出臺政策私家車不需要辦理網約車運輸證，不需改變車輛性質，只需要備案登記，就能從事網約車運營。差異化管理，這對於那些兼職網約車司機來說，無疑是一大利好，如果新規通過，春天真正來臨。

比亞迪新型電池能否帶動新市場？

強強聯手首發搭載中大型高端轎車比亞迪漢據王傳福先生現場透露，刀片電池只在比亞迪漢純電車型搭載應用，其他車型暫無規劃。

大眾品牌在售的唯一敞篷車，大眾T-ROC敞篷版實拍圖發佈

提到大眾品牌的敞篷車，大家首先想到大眾EOS或是甲殼蟲敞篷版，但這兩款車型其實都早已停產，如今大眾品牌唯一在售的敞篷車其實是一輛SUV車型，它就是剛剛在歐洲推出的踢大眾T-ROC敞篷版。

江西國際汽車會展中心2020首展開啟，中部汽車房車文化節重磅發佈

江西省委省政府在4月18日正式出臺了《關於促進汽車消費的若干措施》，積極鼓勵和支持當地汽車行業協會、經銷商等結合實際開展各類汽車展覽展銷和促進活動。

為什麼老司機都愛這樣踩剎車？修車師傅：不光能省油，還很安全

為什麼老司機都愛這樣踩剎車?修車師傅:不光能省油，還很安全。那最後一個就是下長坡的時候踩剎車了，這是一個誤區，很多新手在下長坡路段的時候都會有習慣一直踩著剎車，並且控制著車速，但是這樣會引起剎車系統摩擦時間過長，可能會造成其他事故。

吉利和奇瑞誰的質量更勝一籌？修車工將車門拆開後，差距一目瞭然

現在的國產車那是發展是突飛猛進了，就是因為發展的很快也是讓給合資車帶來很大的麻煩和壓力，即使很多的合資車在選擇降價的應對，但是也是白費力氣並沒有給國產車增加壓力還是在很快的發展，在質量和口碑上面也是不斷的上升的國產車，不管是在市場上還是合資車帶來的威脅都是無用的。

女車主開百萬豪車，上車的方式也是與眾不同的

我們開車的時候總會出現點小問題，就像一些女司機開車是讓人十分的頭大，開車都開的讓人頭大，停車的時候真的是絕了，雖然是停好了，但是人卻難出來了。

中國低端車，來到朝鮮後搖身一變成為豪車，滿大街的“豪橫”味道

中國低端車，來到朝鮮後搖身一變成為豪車，滿大街的“豪橫”味道現在是不得不讚美我國的經濟發展的很快，在各行各業也是有著很多的進步，就像我國的車都已經出口在海外了，也是在國外而已是一個進口的車，和別的進口車相比，進口車是有著很高的稅費和運輸的費用，才會有很多的車的車本自然的增加，那就

增長75.95%！這份溫馨的出行提醒你請查收

知己知彼，才能“機智出行”so，希望小編們精心整理的這一組數據指南能夠幫助小夥伴們提前規劃行程、規避擁堵據統計全省高速公路免收通行費加之復工復產全面推進我省高速公路流量較去年同期有明顯增長尤其是貨車流量增幅較大從3月13日到4月12日全省高速公路總流量為3790.36萬輛與去年同

陝西高速公路4月15日起恢復收費？官方迴應

最近，一張抬頭為陝西省交通建設集團公司、標題為《關於做好運營單位收費系統調試等有關事項的通知》的圖片在網絡流傳。不少車主好奇，這是否意味著從今天起陝西省高速公路要恢復收費了？

一電觀察｜長續航車型不斷上新，但續航焦慮並未解決

理想汽車的創始人李想在前段時間“雪球路演”的活動中說道，特斯拉已經開始發揮其“鯰魚”效應，促進國內市場發展，倒逼國內廠商做好產品，服務好C 端用戶。

特斯拉，請別辜負喜歡你的“韭菜”丨壹觀察

“我來了，你準備好了嗎？”4月10日，國產特斯拉Model 3的長續航版與高性能版開售。一邊，車迷用行動詮釋著“真香”定律——Tesmanian網站顯示，一分鐘就有10個新車訂單，在24小時裡訂單量就突破了2萬輛。

這車只要持續正常發揮，中型車霸主地位將無可動搖

這車只要持續正常發揮，中型車霸主地位將無可動搖當我們說到B級車的時候相信許多的網友們最先想到的應該就是帕薩特以及邁騰了。

一份完備的集成學習手冊！（附Python代碼）

引言：

目錄：

1. 集成學習簡介

2. 基本的集成技術

3. 高級集成技術

結語

相關文章:

一份完備的集成學習手冊！（附Python代碼）

引言：

目錄：

1. 集成學習簡介

2. 基本的集成技術

3. 高級集成技術

結語

相關文章:

本田CBR300R對比鈴木GSX250R，何去何從，聽我一言

拿下二手2016款川崎ER6N，作為Z650的前身，此車性價比真高

手把手教你給自己的摩托換機油，愛車怎麼能不會保養它

十五萬的大綿羊，YAMAHA的T-MAX530入手，物有所值

豪爵街車DR300終版亮相：配置、動力全曝光，看看值不值34580元？

售價16.98-24.98萬 2019款福特翼虎上市

運動性能一目瞭然 全新起亞K5 GT諜照曝光 搭載2.5T發動機

寶馬3系也拿它沒轍！奔馳狂降到25.18萬

辣評：史上“最冷”9月 自主SUV誰能挺過寒冬？

比亞迪宋MAX長測 外觀時尚

一降再降的日系車，與豐田C-HR同級，百公里油耗5.9L，已不足8萬

傳感器和5G通信技術開發智能化重型卡車

@溫江人 走這兒也可以上成溫邛高速咯！

對話比亞迪葉庭文 關於比亞迪漢你還不知道的事

從0到1再到∞ 得數據者 得自動駕駛天下

廣新Aion V渲染圖曝光 逸動E-Life諜照 長安發佈 2019年業績

蠢事做絕？于漢超當街塗改車牌原因揭曉！恆大俱樂部人士首度發聲

80年代的A組寶馬635 FIA，寶馬迷看過來！

1967年推出的保時捷911 Targa，我賭你肯定沒看過！

留著博世血統德國藍寶電器，堅持創新和品質的核心精神美譽全球！

奔馳沒違停，沒擋路，卻被鎖上1百多把防盜鎖！網友：太仁慈了

“不用剎車，直接撞！”4S店帶客戶體驗助剎車，結果真撞上了

經典培訓PPT｜通用汽車是如何穩步前進－持續改進！

特斯拉進駐天貓不賣車，1200元的車鑰匙賣得最好

國產降價冠軍！打五折都沒人買？奔馳旗艦SUV換個標就沒人要了？

第50萬輛整車下線 成都造沃爾沃成功出口54個國家和地區

在咸陽汽車胎壓檢測儀器報警器真的有用？輪胎胎壓表開箱安裝視頻

3月銷量只有5千出頭，日產奇駿開始承壓了！

要想人記得住，就得有特點，汽車也不例外！

看臉的世界，高顏值的SUV代表

上市不足半年，降價50萬，這樣一款國產豪華你心動嗎？

疫情過後，你還準備買車嗎？

國產車三巨頭3月份銷量出爐，長安汽車一馬當先，差距已經拉開！

25.99萬元起售，全新開拓者上市！是迎難而上還是底氣十足？

2020品牌影響力得分，前十被合資進口占據，日產竟排在了最後？

選第一輛車 魅力十足的君越

平安"金融+生態"模式下的優等生 平安好車主信用卡正式上線

網約車的春天來了：“分時經營”上新規，兼職跑只要人證！

比亞迪新型電池能否帶動新市場？

大眾品牌在售的唯一敞篷車，大眾T-ROC敞篷版實拍圖發佈

江西國際汽車會展中心2020首展開啟，中部汽車房車文化節重磅發佈

為什麼老司機都愛這樣踩剎車？修車師傅：不光能省油，還很安全

吉利和奇瑞誰的質量更勝一籌？修車工將車門拆開後，差距一目瞭然

女車主開百萬豪車，上車的方式也是與眾不同的

中國低端車，來到朝鮮後搖身一變成為豪車，滿大街的“豪橫”味道

增長75.95%！這份溫馨的出行提醒你請查收

陝西高速公路4月15日起恢復收費？官方迴應

一電觀察｜長續航車型不斷上新，但續航焦慮並未解決

特斯拉，請別辜負喜歡你的“韭菜”丨壹觀察

這車只要持續正常發揮，中型車霸主地位將無可動搖

我們現在所看到的古代史都是真實的嗎，這是如何流傳下來的呢？

魯厲公是不是壞人？

負債40萬，兩個孩子的媽媽，現在面臨失業，焦慮不安，有什麼辦法去過今後的日子？

大家如何看待有些地區初中高中出現分班制度（也就是分好班與差班）？

美國因疫情政府給百姓發了2萬億美金補貼，這些錢最終去了哪裡？

唐詩中哪篇詩讓你感覺身臨其境？

美國欠別的國家這麼多錢，為什麼還可以撥款搞這搞那的？

大一下想退學復讀，家庭條件一般般，如何說服父母？

熱播劇《獵狐》中的楊建秋，生活中有沒有這麼傻的人，對這個角色大家怎麼看？

如果放棄現有的工作，重新開始一段完全不熟悉的工作，你會害怕嗎？

一代名相李斯為何會敗於閹宦趙高？

做事情總喜歡親力親為的人是什麼心理狀態？

身體越練越靈活，腦子能越練越靈嗎？

一個月用70

怎麼才能提高一個人的自制力呢，或者說怎麼才能控制住自己的思想？

《唐伯虎點秋香》1

學校停課三個月了，應該減免學費嗎？

RNG狼行被噴出2個熱搜，管澤元公然吐槽，Letme直言：狼行盡力了，如何點評？

EDG擊敗RNG後，廠長與MLXG生氣了，當場怒懟澱粉“有的人就該罵”，粉絲做了什麼？

RNG慘敗EDG後出局，拳頭隨後官宣LPL增加名額，UZI粉絲看到希望，如何點評？

RNG在S10最後機會！夏季賽請Uzi迴歸奪取LPL第四張S10門票，你怎麼看？

JDG謝禮送到，滔搏喜迎紅酒、牛排，粉絲“咱們也是上流戰隊了”，季後賽你看好誰？

運動性能一目瞭然全新起亞K5 GT諜照曝光搭載2.5T發動機

辣評：史上“最冷”9月自主SUV誰能挺過寒冬？

比亞迪宋MAX長測外觀時尚

@溫江人走這兒也可以上成溫邛高速咯！

對話比亞迪葉庭文關於比亞迪漢你還不知道的事

從0到1再到∞ 得數據者得自動駕駛天下

廣新Aion V渲染圖曝光逸動E-Life諜照長安發佈 2019年業績

第50萬輛整車下線成都造沃爾沃成功出口54個國家和地區

選第一輛車魅力十足的君越

平安"金融+生態"模式下的優等生平安好車主信用卡正式上線