基於 Prophet 的時間序列預測

2019-04-22 17:39:56 機器不學習

前言

時間序列預測一直是預測問題中的難點，人們很難找到一個適用場景豐富的通用模型，這是因為現實中每個預測問題的背景知識，例如數據的產生過程，往往是不同的，即使是同一類問題，影響這些預測值的因素與程度也往往不同，再加上預測問題往往需要大量專業的統計知識，這又給分析人員帶來了難度，這些都使得時間序列預測問題變得尤其複雜。

傳統的時間序列預測方法，例如ARIMA（autoregressive integrated moving average）模型，在R與Python中都有實現。雖然這些傳統方法已經用在很多場景中了，但它們通常有如下缺陷：

a.適用的時序數據過於侷限

例如最通用的ARIMA模型，其要求時序數據是穩定的，或者通過差分化後是穩定的，且在差分運算時提取的是固定週期的信息。這往往很難符合現實數據的情況。

b.缺失值需要填補

對於數據中存在缺失值的情況，傳統的方法都需要先進行缺失值填補，這很大程度上損害了數據的可靠性。

c.模型缺乏靈活性

傳統模型僅在於構建數據中的臨時依賴關係，這種模型過於不夠靈活，很難讓使用者引入問題的背景知識，或者一些有用的假設。

d.指導作用較弱

當前，雖然R與Python中實現了這些方法並提供了可視化效果，降低了模型的使用門檻。但由於模型本身的原因，這些展現的結果也很難讓使用者更清楚地分析影響預測準確率的潛在原因。

總之，傳統的時間序列預測在模型的準確率以及與使用者之間的互動上很難達到理想的融合。

近期，facebook發佈了prophet（“先知”）項目，它以更簡單、靈活的預測方式以及能夠獲得與經驗豐富的分析師相媲美的預測結果引起了人們的廣泛關注。下面我們介紹一下Prophet。

Prophet介紹

2.1整體框架

上圖是prophet的整體框架，整個過程分為四部分：Modeling、Forecast Evaluation、Surface Problems以及Visually Inspect Forecasts。從整體上看，這是一個循環結構，而這個結構又可以根據虛線分為分析師操縱部分與自動化部分，因此，整個過程就是分析師與自動化過程相結合的循環體系，也是一種將問題背景知識與統計分析融合起來的過程，這種結合大大的增加了模型的適用範圍，提高了模型的準確性。按照上述的四個部分，prophet的預測過程為：

a.Modeling：建立時間序列模型。分析師根據預測問題的背景選擇一個合適的模型。

b.Forecast Evaluation：模型評估。根據模型對歷史數據進行仿真，在模型的參數不確定的情況下，我們可以進行多種嘗試，並根據對應的仿真效果評估哪種模型更適合。

c.Surface Problems：呈現問題。如果嘗試了多種參數後，模型的整體表現依然不理想，這個時候可以將誤差較大的潛在原因呈現給分析師。

d.Visually Inspect Forecasts：以可視化的方式反饋整個預測結果。當問題反饋給分析師後，分析師考慮是否進一步調整和構建模型。

2.2適用場景

前文提到，不同時間序列預測問題的解決方案也各有不用。Prophet適用於有如下特徵的業務問題：

a.有至少幾個月（最好是一年）的每小時、每天或每週觀察的歷史數據；

b.有多種人類規模級別的較強的季節性趨勢：每週的一些天和每年的一些時間；

c.有事先知道的以不定期的間隔發生的重要節假日（比如國慶節）；

d.缺失的歷史數據或較大的異常數據的數量在合理範圍內；

e.有歷史趨勢的變化（比如因為產品發佈）；

f.對於數據中蘊含的非線性增長的趨勢都有一個自然極限或飽和狀態。

2.3 模型原理

模型的整體構建如下：

模型（1）整體由三部分組成：growth(增長趨勢)、seasonality(季節趨勢)以及holidays(節假日對預測值的影響)。其中g(t)表示增長函數，用來擬合時間序列中預測值的非週期性變化；s(t)用來表示週期性變化，比如說每週，每年中的季節等；h(t)表示時間序列中那些潛在的具有非固定週期的節假日對預測值造成的影響。最後

為噪聲項，表示模型未預測到的波動，這裡假設

是高斯分佈的。

可以看出這是一種類似generalized additive model(GAM)的模型，不同於以往的時間序列預測模型（例如ARIMA），上述的模型將預測問題視作曲線擬合問題。這樣做具有很多實踐價值：

a.靈活度高，許多具有不同週期以及不同假設的季節性趨勢能很容易的被引入；

b.時間序列中無需有一個固定的週期，也不需要在擬合前對缺失值進行填補，這是傳統的（例如ARIMA）模型所辦不到的；

c.擬合非常快，允許分析師交互式的探索模型的效果；

d.模型中參數的解釋性很強，可以讓分析師根據啟發來增強某部分假設。

下面分別介紹模型中各部分的構建。

2.3.1 增長趨勢

增長趨勢是整個模型的核心組件，它表示認為整個時間序列是如何增長的，以及預期未來時間裡是如何增長的。這部分為分析師提供了兩種模型：Non-linear growth（非線性增長）和Linear growth（線性增長）。

1.Non-linear growth

非線性增長的公式採用了邏輯迴歸的模型：

這裡，C是承載量，它限定了所能增長的最大值，k表示增長率，b為偏移量。

當然，實際的增長模型遠沒有這麼簡單，Prophet主要考慮了兩個現實問題：

（1）C值並不一定是常數；（2）增長率也不一定是一沉不變的。對於（1），將C構建成隨時間變化的函數：C(t) = K 或者 C(t) = Mt + K。下面詳細論述。

（2）的解決：首先模型定義了增長率k發生變化時對應的點，我們將其稱作changepoints，用

表示，這些點對應的斜率調整值用

表示，所有的斜率調整值形成一個向量

。此時，每個changepoint點對應的增長率就變為

。如果有如下定義：

則t時刻的增長率就可以表示為：

當增長率k調整後，每個changepoint點對應的偏移量b也應該相應調整以連接每個分段的最後一個時間點，表達式如下：

綜上，結合（1）和（2），最終的分段式邏輯迴歸增長模型為：

2.Linear growth

如果認為時間序列的整體增長趨勢是線性的，那麼就可以採用線性模型：

這裡的參數定義與非線性增長一樣，唯一不同的是每個changepoint對應的

結合上述兩種增長模型，我們可以看到，對於增長趨勢的預測，最重要的就是對這些changepoint的指定。使用時，既可以手動指定這些changepoint，也可以根據公式（3）和（4）自動識別。此時，認為

其中

控制著模型整體的平滑程度。

2.3.2 季節性趨勢

由於時間序列中有可能包含多種週期類型的季節性趨勢，因此，傅里葉級數可以用來近似表達這個週期屬性，公式如下：

其中，P表示某個固定的週期（例如用”天”做單位統計的數據中，年數據的P = 365.25，週數據的P = 7）。2N表示我們希望在模型中使用的這種週期的個數，較大的N值可以擬合出更復雜的季節性函數，然而也會帶來更多的過擬合問題。按照經驗值，年週期的N取10，週週期的N取3。

當將s(t)中的所有季節性時間序列模型組合成一個向量X(t)，那麼最終的季節性模型為：

其中，

，以此提高季節性模型的平滑性。

2.3.3 節假日模型

很多實際經驗告訴我們，節假日或者是一些大事件都會對時間序列造成很大影響，而且這些時間點往往不存在週期性。對這些點的分析是極其必要的，甚至有時候它的重要度遠遠超過了平常點。

鑑於每個節假日（或者某個已知的大事件）的日期與影響程度存在差異，節假日模型將不同節假日在不同時間點下的影響視作獨立的模型。同時為每個模型設置了時間窗口，這主要是考慮到節假日的影響有窗口期（例如中秋節的前幾天與後幾天），模型將同一個窗口期中的影響設置為相同的值。例如，i表示節假日

表示窗口期中包含的時間t，則節假日模型h(t)可表示為：

其中，

表示窗口期中的節假日對預測值的影響。同季節性趨勢的模型，這裡可以定義：

那麼

其中

Prophet的使用

3.1參數使用

下面是這個模塊的參數解釋，使用者可充分利用這些參數調整模型：

a.增長趨勢的模型參數

growth：增長趨勢模型。整個預測模型的核心組件，分為兩種：”linear”與”logistic”，分別代表線性與非線性的增長，默認值：”linear”。

cap：承載量。非線性增長趨勢中限定的最大值，預測值將在該點達到飽和。當選擇非線性增長時，該項值必須給出。

changepoints(growth模型中的)：改變點。使用者可以自主填寫已知時刻的標示著增長率發生改變的”改變點”，如果不填則系統自動識別。默認值：“None”。

n_changepoints：用戶指定潛在的”changepoint”的個數，默認值：25。

changepoint_prior_scale(growth模型中的)：增長趨勢模型的靈活度。調節”changepoint”選擇的靈活度，值越大，選擇的”changepoint”越多，從而使模型對歷史數據的擬合程度變強，然而也增加了過擬合的風險。默認值：0.05。

b.季節趨勢的模型參數

seasonality_prior_scale（seasonality模型中的）：調節季節性組件的強度。值越大，模型將適應更強的季節性波動，值越小，越抑制季節性波動，默認值：10.0。

c.節假日的模型參數

holidays_prior_scale（holidays模型中的）：調節節假日模型組件的強度。值越大，該節假日對模型的影響越大，值越小，節假日的影響越小，默認值：10.0。

holidays：節假日的定義，設置節假日的json格式的配置文件，例如：

其中”holiday”表示某類節假日的名稱，”ds”指定具體的節假日期，”lower_window”表示該節假日包括指定日期之前的多少天，”upper_window”表示該節假日包括指定日期之後的多少天，上述四個參數均需要配置。

d.預測中需要的其他參數

freq：數據中時間的統計單位（頻率），默認為”D”，按天統計，具體可參考這裡。

periods：需要預測的未來時間的個數。例如按天統計的數據，想要預測未來一年時間內的情況，則需填寫365。

mcmc_samples：mcmc採樣，用於獲得預測未來的不確定性。若大於0，將做mcmc樣本的全貝葉斯推理，如果為0，將做最大後驗估計，默認值：0。

interval_width：衡量未來時間內趨勢改變的程度。表示預測未來時使用的趨勢間隔出現的頻率和幅度與歷史數據的相似度，值越大越相似，默認值：0.80。當mcmc_samples = 0時，該參數僅用於增長趨勢模型的改變程度，當mcmc_samples > 0時，該參數也包括了季節性趨勢改變的程度。

uncertainty_samples：用於估計未來時間的增長趨勢間隔的仿真繪製數，默認值：1000。

3.2 結果讀取與分析

完成以上的配置後，接下來就可以直接運行模型並獲得結果了。

3.2.1 可視化結果

整體預測情況是我們衡量模型整體預測效果的一個最直接的方式，它是我們評估當前模型的預測水平的重要來源。同時可視化的展示可以幫助我們有效分析預測結果中各個時間階段的預測效果。

上圖是一個整體的預測結果圖，它包含了從歷史數據的時間起點到期望預測的未來時間終點的結果。圖中的ds座標表示時間，y座標對應預測值。圖中的黑點表示已知的歷史數據，由圖上我們很容易發現數據中的異常點，藍色曲線表示模型的預測值。仔細查看藍色曲線，我們可以發現，曲線輪廓的上下邊界有淺藍色區域，它表示模型預測值的上、下邊界。在評估結果時，我們將藍色曲線的預測值視作主預測值，上、下邊界的預測值作為參考。除此之外，淺藍色區域還可以很好的用於模型評估，例如對於下面這個圖：

在2016年之後的模型預測部分，淺藍色區域就過於寬泛，模型預測的上、下邊界被逐漸放大很多倍。這說明模型的平滑性過大，導致異常點對結果造成了很大影響。因此，該模型不夠合理，需要使用者重新設置參數或者對歷史數據中的異常點進行預處理。

上述圖是growth選擇”linear”時的結果，如果認為時間序列呈非線性增長趨勢，我們用如下的圖例來說明：

體上與線性增長的結果表達沒有太大差異，唯一需要注意的是，上圖中的水平虛線表示了非線性增長趨勢的承載量cap，預測結果將在該虛線處達到飽和。

除了上述的整體預測情況外，Prophet還提供了組成成分分析（簡稱成分分析），所謂成分分析就是指對公式（1）中的三大部分模型單獨進行分析，成分分析有助於我們考察模型中的各個組件分別對預測結果的影響，通過可視化的展示，我們可以準確判斷影響預測效果的具體原因，從而針對性的解決。成分分析是我們提高模型準確性的重要來源。例如下圖結果：

上述四個圖從上至下依次是對增長趨勢模型（trend）、節假日模型（holidays）以及季節性模型（weekly和yearly）的展示。需要注意的是，如果沒有在holidays參數裡註明具體的節假日信息，模塊也不會自動對這一部分進行分析。如果對於上面的結果你覺得有不合理的地方，那麼可以根據2.1中參數使用說明更改相應的成分影響，這裡應該儘可能的利用你的專業背景知識，以使各部分組成的影響更符合實際。舉個例子，如果在每年趨勢”yearly”中你認為當前的效果過擬合了，那麼就可以調解seasonality_prior_scale這個參數，值越小，這裡的季節性波動就越小。

對於上面的可視化分析，這裡總結幾點建議，方便大家定位預測中的問題：

a.如果預測結果的誤差很大，考慮選取的模型是否準確，嘗試調整增長率模型（growth）的參數，在必要的情況下也需要調整季節性（seasonality）參數。

b.如果在嘗試的大多數方法中，某些日期的預測依然存在很大的誤差，這就說明歷史數據中存在異常值。最好的辦法就是找到這些異常值並剔除掉。使用者無需像其他方法那樣對剔除的數據進行插值擬合，可以僅保留異常值對應的時間，並將異常值修改為空值（NA），模型在預測時依然可以給出這個時間點對應的預測結果。

c.如果對歷史數據進行仿真預測時發現，從一個截點到下一個截點誤差急劇的增加，這說明在兩個截點期間數據的產生過程發生了較大的變化，此時兩個截點之間應該增加一個”changepoint”，來對這期間的不同階段分別建模。

參考文獻

Sean J. Taylor and Benjamin Letham.Forecasting at Scale.

原文發佈於微信公眾號 - 騰訊技術工程官方號（Tencent_TEG）

分享到:

閱讀更多 機器不學習 的文章

關鍵字: 可視化技術預測歷史

基於 JavaScript 進行符號執行測試

基於 ThinkPHP 的內容管理系統

基於 goframe 實現的日誌中心平臺

基於 MVC + Bootstrap的微信門戶應用開發框架源碼

基於 Elasticsearch 搜索平臺

基於 Python 開發的在線文檔系統

基於 Serverless Component 的全棧解決方案

02.24 谷歌T5 基於 Transformer的文本到文本轉換框架

基於 MongoDB 解決微服務設計中的原子寫入問題

02.13 基於 Flink 的實時特徵平臺在攜程的應用

基於 Flink 的實時特徵平臺在攜程的應用

基於 GNN 的圖表示學習

基於 element-ui 的數據驅動表單組件

基於 C# 的開源算法交易引擎

01.10 基於 Python 協程的併發編程實踐！你學會了嗎？

開箱即用~基於.NET Core的統一應用邏輯分層框架設計

基於 SpringBoot、jwt和JwtPermission實現的前後端分離開發框架

基於 CNN 的文本分類算法

基於 Vue 的兩層吸頂踩坑總結

基於 CNN 的驗證碼破解實戰

基於 TensorFlow.js 的遷移學習圖像分類器

基於 Kubernetes 的微服務圖形化管理界面——Kuboard

基於 xmake，助力打造跨平臺 C

基於@ControllerAdvice註解的SpringBoot項目全局異常處理

基於 SpringBoot 的一款純淨開發腳手架，方便快速二次開發的框架

【開源推薦】基於 SpringBoot 從0到1構建分佈式秒殺系統

基於 SpringBoot + Vue 的一個前後端分離商城項目

基於 RocksDB 的索引數據存儲

基於 HTTP 協議的幾種實時數據獲取技術

04.01 基於 Linux 內核新特性的網關設計實踐

基於 Python 的網易民謠歌詞數據分析

基於 Python 的圖片爬蟲程序設計(續)

基於 Python 的圖片爬蟲程序設計

基於 Kafka 實現分佈式事件驅動

基於 Quartz 開發企業級任務調度應用

基於 SpringCloud 的微服務治理架構落地實踐

01.08 微服務：基於 Docker 的微服務架構之分佈式企業級實踐參考

基於 Spring Cloud 的微服務落地

程序員寶典：基於 JHipster 的代碼生成

土木工程三維模型愛好者必看：基於 C 的三維模型可視化技術

Ocelot-基於.NET Core的開源網關實現

07.06 基於 dubbo 的分佈式架構

基於 Maven 的多模塊 Java（Spring）項目構建

基於 Elasticsearch 構建搜索引擎

基於.NET CORE微服務框架 -淺析如何使用surging

04.02 基於 Docker 的微服務架構實踐

全網最詳細微信跳一跳腳本開發！基於 python開發！ios安卓通吃！

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"