指數分佈在x->無窮大時,是以指婁速度趨近於0,
那麼以指數分佈為分界線,把x->時下降更快的稱為thin-tailed distribution,比如正布分佈。即在遠離峰值的尾部區域,事件發生的概率更低一些。
相對的,把x->無窮大時速度慢於指數分佈的稱為heavy-tailed distribution。
重尾分佈更適用於那些離峰較遠的稀有事件也會有相當的概率重重,重尾分佈作一人大的類別,包括三個重要的子類:
- 肥尾分佈 Fat-tailed distribution
- 長尾分佈 Long-tailed distribution
- 次指數分佈 Subexponential distribution
長尾分佈
![備忘-真實世界規律-肥尾和長尾](http://p2.ttnews.xyz/loading.gif)
長尾理論
傳統商業中帕累托法則(Pareto principle),又稱為二八定律。
比如80%的財富集中中20%的人手裡,圖書館裡20%的書可以滿足
80%的顧客。
但在一些網上零售業務中,比如Amazon和Netfix,數據表明右端的尾巴雖然平均需求小,但是由於數量巨大,導致其總的營銷收益甚至超過主流的商品。
這一發現似乎對商業界的觸動極大,也說明了正確建模的重要性。
如果用指數分佈進行建模,這些遠端的需求也許就會被忽視;而用長尾分佈進行建模就可以發現這些尾部新的需求從而帶來效益的提高。
肥尾分佈
![備忘-真實世界規律-肥尾和長尾](http://p2.ttnews.xyz/loading.gif)
在機率論中,肥尾分佈(英語:Fat-tailed distribution)是一種機率分佈模型。它是一種重尾分佈,但是它的偏度或峰度極端的大。
與無所不在的正態分佈作比較,正態分佈屬於一種細尾分佈,或指數分佈。
在金融領域,肥尾分佈是不受歡迎的,但卻經常發生,因為它意味著額外風險。
現實的歷史事件包括“黑色星期一(1987年)”,“互聯網泡沫”,2000以後的金融危機等。
例如,某個投資策略可能在一年後獲得預期收益。假設這個策略符合正態分佈,其失敗的可能性(負回報)小於百萬分之一。
但在實踐中,它失敗的可能性高出許多。
金融領域中出現的正態分佈通常是因為影響資產價值或股票價格的因素在數學上是“可預測”“遵循某種規律”,而中心極限定理提供了這種分佈。
然而,“現實世界”災難性的事件(如石油危機,大型企業破產)卻不是數學可以預料的。
隨機遊走
Lévy flight
Brownian motion
隨機遊走(英語:Random Walk,縮寫為 RW),是一種數學統計模型,它是一連串的軌跡所組成,其中每一次都是隨機的。
它能用來表示不規則的變動形式,如同一個人酒後亂步,所形成的隨機過程記錄。1905年,由卡爾·皮爾遜首次提出。
通常,我們可以假設隨機遊走是以馬爾可夫鏈或馬可夫過程的形式出現,但是比較複雜的隨機遊走則不一定以這種形式出現。
在某些限制條件下,會出現一些比較特殊的模式,如醉漢走路(drunkard's walk)或萊維飛行(Lévy flight)。
從這張圖上也可以比較明顯地看出 Lévy flight 出現大跨步的頻率確實要比 Brownian motion 要多一些。
已經有相當多的研究表明很多動物的移動模式可以用 Lévy flight 來描述。而近些年通過對人類的移動數據(通話記錄、出租車等)的挖掘,我們驚奇地發現人類的移動模式也和 Lévy flight 高度吻合。
也就是說,雖然我們每個人急功近利地去追求自己的目標,但在宏觀的尺度上,我們和山裡的猴子沒什麼區別。
閱讀更多 知路哥 的文章