怎樣增加優異數


怎樣增加優異數

這一講咱們把“正態分佈”這個知識給發揮一下,看看你對數學模型能不能活學活用。我們知道世界上很多事物都符合正態分佈,包括人的身高和智商、產品的質量等等。下面這張圖描寫了一個均值是 1,標準差是 0.1,總數量也是 1 的正態分佈曲線 ——

怎樣增加優異數

咱們以智商為例。圖中橫座標代表智商的高低,越往曲線的右側智商就越高;縱座標代表人數,越往上代表人數越多。曲線下方的陰影區域面積就是總人數。

請注意這三個變量的大小都是可變的,針對具體的問題可以按比例放大或者縮小。比如智商的均值是 100 分,標準差是 15 分,那麼圖中橫座標的 1.0 對應的就是智商 100;1.2 對應的就是兩個標準差之外,也就是智商 130;如果你要研究的總人數是 100 萬人,那麼陰影區的總面積就是 100 萬。

現在我們最感興趣的,是我用紅色的框標記出來的那個區域,稱為“優異區”。它出現在分佈曲線右側的大約兩到三個標準差之外的尾巴上,代表統計中最出類拔萃的樣本。如果你研究的是人群的智商,這個區域就代表智商最高的人群,他們的智商都在 140 以上。如果你研究的是一個詩人的作品,這個區域就代表他最高水平的產出。

我們的問題是,如何增加那個區域的面積。

也就是說,如果你是個老師,怎樣讓你的學生中多出幾個聰明人呢?如果你是個詩人,怎樣才能多寫幾首好詩呢?如果你是個企業家或者投資者,怎樣才能多抓住幾個出類拔萃的好項目呢?

怎樣增加優異數,這是有進取心的人最關心的問題,而光憑直覺說我要“努力!奮鬥!”那種思維太落後了。正態分佈這個數學模型,可以幫你理清思路。


根據正態分佈,你可以影響的其實就是三個變量:總量、標準差和均值。

1.提高總量

增加總量是個直觀的辦法:如果我們把總數增加一倍,優異區的數量自然也會增加一倍。

比如作為一個專欄作家,我寫的文章之中可能有的你感興趣有的你不感興趣,但是我什麼都寫。只要我寫的東西足夠多,總會有你感興趣的內容。學生多的老師自然更容易遇到好學生,讀書多的人更容易有真知灼見。

多年以前,中國製造的水平不像現在這麼高,經常有質量問題。當時我記得有人提出一個很有意思的問題,說中國航天的水平非常過硬,發射衛星很少失敗,可是中國製造的汽車質量卻不行 —— 而對比之下,日本製造的汽車質量很好,可是日本航天的水平卻不如中國航天,經常因為技術問題導致發射任務失敗,這是為啥呢?

答案就在這個優異區之中。中國搞航天是舉全國之力幹這一件事兒,可以把每一種零件都讓不同的廠家生產很多個,然後從中挑選最好的一個。這就是以總量取勝。總量多了,總能挑出幾個好的來。

用提升總量來獲得優異數,這是一個用戰略的勤奮彌補能力的不足的方法……但是生產汽車可不能這麼幹,得個保個質量都過硬才行。


提高總量,是個低效率的笨辦法。

2.提升均值

提升均值才是解決問題的根本辦法。想要理解這一點,請你思考這麼一個問題:為啥中國有十四億人,都找不出十一個足球天才來呢?為啥冰島只有三十多萬人,足球水平卻比中國隊強那麼多呢?


有個寫數學博客的外國友人 [1],替中國足球操心,說答案就在正態分佈曲線的這個形狀之中。進入優異區之後,曲線下降的速度非常、非常之快。比如請看咱們開頭說的這個分佈曲線在尾部的情況 ——

怎樣增加優異數

從4個標準差到4.5 個標準差,再到 5 個標準差,曲線縱座標的落差是以數量級的方式下降的。這也就是說,越是天才就越罕見,而且罕見的程度急劇下降。哪怕你有十四億人口,真到了代表天才的尾部區域,也沒幾個人。如果天才總共就沒幾個人,你就算把人口再增加一倍,也多不了幾個人。


真正有效增加天才的辦法,是提高均值。我們看看,如果把全中國人民踢足球的平均水平提高 5%,標準差和人口總量都不變,是個什麼情形 ——

怎樣增加優異數

這相當於你把鐘形曲線往右側挪動了一點。而這一點,體現在優異區上,就是巨大的差異!咱們把優異區放大了再看 ——

怎樣增加優異數

4.5個標準差之外,面積會有幾十倍的差距。均值對優異區的效果比總量的效果要厲害得多。

冰島人口是比我們少得多,可是冰島人踢足球的平均水平可比我們高了遠遠不止 5%。所以冰島的球星數量比我們多,這難道不是應該的嗎?

這個數學博主還舉了個特別有意思的例子。單論成年男子的總數,印度有 6.5 億,而挪威只有250 萬;而印度成年男子的平均身高是165 釐米,挪威則是 180 釐米。那請問,身高 1 米 95 以上的成年男子,是印度人多還是挪威人多呢?


下面這張正態分佈曲線尾部的圖告訴你答案 ——

怎樣增加優異數

1米 95 以上的挪威人數是印度人數的一百倍。總人口多沒啥用,優異區曲線下降速度實在太快了,你必須用提升均值的方法把曲線往右邊挪動,才能得到更大的優異區。

如果你水平就是不行,產量高是沒用的。據說乾隆皇帝弘曆一生寫了四萬首詩,可是現在流傳開來的一首都沒有。中國有句話叫“勤能補拙”,我理解如果你的勤奮是用於提高均值,那可以;但如果你的勤奮都用在了低水平的高產出上,那勤補不了拙 —— 據說是愛因斯坦的一句名言是這麼說的:


“所謂精神病,就是翻來覆去做同一件事兒,卻期待能有不同的結果。”

怎樣增加優異數

3.大標準差

抬高尾部曲線的第三個辦法是加大你這個分佈的標準差。我們把標準差提高 10%,從 0.1 變成 0.11,就成了下面這個情形 ——

怎樣增加優異數

中間普通區的人數變少了一點,而優異區的人數明顯增加了 ——

怎樣增加優異數

對個人來說,擴大標準差意味著你要去嘗試一些更極端的事情。比如一個人的工作能力一般,在一個旱澇保收的公司幹著,賺錢不多但是很穩定。如果他水平不變又想獲得更高的收入,那麼冒險加入一家創業公司,是一個辦法。當然這麼做的缺點是一旦創業不成就會落入曲線左邊的尾巴,進入失敗區。

對一群人來說,標準差大意味著這群人的水平參差不齊,有的特別高有的特別低。這裡有個著名的學術典故。2005年,哈佛大學校長勞倫斯·薩默斯(Lawrence Summers),就為什麼女科學家的人數比男性科學家少這個問題,發表了一個私人的看法 [2]。薩默斯說這並不是因為女性的平均智商比男性低,而是因為女性智商分佈的標準差比男性小。

他說的恰恰就是我們這裡講的這個道理。男性的標準差大,所以在優異區有更多男性。而這並不是說男性作為一個整體優於女性,因為在曲線另一側的尾巴,也是男性多。男性中特別笨的人,也比女性多。


這純粹是一個數學性質,但是很多人認為薩默斯這番言論是性別歧視,結果薩默斯就因為這段話而被迫從哈佛校長的位置上辭職了!

*

我們這篇文章假設人的能力都是正態分佈的,這個假設不一定對。我們的模型能解釋為什麼中國人多可是中國男足的水平不行,但是解釋不了為什麼中國沒有那麼多舉世聞名的數學家 —— 要知道中國人的平均數學水平可是很高的。

我猜測到了特別高的水平,人的能力其實是冪律分佈的:那些能力強的人會有更大的機會和意願去進一步提升自己的能力,這裡面有個馬太效應。要這麼說的話,什麼“高考加一門足球”這樣的辦法其實根本提升不了國家隊的水平。

但是那只是技術細節。我們今天的結論其實對長尾的冪律分佈大體上也是成立的。總結來說,要想增加優異區中的數量 ——

上策,是提升均值。這個方法對優異區的提升非常快,而且沒有風險。

中策,是擴大標準差。這意味著你要冒險去做一些極端的事情。

下策,是增加總量。這是一個笨辦法,效果很差。

只要想想有多少人還在問“為什麼十四億中國人都找不到十一個會踢球的”,就知道並非所有人都理解今天說的道理。

以數量取勝非常符合人的直覺。有些年輕人以上大學之前就通讀了二十四史為榮,有些家長對孩子的期待是上小學之前認識幾千個漢字,有些人四處積累“人脈”。他們犯了和愛新覺羅·弘曆一樣的錯誤,以為一隻猴子只要不停地打字,就終有一日能打出莎士比亞名句來 —— 他們大大低估了正態分佈曲線尾部下降的速度。

高手貴精而不貴多。如果你的輸出很多可是你的水平還是以前那樣,你從未探索新領域,你缺的不是運氣。

……但是,當你的均值已經高到無法再高,當你把能冒的險都冒了以後,數量,就是你唯一可以掌控的東西。巴拉巴西在《成功公式》這本書中提出的最後一個定律,恰恰就是要放量。一個人的科研水平二十多歲的時候就已經到頂了,成功科學家和一般科學家的最大區別是成功科學家一輩子都特別勤奮。


水平夠了才配得上比誰敢冒險。水平夠了又敢冒險,那就只能比誰勤奮、誰家人多了。

註釋

[1] 這位博主沒有留下名字。他這篇博客文章在 https://putanumonit.com/2015/11/10/003-soccer1/ 後面幾張關於印度和挪威人口的圖也是他畫的。“海德沙龍·翻譯組”翻譯了此文,在 http://headsalon.org/archives/6560.html

[2] https://www.theguardian.com/science/2005/jan/18/educationsgendergap.genderissues

[3] 精英日課第三季,《成功公式》7:與無常作伴



分享到:


相關文章: