世界五大學習方法之跨界學習法(思維網之正反饋)

世界五大學習方法之跨界學習法(思維網之正反饋)


思維網包括廣義動量定理和系統思考兩種方法,系統思考包括負反饋和正反饋兩種模型,這兩種模型廣泛的存在於世界的方方面面。正反饋中包括輸入、控制、輸出、反饋等要素,輸入和反饋是同號的,正反饋是趨於加強的系統。本節將講解正反饋模型在《道德經》和《聖經》、生活(口口相傳、淘寶網好評和平臺理論)、控制理論(原子彈的鏈式反應和核反應堆原理)、生物學(病毒傳染和排尿反射)、電工學(自激振盪電路)、軍事學(集中兵力和軍備競賽)、管理學(比爾蓋茨的正反饋理論、複利和巴菲特的滾雪球理論)、經濟學(索羅斯的反身理論)和學習(學習的正反饋)中的應用(如圖0所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖0 系統思考之正反饋思維導圖

(1)正反饋在《道德經》和《聖經》中的應用

《道德經》的損不足以奉有餘,以及《聖經》中的馬太效應都是描述富者愈富的現象,現在的積累優勢使得下一次容易成功,下一次的成功又會返回來增加再下一次成功的可能。

《道德經》的損不足以奉有餘

老子是中國古代著名的思想家和哲學家,也是道家學派的創始人。他說“天之道損有餘而補不足”,本質是負反饋,而“損不足以奉有餘”的本質則是正反饋(如圖1所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖1 老子的損不足以奉有餘

老子在《道德經》第七十七章寫道:“天之道,其猶張弓與!高者抑之,下者舉之,有餘者損之,不足者與之,天之道損有餘而補不足。人道則不然,損不足以奉有餘。”

老子的意思是說:自然的道,豈不就像拉弓一樣嗎?弦位高了,就把它壓低,弦位低了,就把它升高;弦長了就把它縮短,弦短了就把它加成。但是社會的法則卻不是這樣,而是剝奪不足來供奉有餘。

老子用張弓來類比自然的道,通過對實際情況的調整,使得弓箭被合適使用,也被稱為“張弓效應”。網上有關於張弓效應的漫畫,我稍微改了下,這樣大家更容易形象的理解(如圖2所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖2 張弓效應漫畫

人道則不然,損不足以奉有餘。這句話講的是社會法制是剝奪不足來供奉有餘,也就是劫貧濟富,這樣就出現了窮者愈窮,富者愈富的現象,這種現象在經濟學上被稱為二八定律,20%的人佔用80%的社會財富(如圖3所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖3 損不足以奉有餘漫畫

天之道損有餘而補不足,這句話講的是一個負反饋過程,老子舉了張弓的例子,漫畫比較形象的表現了老子的意思。比如對於“高者抑之”,在張弓射鳥的漫畫中老者張弓瞄準飛鳥,箭的瞄準高度高於飛鳥,然後通過向下調整箭的高度來瞄準飛鳥。在這個“高者抑之”的過程中,目標是瞄準飛鳥,而實際結果是箭的方向高於飛鳥,老者觀察到了這個情況,和瞄準飛鳥的目標做對比,發現了偏差,所以採用“高者抑之”的方法向下調整箭頭高度,這樣就能瞄準飛鳥,完成閉環控制(如圖4所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖4 張弓效應的方框圖

損不足以奉有餘,這句話講的是一個正反饋過程。有兩個人經過自己的奮鬥,一個獲得的結果多,也就是有餘,一個獲得的結果少,也就是不足。而社會的法則卻是誰多就補誰,就是用結果少的那個結果多的那個,這樣結果多的那個就會越來越多,形成正反饋(如圖5所示)。


世界五大學習方法之跨界學習法(思維網之正反饋)

圖5 損不足以奉有餘方框圖

《聖經》中的馬太效應

《道德經》中的“損不足以奉有餘”會使得有餘的越來越有餘,也就是富者愈富,這是一個正反饋現象,而《聖經》中的“因為凡有的,還要加給他,叫他有餘;沒有的,連他所有的也要奪過來。”被稱為馬太效應,也是富者愈富,也是正反饋現象。

馬太效應是聖經裡的一則寓言,用來闡述一旦獲得一點優勢,這個優勢就會不斷擴大,取得的成果也會越來越大,是一種正反饋現象。

馬太效應(Matthew Effect)來自聖經《新約·馬太福音》中的一則寓言:

天國又好比一個人要往外國去,就叫了僕人來,把他的家業交給他們。按著各人的才幹,給他們銀子。一個給了五千,一個給了二千,一個給了一千。就往外國去了。那領五千的,隨即拿去做買賣,另外賺了五千。那領二千的,也照樣另賺了二千。但那領一千的,去掘開地,把主人的銀子埋藏了(如圖6所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖6 國王給三個奴僕本金

過了許久,那些僕人的主人來了,和他們算賬。那領五千銀子的,又帶著那另外的五千來,說:“主阿,你交給我五千銀子,請看,我又賺了五千。”主人說:“好,你這又良善又忠心的僕人。你在不多的事上有忠心,我把許多事派你管理。可以進來享受你主人的快樂。”那領二千的也來說:“主阿,你交給我二千銀子,請看,我又賺了二千。”主人說:“好,你這又良善又忠心的僕人。你在不多的事上有忠心,我把許多事派你管理。可以進來享受你主人的快樂。”那領一千的,也來說:“主阿,我知道你是忍心的人,沒有種的地方要收割,沒有散的地方要聚斂。我就害怕,去把你的一千銀子埋藏在地裡。請看,你的原銀在這裡(如圖7所示)。”

世界五大學習方法之跨界學習法(思維網之正反饋)

圖7 三個奴僕賺到了不同的利潤

主人回答說:“你這又惡又懶的僕人,你既知道我沒有種的地方要收割,沒有散的地方要聚斂。就當把我的銀子放給兌換銀錢的人,到我來的時候,可以連本帶利收回。奪過他這一千來,給那有一萬的(如圖8所示)。”

世界五大學習方法之跨界學習法(思維網之正反饋)

圖8 國王將賺到最少的全部給了賺到最多的

因為凡有的,還要加給他,叫他有餘;沒有的,連他所有的也要奪過來。

馬太效應因取自聖經馬太福音25章中耶穌的有關才幹比喻的這一節著名經文而得名。1968年,美國科學史研究者羅伯特·莫頓歸納“馬太效應”為:任何個體、群體或地區,一旦在某一個方面(如金錢、名譽、地位等)獲得成功和進步,就會產生一種積累優勢,就會有更多的機會取得更大的成功和進步(如圖9所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖9 馬太效應的方框圖

馬太效應是一種正反饋現象,這一次的成功(輸出)會增加此人的某種能力(輸入),從而使下一次成功的可能性增大,而下一次的成功又會促進再下一次的成功,從而使此人的成功越來越大。

網上也有關於馬太效應比較形象的漫畫,漫畫中兩個人雖然站在同一起跑線,但是一個人是站在汽車上,另一個人用平板車拉著兩個老人,明顯的站在汽車上的人能贏得比賽的勝利,他的積累優勢是已有的汽車,這使得他在比賽中更容易獲勝(如圖10所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖10 馬太效應的漫畫

馬太效應從經濟學來說,它是二八定律,20%的人佔用80%的財富,從數學角度來說,它符合冪率分佈,從系統思考的角度來說,它的本質是正反饋。

(2)正反饋在生活中的應用

許多新產品都從“口口相傳”開始其市場增長的歷程。產品口口相傳就能有滾雪球效應(大眾汽車的甲殼蟲車型和蘋果公司的iPod都是如此),滿意的顧客告訴別人去購買產品,更多滿意的顧客又告訴更多的人(如圖11所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖11 正面的口口相傳

正面的口口相傳是一個正反饋的過程,我們可以分析一下對應的系統要素。其中商品的最初價值是系統的輸入,賣家的銷售對應於系統的控制,銷售的數量是系統的輸出,然後正面的口口相傳是反饋迴路增加商品的銷售量,而這個正面的口口相傳就是正反饋。在《第五項修煉》中,彼得·聖吉使用循環圖來表現正面的口口相傳,其中圓圈中圖是向下滾動的雪球,用於表示輸出在加強(如圖12所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖12 正面的口口相傳循環圖

我們可以將正面口口相傳的系統要素套用到正反饋框圖中,就可以得到正面口口相傳的方框圖(如圖13所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖13 正面口口相傳的方框圖1

由於商品的價格也會影響銷售數量,並且和銷售量負相關,即價格越高,銷售量越低,那麼就可以將價格也添加到正面口口相傳的方框圖中(如圖14所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖14 正面口口相傳的方框圖2

淘寶網好評

在淘寶網買東西,很多人都會碰到給買的商品寫好評,淘寶賣家給返現金。淘寶賣家為什麼要好評返現呢?

我們可以使用口口相傳的正反饋來分析。淘寶買家因為是在網絡上進行購買,不能當場查看產品的質量如何,而別人的評價就成了影響他決策的重要因素,產品的好評越多,購買的傾向就越大,對應的銷售量也就越大,而如果因此好評越來越多,那麼反過來還會促進銷量,這就形成了正反饋(如圖15所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖15 淘寶網好評返現

淘寶網雖然禁止好評返現,但是賣家總是通過各種方式來增加好評,除了好評返現,還有邀請朋友購買給好評,或者通過給QQ和微信群的群友福利等做假訂單來刷好評。

差評的威力比較大,可能一個讓人信服的差評勝過100個好評,差評則降低了消費者購買的慾望,所以很多賣家對於已給差評的客戶使用各種手段,讓其取消差評,好一點的有返現或給福利來讓客戶取消差評,差的就是天天電話騷擾等,逼迫客戶取消差評。

大部分人購買商品都會優先選擇銷售量最大的商品,那麼如何才能成為銷售量最大的商品呢?

一般銷售量最大的幾個商品都會有一個通過低價和促銷來衝量過程,因為價格是購買的阻力,減少價格可以增加購買量。在衝量時,價格甚至可能低於成本價,並且需要配套的好評反饋,這樣就會形成正反饋,然後將銷售量不斷放大,成為排名前幾的商品,且好評度高,然後在恢復原價。這樣別人在購買此種商品時,它被選中的可能就大大增加了,從而盈利。

從淘寶平臺運營的角度看待商品的正面的口口相傳來說,它可以增加消費者選擇淘寶平臺而不是其他平臺的可能。但對於好評返現而獲得的好評來說,這又會出現劣幣驅逐良幣良幣的效應,質量稍差且成本較低的產品有著更多的利潤和動機來刷好評,這樣就使得好的產品被逐漸驅逐了,這降低了大家對淘寶本身的評分。這是淘寶平臺運營需要考慮的事情,應該以哪種嚴格的程度來執行禁止好評返現。

平臺理論

淘寶網本身也是利用正反饋理論打敗其他對手的,淘寶網的這種理論被稱為平臺理論。淘寶網本身的價值會吸引一些賣家在這個平臺上賣商品,然後也會吸引一些買家在上邊買商品,賣家越多,提供的商品數量和種類就越多,吸引的買家也就越多,這樣就形成了賣家數量和買家數量相互促進的正反饋,從而不斷壯大,打敗其他競爭對手(如圖16所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖16 淘寶網的正反饋方框圖

淘寶網是如何打敗強大的易趣的呢?易趣網當時收取商品交易費用等,而淘寶網宣佈免費,這樣加入淘寶網的成本就低於易趣,這樣就吸引了較多的賣家和買家,然後更多的賣家和買家增加了平臺的價值,進而吸引更多的賣家和買家,從而形成正反饋而打敗易趣網,成為購物平臺的領導者,然後就可以賺錢了。

免費還不是平臺競爭激烈形式,更激烈的是直接補貼,比如美國貝寶和其他支付平臺進行競爭時,只要註冊貝寶賬戶就給你10美元,介紹一個人註冊就再給你10美元。貝寶可能是平臺燒錢大戰的鼻祖,也是最先認識到梅特卡夫定律的一群人,即贏者通吃。貝寶的成功也使得貝寶成員日後更容易成功,有點像馬太效應,這些成員在硅谷創立了一堆成功的公司,被稱為貝寶黑幫,皮特•泰爾和埃隆•馬斯克就是貝寶黑幫的成員(如圖17所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖17 梅特卡夫定律

國內的滴滴和快滴進行出行大戰時,則是兩邊補貼,不僅補貼出租車,還補貼消費者。補貼就需要有大量的資金,所以都需要不斷的融資才能進行燒錢大戰(如圖18所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖18 滴滴和快的的燒錢大戰

絕大多數平臺戰爭的玩法都是類似的,建立一個平臺之後,然後免費甚至補貼平臺用戶,然後形成初始的平臺優勢,通過這個優勢不斷的反饋加強,最終成為行業領導者,達到贏者通吃的局面,進而賺到鉅額財富。在這種平臺的戰爭中,平臺本身的優劣是相對次要,而誰的正反饋更強,誰才更容易贏得勝利。比如贏得操作系統大戰的是微軟的PC-DOS,而不是蘋果的系統,或者CP/M-86和UCSD Pascal P-System。

喬布斯則將平臺理論發展出了另一種玩法,就是將一種產品做到極致,然後通過配套的軟件等來完成正反饋模型。比如當時滿地廉價的MP3播放器,蘋果則推出了極致但價格高很多的Ipod,並且將歌曲整合到了itunes,這樣使用Ipod的客戶越多,在itunes中歌曲就越賺錢;而itunes中的歌曲越多,Ipod的價值就越大,這就形成了Ipod的正反饋。同理,Iphone賣得越多,給Iphone做配套APP的價值就越大,而APP越多,Iphone的價值就越大,這就形成了Iphone的正反饋(如圖19所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖19 喬布斯的平臺理論

小米的模式和喬布斯的模式類似,小米最先將定製的MIUI手機系統不斷迭代做到極致,然後這增加了小米手機的銷售量,而小米手機的銷售量越多,小米可以得到的反饋就越多,就越可以進化MIUI,然後進一步增加小米的銷量。小米不斷迭代MIUI使用的是精益創業的理論,核心包括最小化可行產品和快速迭代,精益創業的核心是最小成本快速試錯,本質是負反饋。萬物基於MIUI雖然是一句誇張的話,但是沒有追求極致的MIUI,就不會有現在的小米。當然,小米同時還使用了微軟或者淘寶使用的方法,低價吸引最初的消費者,產生最初始的競爭優勢。

在可以預見的未來,燒錢大戰的平臺戰爭還會層出不窮的出現,如何更省錢更快速的建立正反饋,這是更核心的問題。

汽油危機、糧食搶購、銀行擠兌、口罩搶購和手紙搶購等也都是正反饋。比如手紙短缺的消息傳出去之後,到超市買手紙的人就增加了,人們看到超市的別人都在搶購手紙,也相信手紙會短缺,也開始囤積手紙,這就導致本來家裡還有挺多手紙但是又囤積了很多,這樣超市的手紙就被搶購完了,這又增加了手紙的短缺程度,手紙搶購的正反饋就開始了(如圖20所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖20 衛生紙搶購

絕大部分趨於加強的系統都是正反饋系統。正反饋本身並沒有好壞之分,它只是一種模式,但是正反饋產生的影響有好壞之分,我們要加強好的正反饋,削弱壞的正反饋。

(3)正反饋在控制理論中的應用

原子彈的鏈式反應

當一箇中子引起鈾核裂變時,同時放出2個~3箇中子,如果這些中子再引起其他鈾核裂變,就可使裂變反應不斷地進行下去,這種反應叫作鏈式反應。這種鏈式反應可以使用系統思考的正反饋模型進行表述(如圖21所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖21 原子彈的正反饋效應

一箇中子轟擊了一個鈾核,產生了Kr,Ba(也可能產生其他類似物質),2箇中子以及201MeV的能量。

世界五大學習方法之跨界學習法(思維網之正反饋)

如果產生的中子繼續轟擊了2個鈾核,就又產生了Kr,Ba,4箇中子以及402MeV的能量,通過轟擊鈾核,中子不斷產生,進而引起核裂變的鏈式反應,釋放出巨大的能量。這就是原子彈爆炸的原理(如圖22所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖22 鏈式反應

鈾核鏈式反應的必要條件是裂變產生的中子數大於入射中子數,這叫作中子數增殖。如果中子數太少,就不足以維持鏈式反應。通過增加中子數量可以加強鏈式反應(如圖23所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖23 原子彈爆炸

通過核裂變計算出反應前後的質量虧損Δm,就可以通過質能方程ΔE=Δmc2計算出核裂變釋放的能量ΔE,1kg鈾如果全部裂變,可以釋放8.2×1013焦耳的能量,相當於2700噸優質煤的能量。

核反應堆原理

核裂變不僅能製造原子彈,也能用來發電而造福人類。由於鏈式反應中,中子數量決定了鏈式反應的速度,所以通過控制中子的數量就能控制鏈式的反應速度,核反應堆就是採用這個原理。核反應堆主要有4部分組成,包括鈾棒、鉻棒、減速劑和防護層(如圖24所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖24 核反應堆結構

第一部分是燃料棒,即鈾棒,這是反應物。插入的鈾棒越多,中子轟擊到鈾核的可能性越大,則反應越快。第二部分是控制棒,即鉻棒,鉻棒具有吸收中子的作用,插入的鉻棒越多,吸收的中子就越多,鏈式反應就越慢。第三部分是減速劑,由於核裂變產生的中子速度快,能量大,鈾核很難捕捉到這個快中子,需要使用減速劑來降低快中子的速度和能量,從而利於鏈式反應。減速劑可以是石墨、重水和輕水等。第四部分是水泥防護層,用來阻擋鏈式反應產生的各種射線,用來保護工作人員(如圖25所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖25 核電站原理

反應堆產生的熱能可以加熱水而產生蒸汽,蒸汽推動汽輪機進行發電,而從而達到利用核能發電的目的(如圖26所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖26 核電站反應正反饋

核反應堆和原子彈的反應原理是相同的,但是原子彈鏈式反應開始後便不能進行控制了,而核反應堆則增加了對鏈式反應的控制方法。在中子轟擊鈾核的過程中,可以轟擊的鈾核越多,鏈式反應越劇烈,核反應堆通過控制鈾棒的插入量來控制參與反應的鈾核數量。在轟擊鈾核釋放中子後,中子越多,鏈式反應越劇烈,核反應堆通過控制鉻棒的插入量來控制吸收中子的數量,進而控制鏈式反應的速度。

(4)正反饋在生物學中的應用

正反饋在生物學上也是一個常見的模式,病毒傳播、排尿、排便、分娩、凝血和射精等都是正反饋。

病毒傳播

病毒通過某種途徑(比如動物)傳播到人的身上,人感染病毒之後向外界傳播病毒,傳給了更多的人,更多人向外傳播出更多的病毒,形成了正反饋效應(如圖27所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖27 病毒傳播正反饋

2020年流行的新冠肺炎導致了全世界幾百萬人感染,幾萬人死亡。一個新冠肺炎的病人傳播的病毒會把好幾個人傳染,然後被傳染的人又會繼續傳播病毒,導致更多的人傳染,這和原子彈的鏈式反應很像,病毒就像鏈式反應中的中子。

截至2020年4月24日,網易新聞報道,全球累計確診2744503,累計死亡191191人(如圖28所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖28 世界新冠肺炎疫情地圖

病毒傳播的過程和原子彈的鏈式反應很像,病毒就像鏈式反應中的中子,而人就像鈾核。我們知道正反饋是趨於加強的,既然鏈式反應都可以通過控制而產生核反應堆這種應用,那麼病毒也可以通過類似的手段來尋找應對的方法。在病毒的正反饋框圖中,系統的輸入是病毒,控制是傳染給人、輸出是病人和病毒、正反饋是病毒。

我們可以將病毒正反饋拆分成4個部分,進行分而治之。

首先針對病毒的輸入,我們要想辦法減少病毒的輸入,這樣傳染的人數就會減少。國家間採用分而治之的方式,每個國家控制病人的輸入,這樣就能減少輸入性新冠肺炎。國家內部也採用分而治之的方式,每個省控制病人的輸入;分而治之的方式一直可以分下去,每個市、每個區、每棟樓,分而治之有效降低了控制的難度。

針對傳染給人,需要減少病毒傳染給人,這要從病毒和人兩方面進行控制,一方面是減少病毒的傳染力,一方面是增加人的抵抗力,這就好像打仗,減少敵人實力和增加自己實力都利於獲得勝利。減少病毒傳染力包括但不限於戴口罩、消毒等。增加人的抵抗力包括研製疫苗、增加鍛鍊等。

在核反應堆的控制中,減少燃料棒的插入數量,可以減少被中子擊中的概率,也就可以減少核反應的強度。對應於病毒傳播傳播路徑上人的數量,也可以有效減少被病毒擊中的概率。比如減少去醫院、火車站、商場等人員聚焦的地方,那樣就相當於減少了燃料棒的插入數量,也就減少了傳染的人數(如圖29所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖29 減少病毒傳播正反饋

針對系統的輸出,要減少系統輸出的病人數量和病毒數量。對病人進行及時治療可以減少病人數量,對病人碰過的物品進行消毒處理,可以減少病毒的輸出數量。

針對系統的反饋,這也是正反饋中最重要的,一旦反饋大幅減弱,正反饋的威力就會大大下降,減少病毒二次傳染是最重要的。在核反應堆中,插入的控制棒越多,吸收的中子越多,核反應越弱。如果能發明吸收病毒的方法,那麼病毒的傳播就會得到有效的控制。比如發明某種設備可以吸收病毒,或者發現某種物品可以吸收病毒。

在核反應堆中,減速劑來降低快中子的速度和能量,從而利於鏈式反應。我們可以找一種類似的物品,減少病毒的傳染力和成活時間,降低鏈式反應。

在核反應堆中,防護層是用來阻擋射線,保護工作人員。在病毒的治療中,負壓病房、防護服等也是用來保護醫護人員的。

我們還可以針對病毒輸入,增加一個抵消病毒輸入的干擾,來減少病毒的影響。

系統也都會存在延遲,我們增加病毒傳播過程中的每一個環節的延遲,也可以有效降低病毒的傳播效率。比如疑似患者的14天隔離就是一種延遲。我們也可以在減少每一個病毒治療過程中的延遲,比如快速檢測病人、發現病人快速隔離、快速治療,對於檢測盒和疫苗,要使用精益創業中的方法,快速迭代試錯,研製出檢測速度更快更準確的檢測盒,早日研製出疫苗。

排尿反射的分析

以排尿反射為例,當膀胱尿量充盈到一定程度時(400-500ml),內壓驟增,膀胱壁的牽張感受器受到刺激而興奮。衝動沿盆神經傳入,到達骶髓初級排尿中樞;同時,衝動也到過腦幹和大腦皮層的排尿反射高位中樞,併產生排尿欲。當大腦確定環境允許時,產生排尿命令,命令下傳到骶髓初級排尿中樞,衝動沿盆神經傳出,引起逼尿肌收縮、內括約肌松馳,於是尿液進入後尿道。這時尿液還可以刺激尿道壁感受器,衝動沿陰部神經再次傳到脊髓排尿中樞,進一步加強其活動,於是尿注被強大的膀胱內壓驅出。尿液對尿道的刺激可進一步反射性地加強排尿中樞活動,這是一種正反饋,它使排尿反射一再加強,直至尿液排完為止(如圖30所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖30 排尿反射原理圖

尿液進入後尿道,刺激尿道壁感受器,信號反饋到骶髓初級排尿中樞進一步加強排尿活動,這是正反饋模型,可以使用方框圖來繪製排尿反射的正反饋過程(如圖31所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖31 排尿反射正反饋方框圖

小兒大腦發育未臻完善,對初級中樞的控制能力較弱,所以小兒排尿次數多,且易發生在夜間遺尿現象。

在排尿過程中,任何一個環節出現問題,都會導致排尿反射不能正常進行。比如傳入神經斷了,就不能向骶髓初級排尿中樞傳輸信號,膀胱再脹也感受不到,導致膀胱脹大也就導致了無張力膀胱。骶髓初級排尿中樞的傳出神經斷了,排尿的所需的逼尿肌和括約肌不受控制,導致有尿排不出,就是尿瀦留。骶髓初級排尿中樞和大腦之間的信號傳輸出現問題,大腦便不能控制什麼時候排尿,就會出現尿失禁。每個環節出問題都有對應的病症,清楚知道了排尿反射過程,醫生才能根據病症對症下藥進行治療。

(5)正反饋在電工學中的應用

激盪電路廣泛的應用於無線電通訊、廣播電視、高頻感應爐、超聲波發生器、正弦波信號發生器、半導體接近開關。震盪電路是正反饋電路。

自激振盪指的是放大電路在無輸入信號的情況下,就能輸出一定頻率和幅值的交流信號的現象。

當開關S在1時是無反饋放大電路,放大倍數為A,輸出Uo=AUi。

當開關合在2時,變為有反饋電路,輸出Uo=AUf。去掉Uf=Ui,那麼去掉Ui仍有穩定的輸出(如圖32所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖32 自激振盪正反饋方框圖

由於

Uo=AUf

Uf=FUo

得到Uo=AUf =AFUo

自激振盪的條件是AF=1,即|AF|的幅值為1,相位條件是A和F的角度和為2nπ。

正弦波振盪電路用來產生一定頻率和幅值的正弦交流信號。它的頻率範圍很廣,可以從一赫以下到幾百兆以上;輸出功率可以從幾毫瓦到幾十千瓦;輸出的交流電能是從電源的直流電能轉換而來的。下圖是常見的RC震盪電路(如圖33所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖33 RC震盪電路

輸出電壓uo經正反饋〈兼選頻〉網絡分壓後,取uf為同相比例電路的輸入信號ui。

下圖為自激振盪的起振過程(如圖34所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖34 自激振盪的起振過程

下圖為自激振盪的穩幅過程(如圖35所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖35 自激振盪的穩幅過程

常用的正弦波振盪器除了有RC震盪電路,還有LC震盪電路和石英晶體震盪電路。

(7)正反饋在軍事學中的應用

正反饋在軍事學上也有著很多應用,比如軍事學的“集中兵力”和“軍備競賽”都是正反饋。

集中兵力

假如A隊有9名士兵,B隊有6名士兵,雙方每人中3顆子彈便死亡,雙方都是以儘可能多的消滅敵人為目的(如圖36所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖36 兩隊槍戰前兵力對比

A隊有50%的數量優勢。人數可以是9個人對6個人,也可以是90人對60人,或者9000人對6000人。不管到底是多少,其中的原則是相同的。

第一次火拼後,戰局發生了戲劇性的變化。A隊打出9發子彈,打死3人;B隊打出6發子彈,打死2人。A隊由9:6的優勢轉變為7:3的優勢。A隊50%的兵力優勢變為大於100%。隨著戰火的燃燒,這種致命的算術遞增仍在繼續(如圖37所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖37 槍戰第一輪兵力對比

第二次交火後,A隊打出7發子彈,打死2人,並且剩餘人中有1人中1槍,B隊打出3發子彈,打死1人。兵力對比會變為B隊以6:1佔絕對優勢(如圖38所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖38 槍戰第二輪兵力對比

第三次交戰後,A隊打出6發子彈,將B消滅,B隊打出1發子彈,未打死1人。A隊就被徹底殲滅了(如圖39所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖39 槍戰第三輪兵力對比

再來看一下雙方的傷亡情況。A隊傷亡3人,B隊傷亡6人,優勢兵力(A隊)的傷亡人數僅是劣勢兵力(B隊)的一半。

兩隊第一輪開始戰鬥前兵力對比優勢是9:6,第一輪戰鬥後的對比優勢變為7:3;第二輪戰鬥開始前的對比優勢是7:3,第二輪戰鬥戰鬥後的對比優勢變為6:1;第三輪戰鬥開始前對比優勢是6:1,第三輪戰鬥後的對比優勢變為6:0。每一輪戰鬥後的對比優勢都會反過來加強下一輪的戰鬥,使得對比優勢變大,形成正反饋。初始的優勢是系統的輸入,兩隊的戰鬥過程是系統的控制,兩隊剩餘人數和兵力對比是戰鬥的輸出,而兵力對比又會反饋到下一輪的戰鬥中,增加兵力對比優勢。這也就是為什麼軍事學強調要集中兵力,就是要獲得對比優勢,然後以較小的傷亡獲取更大的成果(如圖40所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖40 兵力優勢正反饋方框圖

在9人和6人的戰鬥中,第一輪A隊用2人死亡換取了敵人3人的死亡,第二輪戰鬥中,A對用1人的死亡換取了敵人2人的死亡,自己付出的傷亡越來越小,獲取敵人的傷亡越來越大。

集中兵力可以產生對比優勢,對比優勢會隨著戰鬥的進行而增加,這樣就可以以越來越小的傷亡換取敵人越來越大的死亡。集中兵力幾乎是所有兵書的第一原則,蘭切斯特第二法則在理論上驗證了集中兵力的重要性。

軍備競賽

軍備競賽指的是和平時期敵對國家或潛在敵對國家互為假想敵、在軍事裝備方面展開的質量和數量上的競賽。第一次世界大戰之前的列強軍備競賽導致了一戰,二戰後美蘇的軍事競賽導致蘇聯解體。一個國家由於某種原因(比如感覺受到威脅)增加了自己國家的軍事實力,這使得對手感受到了威脅增加,也增加了自己的軍事實力,而對手增加軍事實力又使得這個國家感覺威脅增加,然後進一步增加自己的軍事實力,從而形成了軍備競賽,也就是正反饋。商業上的惡性價格戰和軍備競賽類似(如圖41所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖41 軍備競賽正反饋方框圖

一般軍備競賽都是以戰爭或者經濟崩潰而結束,還有一種方法可以結束軍備競賽,就是各國增加互信,均減少軍備。

(8)正反饋在管理學中的應用

正反饋理論在管理學中也有著廣泛的應用,趨於加強基本上都是正反饋,好的正反饋威力驚人,甚至使得比爾·蓋茨長期蟬聯世界首富。

比爾·蓋茨的正反饋理論

比爾·蓋茨在《未來之路》中介紹了他是如何通過正反饋理論打敗所有競爭對手,使微軟系統成為行業標準的。微軟系統的低價策略使得比其他競爭對手賣出更多產品,而賣出的產品多,給他做兼容軟件的廠家就多,從而增加了微軟系統的影響,進而促進更多人購買微軟系統,形成正反饋效應。

比爾•蓋茨通過正反饋理論擊敗蘋果操作系統和UNIX等眾多實力強大的對手,使微軟系統稱為行業標準,自己也成為世界首富。

比爾·蓋茨在他的書《未來之路》中寫道:“事實標準常常通過經濟機制在市場上發生演變,這種經濟機制與推動商業成功的正向螺旋的概念十分相似,它使一個成功推動另一個成功,這一概念叫做正反饋,它說明事實標準之所以常常出現在人們尋求兼容性的時候的原因。

在一個發展的市場上,只要存在一種稍微優於競爭對手的做法,這時正反饋循環就開始了。這種情況最容易發生在下面這種高技術產品上,這種產品可以大量製造,而成本卻很少增長,其一部分價值來源於他們的兼容性。家用錄像遊戲系統就是一個例證。這是一種有特殊目的的計算機,安裝有一張供特殊目的用的操作系統,該操作系統形成了遊戲軟件平臺。兼容性的重要性,還在於可利用的應用程序(例如這裡的遊戲程序)越多,則機器本身對用戶來說就越有價值。同時,用戶購買的機器越多,軟件開發者就會為它開發越多的軟件。一旦一臺機器的推廣到達了一個高水平,銷售量就會不斷上升。這時,正反饋循環就開始了。

計算機行業學到的最重要的教訓之一是,計算及對其用戶的價值大小取決於質量和可供計算機使用的各種應用軟件。

但是最初的IBM個人計算機實際上可以選擇裝入3個操作系統——即我們的PC-DOS,CP/M-86和UCSD Pascal P-System。我們知道三個系統中只有一個能夠成功,從而成為標準。我們需要向VHS錄像帶推入每一個錄像帶商店那樣的同一類的力量,使MS-DOS也成為一個標準。我們看到有三種方法使MS-DOS名列前茅。

第一種就是要使MS-DOS成為最好的產品。第二種就是幫助別的公司編寫以MS-DOS為基礎的軟件。第三種是要確保MS-DOS價格便宜。

我們和IBM做了一筆令人難以置信的交易——即只交低廉的一次性費用,就使該公司在所銷售的許多計算機上使用微軟公司的操作系統。這就使得IBM有了動力去推廣MS-DOS,廉價地銷售它們。我們的策略成功了。IBM以大約450美元的價格出售UCSD Pascal P-System,以175美元出售CP/M-86,而以60美元出售MS-DOS。

我們的目的不是要直接從IBM那裡賺錢,而是要從出售MS-DOS特許權賺錢,有的計算機公司想要提供或多或少的與IBM個人計算機兼容的機器,我們就把MS-DOS的特許權出售給這些公司。IBM可以免費的使用我們的軟件,但是它對未來的升級版軟件並不能享有獨佔使用權和控制權。這使得微軟公司做起了把軟件平臺的特許使用權出售給個人計算機工業的生意。結果IBM放棄了UCSD Pascal P-System 和CP/M-86的升級版本。

用戶們充滿信心的購買IBM個人計算機,在1982年,軟件開發者們開始拋出在這一DOS下運行的應用程序。每一個新的應用程序都增加了IBM個人計算機作為潛在的工業界的事實標準的實力。

一個正反饋的循環開始趨動個人計算機市場。一旦開了頭,成千上萬的應用程序出現了。不計其數的公司開始製造內置卡或‘附件卡’,這些卡擴展了個人計算機的硬件能力,軟件和硬件的珠聯璧合所帶來的好處使個人計算機的銷售量遠遠超了IBM的預期銷量——成百上千萬地增加。正反饋循環為IBM循環出數十億美元。有好幾年,所有商用個人計算機中的半數以上是IBM的產品,其餘的大多數產品也與它兼容。

在三年內,幾乎所有的個人計算機競爭標準都消失了,唯一的例外是蘋果公司的蘋果二型(Apple II)和Mac機(Macintoch)。惠普,DEC,德州儀器和施樂公司,儘管在技術聲望和用戶方面都有很強的實力,但在80年代初期的個人計算機市場上均告敗北。原因在於它們的機器缺乏兼容性,而且沒有對IBM內部結構提供足夠的重大改進。”

比爾·蓋茨在《未來之路》中,詳細的介紹了微軟利用正反饋原理打敗所有的其他操作系統而成為行業標準。

比爾·蓋茨的正反饋思路是當微軟的操作系統在市場上有較多一些份額,和其他操作系統相比,給微軟系統編寫軟件意味著更多的受眾,所以就有較多的軟件開發者為微軟的操作系統編寫應用軟件,這樣微軟的操作系統的價值就會提高,就會有更多的人購買微軟的操作系統,然後又有更多的軟件開發者為微軟系統編寫應用程序,增加微軟系統的價值,從而又再促進銷售。最後形成正反饋,打敗所有其他對手,成為行業標準。

比爾·蓋茨提出三種方法來增加微軟操作系統的市場份額的方法:“第一種就是要使MS-DOS成為最好的產品。第二種就是幫助別的公司編寫以MS-DOS為基礎的軟件。第三種是要確保MS-DOS價格便宜。”

“我們和IBM做了一筆令人難以置信的交易——即只交低廉的一次性費用,就使該公司在所銷售的許多計算機上使用微軟公司的操作系統。這就使得IBM有了動力去推廣MS-DOS,廉價地銷售它們。我們的策略成功了。IBM以大約450美元的價格出售UCSD Pascal P-System,以175美元出售CP/M-86,而以60美元出售MS-DOS。”

在物理學中,我們知道:“合外力決定成果”。商品給消費者帶來的利益是消費者購買的動力B,價格是消費者購買的阻力C,二者的合外力B-C決定了銷售量這個成果Q,合外力的轉化率為K。Q=K(B-P)是《可以量化的經濟學》中提出的需求定律公式。微軟使用了4種方法來增加銷售量Q(如圖42所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖42 微軟成功的4種方法

“第一種就是要使MS-DOS成為最好的產品。第二種就是幫助別的公司編寫以MS-DOS為基礎的軟件。”這兩種方法增加了消費者購買MS-DOS系統的利益B,第一種是微軟自身完善軟件而增加的消費者利益,第二種是兼容軟件增加的消費者利益B,通過Q=K(B-P)可知,增加B會而使銷量Q增加。

“第三種是要確保MS-DOS價格便宜。”第三種方法降低價格,降低了消費者購買的成本P,通過Q=K(B-P)可知,降低P會而使銷量Q增加。

通過與IBM這個巨頭合作,獲得了全世界的推廣,增加盈餘轉化率K,通過Q=K(B-P)可知,增加K會而使銷量Q增加。微軟作為初創公司,負擔不起全球推廣這樣巨大的營銷費用。如果最開始微軟沒有和IBM進行合作,那麼佔據初始優勢而最後形成正反饋效應的公司就不會是微軟了。微軟允許IBM以很低的費用使用微軟的操作系統,從而使IBM有動力去推廣微軟的操作系統而不是其他家的。而由於IBM在個人商用電腦上的巨大成功,使微軟的操作系統成為了行業標準。

微軟通過將操作系統的特許權出售給其他IBM的兼容機廠商賺錢。

在這裡作者以系統框圖來分析微軟的正反饋,並且介紹一條作者要在經濟學中講的重要原理:消費者盈餘決定購買數量;而不是價格決定購買數量。

消費者盈餘=消費者利益-價格。消費者利益指消費者購買某種產品或服務所獲得的利益,也就是商品價值。消費者盈餘與購買數量正相關,消費者盈餘越多,購買數量越多(如圖43所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖43 比爾·蓋茨的正反饋模型

第一種方法是微軟通過自身完善產品來增加消費者可以獲得的利益,從而增加消費者盈餘。第二種方法是幫助兼容商編寫以微軟系統為基礎的軟件來增加消費者利益,從而增加消費者盈餘。第三種是通過低價來增加消費者盈餘。

而比爾•蓋茨同時使用了三種方法,則消費者盈餘會變的很大,購買量會增加很多,從而推動MS-DOS成為了行業標準。

在這三種方法中,微軟允許IBM以很低的價格在其計算機上使用微軟的操作系統,促使電腦界的巨人有動力去推廣微軟的操作系統,藉著IBM的成功,而使自己的操作系統迅速成為行業標準,從而打敗所有其他的操作系統。蘋果系統,UNIX系統和其他操作系統的失敗都是因為他們的兼容性不好,甚至於蘋果公司自己的系統都不兼容,從而降低了消費者的利益。

複利

愛因斯坦說:“複利是人類的第八大奇蹟。”

複利的本質是:做事情A,會導致結果B,而結果B又會加強A,不斷循環往復的正反饋效應。

複利的計算是對本金及其產生的利息一併計算,也就是利上有利,也被稱為利滾利。

複利的公式為:

F=P*(1+i)^n

其中F為本利和,P為期初金額,i為利率,n為計息期數。

比如利率為i,年初投入金額為P,那麼一年後和本息和為P*(1+i)。第二年投入的金額就變成了P*(1+i),兩年後的本息和就變為了P*(1+i)*(1+i)。

複利的本質是正反饋,可以使用系統思考進行分析,輸入是期初金額P,控制是1+i,輸出是本利和F,反饋的是本利和F,其中期初金額只輸入1次,並且第一次無反饋(如圖44所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖44 複利正反饋方框圖1

我們可以拆分這個複利的負反饋框圖,第一次開關S和1相連通,輸入為初始金額P,輸出F=P*(1+i) (如圖45所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖45 複利正反饋方框圖2

第二次和以後,開關S從1打到2,變為和2連通,輸入和上一期的本利和,輸出為上一期的本利和*(1+i),即複利公式F=P*(1+i)^n(如圖46所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖46 複利正反饋方框圖3

複利的正反饋框圖和自激振盪電路有點類似。

影響本利和F有3個要素,期初金額P,利率i和計息期數n。增加P、i和n就能增加最終的本息和F。

如果期初金額P為0,那麼無論利率有多大,計息期數有多大,最終結果都是0,也就是說必須有期初金額,沒有雞怎麼生蛋,窮人就是因為沒有所以沒有辦法得到蛋。

巴菲特的滾雪球理論

巴菲特的滾雪球理論是一個正反饋效應,他將源源不斷的資金流投入股票市場,而他所投資的股票的公司都是經過他嚴格篩選的,具有增長潛力的。這樣投入的資金會有較大的增值,然後他再將增值的資金再次投入較高成長公司的股票,從而利用正反饋,賺到巨大財富。

巴菲特使用滾雪球理論,使自己成為最賺錢的投資大師。

巴菲特說:“人生如滾雪球,重要的是找到很溼的雪和很長的山坡。”

1994年10月10日巴菲特在內布拉斯加大學的演講中說:“複利有點像從山上往下滾雪球。最開始時雪球很小,但是往下滾的時間足夠長(從我買入第一隻股票至今,我的山坡有53年這麼長),而且雪球黏得適當緊,最後雪球會很大很大。”

溼雪,指的是在合適的環境中投入能不斷滾動增長的資金。長坡,指的是能讓資金有足夠的時間滾大變強的企業。

其實巴菲特是用滾雪球比喻通過複利的長期作用實現巨大財富的積累,雪很溼,比喻年收益率很高,坡很長,比喻複利增值的時間很長(如圖47所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖47 巴菲特的滾雪球理論

巴菲特1963年寫給合夥人的信中說:“我們的合夥基金存在的根本原因就是要以高於平均水平的收益率複利增長,而且長期資本損失的風險比主要投資公司更低。”

巴菲特是通過複利而賺到如此多的財富的。在2020年福布斯全球財富榜上,沃倫·巴菲特以894億美元排名第4位。

巴菲特不是一次性投入一定數量的錢,然後通過複利而賺到如此財富的。巴菲特擁有一家全資的保險公司—伯克希爾哈撒韋。保險公司的性質決定了客戶存入保險的金錢都是長期的,所以這家公司每年為巴菲特的投資提供巨大的長期資金流,從而使巴菲特有足夠的資金投入到股票當中,進而賺到如此財富的(如圖48所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖48 巴菲特的滾雪球模型

巴菲特的滾雪球理論是一個正反饋效應,他將源源不斷的資金流投入股票市場,而他所投資的股票的公司都是經過他嚴格篩選的,具有增長潛力的。這樣投入的資金會有較大的增值,然後他再將增值的資金再次投入較高成長公司的股票,從而利用正反饋,賺到巨大財富。

在複利的公式F=P*(1+i)^n中,我們知道影響本利和F的有三個要素:期初金額P、利率i和計息期數n,這三個數越大,本利和F越大,那麼如何使得這三個數字最大呢?

首先是期初金額,巴菲特本身並沒有多少錢,他開始是通過幫助別人理財來獲得期初金額,也就是借雞下蛋,後期是通過伯克希爾哈撒韋這家公司的收入來獲得源源不斷的期初金額,本質也還是借雞下蛋。

銀行的錢更多,為什麼巴菲特不收購一家銀行而是選擇了保險公司呢?這裡邊有3點很重要,第一點是保險公司的錢都是長期的,而銀行的錢很多都是短期的,長期的錢才能匹配較長的計息期數n,也就是巴菲特可以運用這部分錢的時間很長;第二點是保險公司產生擠兌的風險很小,倒閉的風險很小,這就使得這些資金都是低風險的資金。第三點,即使是保險公司的理財產品的利率也要比銀行低,也就是說即使你拿著保險公司的錢什麼投資也不做,只是存在銀行裡也可以獲得利差,也就是說使用保險公司的錢的成本更小。通過分析我們可以得到,保險公司可以為巴菲特提供長期的、低風險、低成本、鉅額的資金流。

對於利率i,如何使得它最大化,這是巴菲特的核心能力,也就是他能找到高於平均收益率的投資項目。

巴菲特不是一次性投入期初金額,而是不斷的投入期初金額,因為保險公司可以給他帶來持續的資金流,換句話說,巴菲特不是在滾一個雪球,而是在滾很多雪球。

(9)正反饋在經濟學中的應用

反身理論分析

索羅斯的反身理論是一個正反饋模型,索羅斯使用反身理論,狙擊英格蘭銀行,引發亞洲金融危機,是世界上最有力量的投機大師。主流預期是投機者購買的合外力,合外力決定了金融產品的價格漲跌,而金融產品價格的漲跌又影響主流預期,二者相互加強,形成正反饋效應。

喬治·索羅斯的核心投資理論就是所謂“反身理論”。簡單來說,反身理論是指投資者與市場之間的一個互動影響。索羅斯認為,金融市場與投資者的關係是:投資者根據掌握的資訊和對市場的瞭解,來預期市場走勢並據此行動,而其行動事實上也反過來影響、改變了市場原來可能出現的走勢,二者不斷地相互影響。因此根本不可能有人掌握到完整資訊,再加上投資者同時會因個別問題影響到其認知,令其對市場產生“偏見”。

在現實中,股票價格上升,購買量也上升,需求定律無法解釋,並且供需曲線也並沒有如均衡價格曲線那樣達到一個均衡點,而是處在非均衡的狀態。金融家索羅斯通過反身定理和金融經歷對經濟學的均衡模型提出了挑戰。

經濟學上用羊群效應來解釋股票市場的價增購買量增多,並且認為是不理性的行為(與人是自利的假設衝突),這是用現象解釋現象,缺乏解釋力。經濟學家也試圖通過將股票市場的價升需求量上升定義為不理性的行為來回避與需求定律價升需求量應下降的矛盾。羊群效應是指不去思考的從眾效應,而金融投機者整天在做的事情就是思考投機哪隻股票,以及何時投機。

索羅斯提出反身理論來解釋這種非均衡現象,並對傳統的均衡經濟學理論提出質疑。

在控制理論上有2種基本模型,分別為負反饋模型和正反饋模型。馬歇爾的均衡價格論是負反饋模型,負反饋是趨於穩定的;而索羅斯的反身理論是正反饋模型,正反饋是趨向於加強,非穩定狀態的。負反饋與正反饋一同構成完整的經濟學模型。

索羅斯是第一個提出完整理論來挑戰經濟學的均衡,並通過股票和外匯等金融市場的實例來支持其理論的人。

所以為了理解的方便,此處將對索羅斯的理論進行簡要的介紹,其內容來自於他的著作《金融鍊金術》。

“參與者的偏向

參與者的思維和所參與的情境之間的聯繫可以分解成兩個函數關係,我將參與者理解情境的努力稱為認識的或被動的函數,把他們的思維對現實世界的影響稱為參與的或主動的函數。在認識函數中,參與者的認識依賴於情境;在參與函數中,情境受參與者認知的影響。可見,這兩個函數從相反的方向發揮其功能,在認識函數中自變量是情境,而在參與函數中自變量是參與者的思維。

兩個函數同時發揮作用時,它們相互干擾。函數以自變量為前提產生確定的結果,但在這種情境下,一個函數的自變量是另一個函數的因變量。確定的結果不再出現,我們所看到的是一種相互作用,其中情境和參與者的觀點兩者均為因變量,以致一個初始變化會突然同時引起情境和參與者觀點的進一步變化,我稱這種相互作用為‘反身性’。運用簡單的數學,反身性可以表述成一對遞歸函數:

y=F(x) 認識函數

x=Φ(y) 參與函數

所以

y=F[Φ(y)]

x=Φ[F(x)]

這就是我的方法的理論基礎。兩個遞歸函數不會產生均衡的結果,只有一個永無止期的變化過程。這個過程從根本上區別於自然科學研究的過程,在那裡,一組事件跟隨另一組事件,不受思維或認知的干擾(儘管在量子物理學中,觀察引入了不確定性)。當一個情境包含思維參與者時,事件的因果聯繫不再是由一組事件直接導向下一組事件,相反,它以一種類似鞋袢的模式將事實聯結於認知,認知復聯結於事實,由此,反身性概念產生了一種歷史的‘鞋袢’理論。

反身性理論對均衡概念的批判

將反身性的討論引回到經濟理論,我們發現,正是參與者的偏向導致了均衡點的不可企及。調整過程所追求的目標中混入了偏向,而偏向在這個過程中又是可變的,在這種情況下,事件進程的指向將不再是均衡,而是一個不斷移動的目標。

為便於討論,可以將事件分為兩種類型:總是能夠為參與者所正確預見並且不會在他們的認知中激起變化反應的日常習慣,以及獨特的影響參與者偏向並導致進一步變化反應的歷史事件。第一類事件適於進行均衡分析,第二類卻不行,它只能作為歷史過程的一部分加以理解。

在日常事件中,只有參與函數發生變化,認識函數是給定的。就獨特的歷史事件而言,兩個函數同時發生變化,參與者的觀點和與之相關的情境兩者均無法保持相互獨立的狀態,而是在相互影響的同時不斷進行變化,因此才形成了所謂歷史性的發展。

均衡分析由於略去了認識函數而取消了歷史性的變化(事件),經濟理論採用的供求曲線僅僅是參與函數的曲線表達,認識函數為完備知識的假說所取代。如果考慮到認識函數的作用,市場上發生的事件就可以改變需求和供給曲線的形態,並且永遠不會達到經濟學者信誓旦旦的均衡。

刪除認識函數所導致的影響究竟有多大?換句話說,因漠視參與者的偏向而導入的失真嚴重到什麼程度?

在微觀經濟分析中,這種失真可以忽略,參與者的偏向容易得到說明。第一步,參與者的偏向可以視為給定的,這提供了一個靜態均衡的圖式。為使分析更富於動態性,參與者偏向的變化可以逐一地引入以作出修正,其表述則為消費習慣或生產方式的變化。在這種零打碎敲式的做法掩蓋下的,則是供求曲線內部各種變化間的可能聯繫,不過,這種刪除並未導致微觀經濟分析中試圖確立的結論失去效力。

在金融市場中,這種失真變得嚴重起來了。參與者的偏向是確定價格的一個因素,市場行情的任何一個重要變化無不受到參與者偏向的影響。尋求均衡價格的行為必然是徒勞無益的,而關於均衡價格的理論本身卻有可能成為參與者偏向的一個極其豐富的來源。轉述J·P·摩根的話就是,金融市場將繼續波動。在試圖描述宏觀經濟運行時,均衡分析就完全不適用了,它主張參與者的決策以完備的知識為基礎,再也找不出比它更遠離現實的假設了。在現實生活中,人們只能在他們所能找到的隨便什麼路標的幫助下摸索著預測未來,而事件的結果常常和預期相左,從而導致不斷變化的預期和不斷變化的事件結果,這是一個反身性的過程。

股票市場中的反身性

我就用另外兩個主張取代了‘市場永遠正確’的迷信:

1)市場總是表現出某種偏向;

2)市場能夠影響它預期的事件;

市場中存在著為數眾多的參與者,他們的觀點必定是各不相同的,其中許多偏向彼此抵消了,剩下的就是我所謂的‘主流偏向’。

在此我將引進第二個簡化概念。假定存在著一個無論投資者是否意識到都將影響股票價格變化的‘基本趨勢’,其對於股票價格的影響及程度,視市場參與者的觀點而定,絕非一成不變。以這兩個概念作為基礎,就可以把股票價格的運動趨勢擬想成‘基本趨勢’和‘主流偏向’的合成。

這兩個因素如何相互作用呢?請讀者回憶一下前邊提到的兩種函數關係:參與函數和認識函數。基本趨勢通過認識函數影響參與者的認知,認知所引起的變化又通過參與函數影響情境。在股票市場中,首當其衝受到影響的就是股票價格,股票價格的變化又反過來對參與者的偏向和基本趨勢同時施加影響。

存在著一種反身性的關係,其中股票價格取決於兩個因素——基本趨勢和主流偏向——這兩者又反過來受股票價格的影響。股票價格和這兩個因素之間的相互作用不存在常數關係:在一個函數中的自變量到了另一個函數中就成為因變量。常數關係不存在,均衡的趨勢也就無從談起。市場事件的序列只能解釋為歷史性的變化過程,其中沒有一個變量——股票價格、基本趨勢、主流偏向——可以保持不變。在一個典型的市場事件序列中,三變量先是在一個方向上,接著又在另一個方向上彼此加強,繁榮與蕭條的交替,就是一個最簡單而又最熟悉的模式。

首先,定義幾個概念。如果股票價格的變化加強了基本趨勢,我們稱這個趨勢為自我加強的,當它們作用於相反的方向時,則稱之為自我矯正的。同樣的術語也適用於主流偏向,可能自我加強,也可能自我矯正。理解這些術語的意義是很重要的,當趨勢得到加強時,它就會加速,當偏向得到加強時,預期和未來股票價格的實際變化之間的差異就會擴大;反之,當它自我矯正時,差異就縮小。至於股票價格的變化,我們將它們簡單地描述為上升的和下降的,當主流偏向推動價格上漲時,我們稱其為積極的;當它作用於相反的方向時,則稱為消極的。上升的價格變化為積極的偏向所加強,而下降的價格變化為消極的偏向所加強,在一個繁榮/蕭條的序列中,我們可以指望找到至少一個上升的價格變化為積極偏向所加強的階段和一個下跌的價格變化為消極偏向所加強的階段。同時一定還存在著某一點,在這一點上基本趨勢和主流偏向聯合起來,扭轉了股票價格的變化方向。

現在已經可以建立一個初步的繁榮和蕭條的交替模型了。首先假設存在著尚未意識到的基本趨勢——儘管不能排除未反映在股票價格中的主流偏向存在的可能性,這意味著,主流偏向在開始時是消極的。起初是市場參與者意識到了基本趨勢,認識上的變化將(通過投資決策)影響股票的市場價格,股票價格的變化可能影響也可能影響不了基本趨勢,在後一種情況中,問題到此為止,無須進一步討論在前一種情況裡,我們進入了自我加強過程的起點。

加強的趨勢可能在兩個方向上左右主流偏向,它將導致進一步加速的預期或矯正的預期。如果是後者,經過股票價格變化的矯正,這個基本趨勢可能繼續也可能終止;如果是前者,則意味著一個積極的偏向發展起來,它將引起股票價格的進一步上漲和基本趨勢的加速發展。只要偏向是自我加強的,預期甚至比股票價格還要升得快。基本趨勢愈益受到股票價格的影響,與此同時,股票價格的上漲則愈益依賴主流偏向的支撐,從而造成基本趨勢與主流偏向兩者同時滑入極其脆弱的狀態,最後,價格的變化無法維持主流偏向的預期,於是進入了矯正過程。失望的預期對股票價格有一種消極的影響,不穩定的股票價格的變化削弱了基本趨勢。如果基本趨勢過度依賴股票價格的變化,那麼矯正就可能成為徹底的逆轉,在這種情況下,股票價格下跌,基本趨勢反轉,預期則跌落得還要快一些,這樣,自我加強的過程就朝相反的方向啟動了,最終,衰落也會達到極限並使自己重新反轉過來。典型的情況是,一個自我加強的過程在早期會進行適度的自我矯正,如果在矯正之後趨勢仍然得以持續,這一偏向將有機會得到加強和鞏固,且不易動搖。當這一過程繼續下去時,矯正行為就會逐漸減少,而在趨勢頂點逆轉的危險則增大了。

我在上面勾劃了一個典型的繁榮/蕭條的序列過程,它可以用兩條大致同向的曲線加以描述。一條代表股票價格,另一條代表每股收益,將收益曲線擬想成基本趨勢的一個標度,這是很自然的,兩條曲線之間的差距則是主流偏向的標示。具體的關係當然複雜得多。收益曲線不僅融合了基本趨勢,也融合了股票價格對該趨勢的影響。主流偏向僅僅部分地由兩條曲線之間的差距得到表示,其他部分反映在曲線本身當中。由於其表徵的現象只能部分地觀察到,這些概念在操作上困難極大,這也是為什麼選擇了可觀察的和可定量的變量的原因——雖然,後面將會談到,每股收益的可定量性是頗具迷惑力的。為了眼下的目的,我們假設投資商感興趣的“基本因素”就可以恰當地以每股收益來衡量。

這兩條曲線的一個典型走向可能如下圖所示(如圖49所示)。起初,對基本趨勢的認定將是在一定程度上滯後的,但該趨勢已經足夠強大,並且在每股收益中表現出來(A—B)。基本趨勢被市場認可後,開始得到上升預期的加強(B—C),此時,市場仍然非常謹慎,趨勢繼續發展,時而減弱時而加強,這樣的考驗可能反覆多次,在圖中只標出了一次(C—D)。結果,信心開始膨脹,收益的短暫挫折不至於動搖市場參與者的信心(D—E)。預期過度膨脹,遠離現實,市場無法繼續維持這一趨勢(E—F)。偏向被充分地認識到了,預期開始下降(F—G)。股票價格失去了最後的支持,暴跌開始了(G)。基本趨勢反轉過來,加強了下跌的力量。最後,過度的悲觀得到矯正,市場得以穩定下來(H—I)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖49 股票市場中的反身性

應該強調,這只是一條可能的路徑、產生於一個基本趨勢和一種主流偏向之間的相互作用。在現實中,基本趨勢可能不止一個,偏向內部也會有各種微妙的差別,事件的序列過程也可能會有迥然不同的路徑。關於模型的理論結構還可以說上幾句。我們感興趣的是參與者的偏向和事件實際過程之間的相互作用,然而參與者的偏向並沒有直接出現在模型中,兩條曲線都是實際事件過程的表現。主流偏向部分地融入了這兩條曲線之中,部分由它們之間的差異體現出來了。

這個結構的主要價值是它採用了可定量化的變量。股票價格充當了同參與者的偏向有關的情境的方便代表。在其他歷史過程中,同樣存在著通過認識函數和參與函數與參與者的認知發生內在聯繫的情境,但辨別和定量化的研究則困難得多。度量上的方便,使股市成為研究反身性現象的一個非常有效的實驗室。”

通過引用這麼長的一段話,作者希望大家對反身理論有一個瞭解,基本趨勢和主流偏向影響股票價格,而股票價格反過來也影響基本趨勢和主流偏向。假設市場中的主流偏向認為某一股票的價格會上漲,投機者會進行購買,從而引起股票的進一步上漲,導致更多的投機者購買,價格繼續上漲;當投機者認為股票不會繼續上漲後,會停止購買,股票價格會不變或下降;當投機者認為股票會下降時,會出售股票,導致股票價格下降,股票價格下降,導致更多的投機者出售股票,導致股票價格的進一步下降。投機者購買股票的動機是希望在股票上漲趨勢中低價購買,高價賣出,獲得利益;在股票下降趨勢中出售是希望在高價出售,減少損失。

反身理論描述的是一個典型的正反饋,股票價格的上升(下降)對未來股票價格的上升(下降)是一個促進作用(如圖50所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖50 索羅斯的股票反身理論模型

基本趨勢和主流偏向影響投機者對股票的購買和出售。假設現在的主流趨勢認為股票價格會上漲,他們會購入股票;由於他們購入股票,股票的價格上漲,從而加強了投機者認為股票會上漲的主流趨勢,從而使投機者增加了對這隻股票的購買(投機者希望在股票上漲的趨勢前期低價購入股票,在股票價格下降前出售股票,賺取差額)。而進一步的股票購買會使股價進一步上升,從而又對投機者認為股票價格上漲的趨勢是一個加強的作用。從而完成股票價格上升的正反饋過程。

由於股票的價格不可能無限上漲,股票價格和基本趨勢會減弱投機者認為股票會上漲的主流趨勢,最終導致主流趨勢的逆轉,主流趨勢開始認為股票價格會下跌,開始出售股票,從而導致股票價格下降;股票價格下降會增強投機者認為股票價格下跌的趨勢,從而出售更多的股票,導致股票的價格進一步的下跌。從而完成股票價格下跌的正反饋過程。

股票的價格會對投機者有2個反饋作用,其中一個是正反饋作用,增加投機者的投機趨勢。一個是負反饋作用,減少這個趨勢,符合需求定律的價格升高減少購買。

當股票價格上升時,價格的正反饋會使投機者認為股票價格會進一步上升,從而有增加購買的趨勢。而當股票價格上升時,獲得同樣股票的代價上升,股票的相對價值下降,會對投機者的購買有減弱的趨勢。投機者是在價值和投機上做權衡取捨,而大多數時候,投機行為所發揮的作用更大。

(10)正反饋在學習中的應用

為什麼打遊戲容易上癮,而學習卻不容易上癮?就像最簡單的單機版俄羅斯方塊,很多人也會上癮。遊戲讓人上癮有很多原因,包括及時的反饋和適度的增加難度。

人們最開始有著某種動力想去打俄羅斯方塊,然後投入精力和時間進行遊戲,你打得好或者壞的成績及時反饋給你,加上逐漸升級的難度,就會使得你容易上癮,然後投入更多的精力和時間進行遊戲,這就形成了打遊戲上癮的正反饋(如圖51所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖51 打遊戲上癮正反饋方框圖1

難度太大或者太小的遊戲會使得人們易於放棄。

遊戲廠家為了使得你對他們的遊戲更上癮,不是簡單的將成績反饋給你,而是還會對你進行正向激勵,比如獎勵你裝備等,它會使你產生更多的熱情,然後投入更多的精力和時間進行遊戲,形成了打遊戲上癮的正反饋(如圖52所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖52 打遊戲上癮正反饋方框圖2

企業家史玉柱總結了遊戲玩家的四大需求:榮耀、目標、互動和驚喜。其中目標就是在遊戲中設定要完成的目標,玩家完成後給獎勵,也就是正向激勵,驚喜指的是隨機驚喜,也是種正向激勵。

遊戲上癮的正反饋也可以用於學習之上,你由於某個初始的動力,投入精力和時間進行了學習,學習的成績挺好,得到了老闆的獎勵,這使得你的熱情增加,投入更多的精力和時間來學習(如圖53所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖53 學習成績好正反饋方框圖

某些學習好的人的正反饋是這樣建立的,他的學習成績挺好,其他不會的同學就向他請教問題,他在給別人講問題的時候更深刻的理解了這個知識,如果他也不會,他會投入更多的精力和時間把這個知識學明白,然後獲得更好的成績,給別人講知識是一種以教促學的方法,也就是費曼技巧。通過給別人講解,不僅使得自己更深刻的理解了知識,還得到了同學尊重的正向激勵,這使得他的熱情更高,投入更多精力好時間進行學習,從而形成學習的正反饋。

無論是打遊戲還是學習,都需要投入精力和時間,精力越旺盛,時間越長,獲得的成果越好,這是力在時間上的積累效應,也就是動量定理。如果我們再使用廣義動量定理進行分析的話,力不僅包括大小,還有方向和作用點,改變方向和作用點也能改變成果。所以無論是打遊戲還是學習,除了精力的大小和時間外,改變方法和聚焦也能增加成果,這也就是學習方法的重要性。比如使用費曼技巧或者番茄工作法進行學習,可以提高學習的成果。

著名學者普林斯頓心理學博士亞當·阿爾特在《欲罷不能:刷屏時代如何擺脫行為上癮》一書中列舉了六項行為上癮的構成要素,分別是:

1)誘人的目標;

2)不可抗拒的積極反饋;

3)毫不費力的進步;

4)逐漸升級的挑戰;

5)未完成的緊張感;

6)令人痴迷的社會互動。

史玉柱在《史玉柱自述:我的營銷心得》寫道遊戲策劃八字方針:榮耀、目標、互動、驚喜。

對比阿爾特的上癮要素和史玉柱的八字方針,我們會發現兩者有很多共同點,比如都包含目標,並且這個目標不能太難也不能太簡單,完成目標要給以正向的反饋。《欲罷不能》中直接提出了積極反饋,而史玉柱的反饋是包含在目標裡的。遊戲中的榮耀可以對應於學習好受到尊重,或者給別人講解難題獲得的自我滿足。兩者都包括互動,《欲罷不能》中說:“點贊是我們時代的可卡因”,facebook、推特、抖音、微博、朋友圈,幾乎所有流行的社交軟件都有點贊功能,這也是正向的反饋。

我們還可以通過一種更科學的方法來解釋,它就是心理上的“操作性條件反射”。操作性條件反射由美國著名的心理學家斯金納命名,是一種由刺激引起的行為改變。

我們來看看斯金納的實驗。斯金納抓了一隻老鼠放進箱子裡,箱子裡有一個槓桿,一壓槓桿就有個開關打開,有食物倒入食槽,老鼠見到食物就吃掉。一開始老鼠四處亂轉,轉的過程中無意中碰到了槓桿,出來了食物,老鼠就吃掉了食物。老鼠又亂轉碰到了槓桿吃到了食物,老鼠放學會了壓槓桿來獲得食物(如圖54示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖54 斯納金箱中的老鼠試驗

老鼠碰到槓桿而獲得食物的強化反饋,這使得老鼠學會壓槓桿。同樣的,學生的學習成績好,得到了正向激勵,這會使得學生更努力的去提高成績。

強化有很多種方式,比如變比率式強化。它是不按套路出牌,強化的出現與反應次數的比例是變化的。例如,第一次小鼠按壓二十次槓桿出現食物,第二次按壓三十次槓桿出現食物,第三次按壓十次出現食物……小老鼠按槓桿的學習行為沒有變化,小老鼠仍然會不停按按鈕,持續很久一段時間。這種強化有利於學習者的不斷提升。老虎機就是變比率式強化,拉下手柄後每次獲得的結果不同,有時會獲得獎勵,這和史玉柱所說的驚喜類似,都是不確定的強化。史玉柱說:“驚喜就是隨機性。有隨機性才是好遊戲,比如麻將,比如德州,比如俄羅斯方塊。但也要有努力,純隨機也不行,就如打牌,大家都發完牌後,大家都亮牌,誰點高誰贏錢,雖然隨機但不好玩,因為它不需要努力。”史玉柱所說的努力類似於小老鼠按壓槓桿,驚喜就是變比率式強化的食物。

斯金納通過實驗發現,動物的學習行為是隨著一個起強化作用的刺激而發生的。斯金納把動物的學習行為推而廣之到人類的學習行為上,他認為雖然人類學習行為的性質比動物複雜得多,但也要通過操作性條件反射。操作性條件反射的特點是:強化刺激既不與反應同時發生,也不先於反應,而是隨著反應發生。

我們可以通過使用八大思維圖示法中的橋形圖來類比學習和斯納金箱中老鼠的關係。學校中的學生就像斯納金箱中的老鼠,學習就如同於老鼠壓槓桿,正向激勵類似於食物,學生學會知識類似於老鼠學會壓槓桿。在老鼠學會壓槓桿的過程中,食物的正向強化非常重要;而在學生學會知識的過程中,正向的激勵也非常重要,這些激勵可能是老師的表揚、同學的尊重、獎學金等等。如果這個正向激勵是自我產生的,而不是外部賦予的,那麼學習的正反饋更容易持久(如圖55所示)。

世界五大學習方法之跨界學習法(思維網之正反饋)

圖55 學生學習和老鼠壓槓桿的類比

有機體必須先作出所希望的反應,然後得到“報酬”,即強化刺激,使這種反應得到強化。學習的本質不是刺激的替代,而是反應的改變。斯金納認為,人的一切行為幾乎都是操作性強化的結果,人們有可能通過強化作用的影響去改變別人的反應。在教學方面教師充當學生行為的設計師和建築師,把學習目標分解成很多小任務並且一個一個地予以強化,學生通過操作性條件反射逐步完成學習任務。斯金納認為學習是形成刺激和反應之間的聯結,人類絕大部分行為都屬於操作性行為,學習的過程就是操作性條件反射的形成過程。

斯納金的操作性條件反射也對程序教學起到了重要的影響,程序教學是指一種能讓學生以自己的速度和水平,學習自我教學性材料的個別化教學方法。程序教學有四個原則,分別是:1)積極反應原則;2)小步子原則;3)即時反饋原則;4)自定步調原則。積極反應原則就是學生產生一個反應,要給予強化以鞏固這個反應,並使學習者做出進一步反應,這也就是操作性條件反射。小步子原則就是拆分教材,一步一步完成,兩步之間難度相差很小。即時反饋原則是要讓學生立即知道自己的答案是否正確。自定步調原則是允許學生按照自己的情況來確定學習速度。

程序教學的四個原則中有些和上癮的要素是類似的,比如積極反應原則和不可抗拒的積極反饋是類似的,小步子原則和毫不費力的進步以及逐漸升級的挑戰是類似的。遊戲的設計和程序教學的四個原則也是類似的,遊戲中會有積極反應的原則,比如打死怪獸給獎勵;也有小步子原則,即設計的升級過程是一步一步的,難度是逐漸加大的。即時反饋就是你打怪獸,你能看到它在掉血而不是經過很久才反饋怪獸的狀態。自定步調是允許你按照你自己的情況進行遊戲,而不是隻能按照一種情況進行遊戲。

通過分析我們會發現,建立學習的正反饋,必須有正向的激勵,並且這個激勵是隨機激勵最好。

正反饋廣泛的存在於各個領域,學會了正反饋模型就可以觸類旁通,減少學習的成本,並且也可以使用正反饋思維對系統進行分析和優化。


分享到:


相關文章: