第22章 小數法則—樣本大小與統計結論(2)

我們知道,大數法則需要很大的樣本數才能發揮作用,基數越大,就越穩定。隨着樣本的增大,隨機變量對平均數的偏離是不斷下降的。所以,大醫院更穩定。這一基本的統計概念顯然與人們的直覺是不符的。

杜伊先生果然鑽進了圈套,他認爲較大的醫院有更多超過60%的新生兒是男孩的日子。

再沒有一種學問比概率更能讓專家洋相百出了。一個整天向學生灌輸大數法則的教授,自己居然不相信大數法則!

普通人又如何呢?

特韋斯基後來把這個問題做了嚴格的實驗。22%的受試者認爲較大的醫院有更多這樣的日子,而56%的受試者認爲兩個醫院有相等的可能性,僅僅22%的受試者正確地認爲較小的醫院會有更多這樣的日子。

很多研究者,其實也是“直覺型統計學家”,很多一本正經的調研數據,其實一文不值。因爲調查的樣本過小,就會產生很大的失誤。

就連丹尼爾·卡尼曼也忍不住自我檢討,他也和很多研究型心理學家一樣,曾犯過小數法則的錯誤。而且這種錯誤對於卡尼曼來說甚爲尷尬,因爲他也曾經教授過統計學。

小數法則

大數法則是統計學的基本常識,有人稱之爲“統計學的靈魂”。大數法則雖然威力無窮,普通人卻因它其貌不揚而將其忽視。

針對人們在思考時常常無視大數法則的現象,特韋斯基提出了“小數法則”的概念。“小數法則”不是什麼定律或法則,而是一種常見的心理誤區。

用錯誤的心理學“小數法則”代替了正確的概率論大數法則,這是人們賭博心理大增的緣由。

小數法則是一種心理偏差,是人們將小樣本中某事件的概率分佈看成是總體分佈。人們在具有不確定性的情形下,會抓住問題的某個特徵直接推斷結果,而不考慮這種特徵出現的真實概率以及與特徵有關的其他原因。

小數法則是一種直覺思維,很多情況下,它能幫助人們迅速地抓住問題的本質推斷出結果,但有時也會造成嚴重的偏差,特別是會忽視事件的無條件概率和樣本大小。

做生意,不要相信“小數法則”

愛因斯坦說:“上帝不擲骰子。”對上帝來說,一切都是確定的。

大數法則就是一種先驗概率,而天生是“概率盲”的人類,卻直覺地相信“小數法則”。

噹噹網網上商城的創辦人俞渝女士,曾在一個叫作《創業百問》的電視節目中,和郭廣昌這樣討論—

郭總剛纔講的,5個合夥人,15年可以同步進步,這事我覺得違反自然規律。這個團隊有人進步有人退步,有人進得多,有人退得少,這在經濟學上來講是一個大數法則。

以剛纔描述的現象,在我聽來,是一個小數法則的現象,小數法則裡頭有這種神話,而這種神話發生在您身上,那您很幸運,但是我覺得在其他正在建立團隊的人身上,去同樣複製的可能性很小。我覺得做企業,一定要看大數法則……

小貼士:

大數法則是一種統計定律;小數法則是一種心理偏差。

大數法則是一種科學;小數法則是一種迷信。

大數法則是中性詞;小數法則是貶義詞。

股神大哥的預測模式

行爲經濟學家馬修·拉賓曾假設:如果你是一位投資者,你親見一位基金經理在過去兩年中的投資業績好於平均情況。你是否就會得出這位經理要比一般經理優秀的結論?

然而真實的統計意義非常微弱。讓我們來看看股神大哥的預測模式。

第一週,發10000條短信,股神大哥預言某隻股票的漲跌。其中5000條說某隻股票漲,5000條說跌。

第二週,股神大哥向其中說對的5000人再發一條短信,其中2500條說某隻股票漲,2500條說某隻股票跌。

第三週,他再向說對的2500人發短信,其中1250條說某隻股票會漲,1250條說某隻股票會跌。

最後有1250人,發現這位股神大哥連續3次說對某隻股票的漲跌,簡直太崇拜了。其中有500人真的把錢交給他投資了。當然,如果賺錢是要分成的。

股神大哥拿到錢後會做什麼呢?他會給這500個不同的賬戶各買一隻股票,儘量讓這些股票各不相同。一段時間過後,股票有的漲,有的跌。

如果一個人的賬戶買了一隻漲的股票,他對股神大哥就會更加信賴,甚至還會追加投資。

假如碰到一個大牛市,大部分時間裡,大部分股票上漲概率大大超過下跌。因此,股神大哥的這種模式是非常有“錢途”的。

假如來了個大熊市,大部分股票在大部分時間下跌超過上漲,股神大哥也是不用負責的,大不了退出江湖而已。

賭客謬誤

小數法則的經典表現就是“賭客謬誤”。

李太太一連生了五個女兒。

李太太說:“希望我們下一個孩子是男孩。”

李先生說:“親愛的,都生了五個女兒了,下一個肯定是兒子。”

李先生說得對嗎?

衆所周知,擲硬幣正反面出現的概率爲50%,在擲硬幣遊戲中,如果前幾次大多數出現正面,那麼很多人會相信下一次投擲很可能出現反面。這就是賭客謬誤(gambler"sfallacy),也是很多賭客信心大增的原因。

賭客謬誤的產生,是因爲人們錯誤地詮釋了“大數法則”的平均律。投資者傾向於認爲大數法則適用於大樣本的同時,也適用於小樣本。

賭博是隨機事件。

一枚硬幣,連出三把都是正面,那麼下一把出反面的概率仍然不會大於50%。

從理論上講,硬幣也好,骰子也好,既沒有記憶,也沒有良心,概率法則支配一切。

隨便到一家合法的賭場,就能看到這種賭客“猜反正”的現象:

連輸幾次就該贏了;

連出幾次紅就感覺該出黑了;

連出幾次莊就以爲該出閒了;

連出幾張是小牌肯定該出大牌了;

……

這是很多賭客感覺能戰勝莊家的理論依據,甚至很多有學問的賭徒寫的“賭經”,都明顯帶有這種錯誤。

你可曾見賭客拿本子記錄百家樂出閒和莊?賭癮甚至可以讓一個天資平庸的賭徒變成統計學教授。

理論背景:雅各布與大數法則

雅各布·貝努利(JacobBernoulli)1654年生於瑞士,他沒有遵照父親的意思去當律師或經商,而是自學成爲一名數學家。

雅各布生活的時代,是一個牛人輩出的時代。例如約翰·阿布斯諾特(JohnArbuthnot),他是一位御醫,同時還是一位業餘數學家。他對概率十分感興趣,用豐富的病例來闡述他的觀點。他在一篇論文中,研究了“20歲的婦女是否有處女膜”的概率以及“20歲的花花公子沒得淋病”的概率。

這種學術風氣,促使雅各布開始留意概率問題。雅各布和牛頓生活在同一時代,他有着貝努利家族傳統的自負心態,他認爲他和牛頓不相上下。1703年雅各布·貝努利率先提出瞭如何從樣本中發現概率的問題。

雅各佈教授自己的弟弟約翰數學。約翰和雅各布一樣聰明,而且和他的哥哥一樣,他是個對名聲的追求近乎病態的人。

雅各布和弟弟約翰有一個習慣,就是對一個問題有競爭性地進行研究,並且在媒體中無情地攻擊對方。

雅各布雖然發現了大數法則,但由於兄弟倆在科學問題上過於激烈爭論,致使雙方的家庭也被捲入。以至於雅各布死後,他的《猜度術》手稿被他的遺孀和兒子在外藏匿多年,直到1713年才得以出版,幾乎使這部經典著作的價值受到損害。

《猜度術》是雅各布·貝努利一生最有創造力的著作。在這部著作中,他提出了概率論中的“貝努利定理”,該定理是“大數法則”的最早形式。

爲了說明大數法則,雅各布假設了一個裝滿30000枚白色石子和20000枚黑色石子的罐子,不知道每種顏色的石子的數目。

我們從罐子中,按不斷增加的數目取出石子,並在將它們放回瓶子之前,記錄每枚石子的顏色。

如果我們取出越來越多的石子,最終我們會得到“接受必然的可能性”,也就是說,在實際事件上是必然的,但又不是絕對的必然—兩種顏色石子的比率是3∶2。

雅各布的計算顯示,從瓶子中取出25550枚石子後,則有大於1000/1001的概率使其結果與真實結果(3∶2)間的差異在2%之內。也就是所謂的“接受必然的可能性”。

雅各布宣稱,我們可以對任何不確定的數量進行科學的預測了。如果我們能“先知”的話,那麼我們幾乎能很準確地判斷“事後”的事例的數目。

由於“大數法則”的極端重要性,1913年12月彼得堡科學院曾舉行慶祝大會,紀念“大數法則”誕生200週年。

《猜度術》是概率論的第一部奠基性著作,所含概率思想具有劃時代的重大意義,可謂對概率論作出了決定性的貢獻,推進了概率論的進一步發展。因而其出版是概率論成爲獨立數學分支的標誌。

第7章 禁臠效應—奢侈品與炫耀性消費(2)第4章 參照效應—沒有比較,就沒有鑑別(1)第22章 小數法則—樣本大小與統計結論(2)第6章 禁臠效應—奢侈品與炫耀性消費(1)第2章 損失厭惡—丟失的100元大於白撿的100元(2)第8章 心智分賬—掙到的100元大於白撿的100元(1)第5章 參照效應—沒有比較,就沒有鑑別(2)第20章 均值迴歸—可媲美萬有引力的一個發現第20章 均值迴歸—可媲美萬有引力的一個發現第22章 小數法則—樣本大小與統計結論(2)第6章 禁臠效應—奢侈品與炫耀性消費(1)第4章 參照效應—沒有比較,就沒有鑑別(1)第13章 錨定理論—隨意卻有效的參照暗示(2)第25章 理性原罪—多重選擇下的衝突第14章 樂觀偏見—自信、自負與拖延(1)第18章 窺測天機—風險探索簡史(1)第8章 心智分賬—掙到的100元大於白撿的100元(1)第22章 小數法則—樣本大小與統計結論(2)第7章 禁臠效應—奢侈品與炫耀性消費(2)第18章 窺測天機—風險探索簡史(1)第5章 參照效應—沒有比較,就沒有鑑別(2)第17章 時間折扣—今天的100元大於明天的100元(2)第27章 滿意指數—快樂與滿足的最大化(2)第6章 禁臠效應—奢侈品與炫耀性消費(1)第16章 時間折扣—今天的100元大於明天的100元(1)第23章 正態分佈—鐘形曲線的妙用與濫用(1)第11章 懊悔理論—懊悔規避與尋求自豪(2)第19章 窺測天機—風險探索簡史(2)第25章 理性原罪—多重選擇下的衝突第20章 均值迴歸—可媲美萬有引力的一個發現第27章 滿意指數—快樂與滿足的最大化(2)第27章 滿意指數—快樂與滿足的最大化(2)第22章 小數法則—樣本大小與統計結論(2)第7章 禁臠效應—奢侈品與炫耀性消費(2)第14章 樂觀偏見—自信、自負與拖延(1)第20章 均值迴歸—可媲美萬有引力的一個發現第12章 錨定理論—隨意卻有效的參照暗示(1)第16章 時間折扣—今天的100元大於明天的100元(1)第25章 理性原罪—多重選擇下的衝突第3章 風險悖論—謹慎和大膽,只是一體兩面第26章 滿意指數—快樂與滿足的最大化(1)第23章 正態分佈—鐘形曲線的妙用與濫用(1)第21章 小數法則—樣本大小與統計結論(1)第26章 滿意指數—快樂與滿足的最大化(1)第4章 參照效應—沒有比較,就沒有鑑別(1)第15章 樂觀偏見—自信、自負與拖延(2)第16章 時間折扣—今天的100元大於明天的100元(1)第2章 損失厭惡—丟失的100元大於白撿的100元(2)第7章 禁臠效應—奢侈品與炫耀性消費(2)第6章 禁臠效應—奢侈品與炫耀性消費(1)第6章 禁臠效應—奢侈品與炫耀性消費(1)第20章 均值迴歸—可媲美萬有引力的一個發現第19章 窺測天機—風險探索簡史(2)第16章 時間折扣—今天的100元大於明天的100元(1)第9章 心智分賬—掙到的100元大於白撿的100元(2)第3章 風險悖論—謹慎和大膽,只是一體兩面第20章 均值迴歸—可媲美萬有引力的一個發現第25章 理性原罪—多重選擇下的衝突第3章 風險悖論—謹慎和大膽,只是一體兩面第22章 小數法則—樣本大小與統計結論(2)第27章 滿意指數—快樂與滿足的最大化(2)第26章 滿意指數—快樂與滿足的最大化(1)第26章 滿意指數—快樂與滿足的最大化(1)第27章 滿意指數—快樂與滿足的最大化(2)第18章 窺測天機—風險探索簡史(1)第28章 九重幻象—認知與決策偏差(1)第3章 風險悖論—謹慎和大膽,只是一體兩面第11章 懊悔理論—懊悔規避與尋求自豪(2)第19章 窺測天機—風險探索簡史(2)第4章 參照效應—沒有比較,就沒有鑑別(1)第24章 正態分佈—鐘形曲線的妙用與濫用(2)第18章 窺測天機—風險探索簡史(1)第23章 正態分佈—鐘形曲線的妙用與濫用(1)第27章 滿意指數—快樂與滿足的最大化(2)第18章 窺測天機—風險探索簡史(1)第17章 時間折扣—今天的100元大於明天的100元(2)第16章 時間折扣—今天的100元大於明天的100元(1)第7章 禁臠效應—奢侈品與炫耀性消費(2)第17章 時間折扣—今天的100元大於明天的100元(2)第2章 損失厭惡—丟失的100元大於白撿的100元(2)第21章 小數法則—樣本大小與統計結論(1)第18章 窺測天機—風險探索簡史(1)第10章 懊悔理論—懊悔規避與尋求自豪(1)第17章 時間折扣—今天的100元大於明天的100元(2)第25章 理性原罪—多重選擇下的衝突第21章 小數法則—樣本大小與統計結論(1)第20章 均值迴歸—可媲美萬有引力的一個發現第1章 損失厭惡—丟失的100元大於白撿的100元(1)第27章 滿意指數—快樂與滿足的最大化(2)第28章 九重幻象—認知與決策偏差(1)第11章 懊悔理論—懊悔規避與尋求自豪(2)第23章 正態分佈—鐘形曲線的妙用與濫用(1)第22章 小數法則—樣本大小與統計結論(2)第4章 參照效應—沒有比較,就沒有鑑別(1)第9章 心智分賬—掙到的100元大於白撿的100元(2)第10章 懊悔理論—懊悔規避與尋求自豪(1)