個人概率

1.個人概率簡介

個人概率的意思自從17世紀(jì)貝努里一開始研究概率時就已經(jīng)產(chǎn)生了。實際上，概率（probability）這個英文字創(chuàng)造的初衷，就是用來處理主觀不確定性的。

L·J·薩維奇和布魯諾·德費奈蒂在20世紀(jì)60年代和70年代，推導(dǎo)出了個人概率背后的許多數(shù)學(xué)模式。在20世紀(jì)60年代末期在北卡羅來納大學(xué)舉辦了一場統(tǒng)計學(xué)會議，會上薩維奇在演講中曾闡述他的一部分想法。薩維奇認(rèn)為，世界上并沒有“已被證明的科學(xué)事實”這樣的事情。有的只是一些陳述，而那些自認(rèn)為是科學(xué)家的人對這些陳述持有很高的贊成概率。他舉例說，在場聽他演講的人對“地球是圓的”這項陳述一定持有很高的認(rèn)同概率，但若我們有機(jī)會對全世界的人做一次普查，則我們很可能發(fā)現(xiàn)在中國中部的許多農(nóng)民對上述陳述持有很低的概率。講到這里的時候，薩維奇不得不被迫停下來，因為校園里一群學(xué)生正在會堂外游行通過。他們還高喊著口號“停止上課！罷課！罷課！停止上課！”這些學(xué)生在要求全校的學(xué)生罷課，以抗議越南戰(zhàn)爭。等到他們走，四周又恢復(fù)平靜，薩維奇才看看窗外，然后說：“看來，我們可能是認(rèn)為地球是圓的人中的最后一代。”

個人概率有許多不同的版本。其中一個極端是薩維奇－德費奈蒂的方法，該方法認(rèn)為每個人都有其自己獨特的一套概率。而另一個極端則是凱恩斯的觀點，他認(rèn)為概率是一種信仰程度（the degree of belief），這種信仰是一個在特定的文化環(huán)境中一個有教養(yǎng)的人可能期望持有的信念。按照凱恩斯的觀點，一個特定文化環(huán)境中的所有人（薩維奇所說的科學(xué)家或中國中部的農(nóng)民）對某一特定的陳述，會持有一個一般的概率水平。由于這個概率水平取決于文化和時間，因此從某種絕對的意義上為說，很有可能這個適當(dāng)?shù)母怕仕绞清e的。

薩維奇和德費奈蒂則主張每個人都有自己特定的一套個人概率，他們還描述怎樣運用一種叫做“標(biāo)準(zhǔn)賭博”（standard gamble）的技巧把這種個人概率求出來。為了讓整個文化中的人能共享既定的一套概率，凱恩斯不得不弱化相關(guān)的數(shù)學(xué)定義，概率不再是一個精確的數(shù)字（例如67%），而是一種將想法排序的方法（例如，明天可能下雨的概率大于可能下雪的概率）。

2.貝葉斯定理與個人概率[1]

不管個人概率的概念是如何被準(zhǔn)確定義的，貝葉斯定理在個人概率中的應(yīng)用方式，看上去與大多數(shù)的想法相吻合。貝葉斯方法一開始是假設(shè)在一個人的頭腦中有一組先驗概率（a prior set of probabilities），接下來這個人經(jīng)過觀測或?qū)嶒灝a(chǎn)生了數(shù)據(jù)，然后再拿這組數(shù)據(jù)來修正先驗概率（prior probability），生成一組后驗概率（a posterior set of probabilities）：

先驗概率 → 數(shù)據(jù) → 后驗概率

假設(shè)這個人想確定是否所有的大烏鴉都是黑的。她首先存有一些關(guān)于“這個陳述是真的”概率的先驗知識。例如，起初她可能對大烏鴉一無所知，對“所有大烏鴉都是黑的”這句話半信半疑，相信比例是50：50。數(shù)據(jù)則包括她對大烏鴉的觀測。假如她看到了一只大烏鴉，而且這只大烏鴉是黑色的，她的后驗概率就會增加。因此下一次她再觀測大烏鴉時，她的新的先驗概率（也就是上一次的后驗概率）就會大于50%，如果她繼續(xù)觀測大烏鴉而且都是黑的，這個概率還會繼續(xù)上升。

另一方面，一個人也有可能在進(jìn)行觀測之前就已經(jīng)帶著非常強(qiáng)的事前主見，其程度非常強(qiáng)，需要有很大量的數(shù)據(jù)才能改變這個事前主見。在20世紀(jì)80年代，美國賓夕法尼亞州的三里島核電廠發(fā)生了近乎是災(zāi)難性的事故。反應(yīng)爐的操作員面對一個很大的操作盤，通過上面的各種儀表和指示燈來了解反應(yīng)爐的運轉(zhuǎn)情況。這些指示燈當(dāng)中有一些是警告燈，其中有的出過問題，以前曾經(jīng)發(fā)出過假的警告。當(dāng)時操作員有個事先的成見，當(dāng)他們看見任何一個新的警告燈亮?xí)r，總是認(rèn)為它是假的信號。結(jié)果，即使當(dāng)警告燈的型態(tài)及相關(guān)的指示器都一致顯示反應(yīng)爐的水位過低時，他們?nèi)匀恢弥焕怼Ｋ麄兊南闰灨怕侍珡?qiáng)了，以至于新的數(shù)據(jù)也無法使后驗概率產(chǎn)生多大的改變。

假定只有兩種可能性，就像前面署名有爭議的聯(lián)邦主義論文的例子：它不是麥迪遜寫的就是漢密爾頓寫的。于是，在應(yīng)用了貝葉斯定理之后，就會得到了一個先驗勝率（prior odds）與后驗勝率（posterior odds）之間的簡單關(guān)系，這里的數(shù)據(jù)可以歸納成一種稱為“貝葉斯因子”（Bayes factor）的東西。這是一種根本不用參考先驗勝率來刻畫數(shù)據(jù)的一種數(shù)學(xué)計算。有了這個計算工具，分析家就可以告訴讀者，插入任何他想要的先驗勝率，乘以計算出來的貝葉斯因子，再計算后驗勝率。莫斯特勒與華萊士對12篇署名有爭議的文章，每篇都是這樣處理的。

此外，他們對文章里的那些無特定含義的字出現(xiàn)的頻率，還進(jìn)行了兩種非貝葉斯分析。

這樣他們有了四種方法來判斷有爭議文章的作者：層次貝葉斯模型，計算的貝葉斯因子，以及兩個非貝葉斯分析方法。結(jié)果如何呢？所有12篇文章都壓倒性地指向麥迪遜。

實際上，如果使用計算的貝葉斯因子，那么對某幾篇文章來說，讀者認(rèn)為是漢密爾頓寫的先驗勝率可能要大于100000：1才有辦法讓后驗勝率為50：50。

評論 | 0條評論

評論

經(jīng)理人分享

個人概率

目錄

1.個人概率簡介

2.貝葉斯定理與個人概率[1]