登錄

個人概率

百科 > 決策預(yù)測 > 個人概率

1.個人概率簡介

個人概率的意思自從17世紀(jì)貝努里一開始研究概率時就已經(jīng)產(chǎn)生了。實際上,概率(probability)這個英文字創(chuàng)造的初衷,就是用來處理主觀不確定性 的。

L·J·薩維奇和布魯諾·德費奈蒂在20世紀(jì)60年代和70年代,推導(dǎo)出了個人概率背后的許多數(shù)學(xué)模式。在20世紀(jì)60年代末期在北卡羅來納大學(xué)舉辦了一場統(tǒng)計學(xué)會議,會 上薩維奇在演講中曾闡述他的一部分想法。薩維奇認(rèn)為,世界上并沒有“已被證明的科學(xué)事實”這樣的事情。有的只是一些陳述,而那些自認(rèn)為是科學(xué)家的人對這些陳述持有很高的贊成概率。他舉例說,在場聽他演講的人對“地球是圓的”這項陳述一定持有很高的認(rèn)同概率,但若我們有機(jī)會對全世界的人做一次普查,則我們很可能發(fā)現(xiàn)在中國中部的許多農(nóng)民對上述陳述持有很低的概率。講到這里的時候,薩維奇不得不被迫停下來,因為校園里一群學(xué)生正在會堂外游行通過。他們還高喊著口號“停止上課!罷課!罷課!停止上課!”這些學(xué)生在要求全校的學(xué)生罷課,以抗議越南戰(zhàn)爭。等到他們走,四周又恢復(fù)平靜,薩維奇才看看窗外,然后說:“看來,我們可能是認(rèn)為地球是圓的人中的最后一代。”

個人概率有許多不同的版本。其中一個極端是薩維奇-德費奈蒂的方法,該方法認(rèn)為每個人都有其自己獨特的一套概率。而另一個極端則是凱恩斯的觀點,他認(rèn)為概率是一種信仰程度(the degree of belief),這種信仰是一個在特定的文化環(huán)境中一個有教養(yǎng)的人可能期望持有的信念。按照凱恩斯的觀點,一個特定文化環(huán)境中的所有人(薩維奇所說的科學(xué)家或中國中部的農(nóng)民)對某一特定的陳述,會持有一個一般的概率水平。由于這個概率水平取決于文化和時間,因此從某種絕對的意義上為說,很有可能這個適當(dāng)?shù)母怕仕绞清e的。

薩維奇和德費奈蒂則主張每個人都有自己特定的一套個人概率,他們還描述怎樣運用一種叫做“標(biāo)準(zhǔn)賭博”(standard gamble)的技巧把這種個人概率求出來。為了讓整個文化中的人能共享既定的一套概率,凱恩斯不得不弱化相關(guān)的數(shù)學(xué)定義,概率不再是一個精確的數(shù)字(例如67%),而是一種將想法排序的方法(例如,明天可能下雨的概率大于 可能下雪的概率)。

2.貝葉斯定理與個人概率[1]

不管個人概率的概念是如何被準(zhǔn)確定義的,貝葉斯定理在個人概率中的應(yīng)用方式,看上去與大多數(shù)的想法相吻合。貝葉斯方法一開始是假設(shè)在一個人的頭腦中有一組先驗概率(a prior set of probabilities),接下來這個人經(jīng)過觀測或?qū)嶒灝a(chǎn)生了數(shù)據(jù),然后再拿這組數(shù)據(jù)來修正先驗概率(prior probability),生成一組后驗概率(a posterior set of probabilities):

先驗概率 → 數(shù)據(jù) → 后驗概率

假設(shè)這個人想確定是否所有的大烏鴉都是黑的。她首先存有一些關(guān)于“這個陳述是真的”概率的先驗知識。例如,起初她可能對大烏鴉一無所知,對“所有大烏鴉都是黑的”這句話半信半疑,相信比例是50:50。數(shù)據(jù)則包括她對大烏鴉的觀測。假如她看到了一只大烏鴉,而且這只大烏鴉是黑色的,她的后驗概率就會增加。因此下一次她再觀測大烏鴉時,她的新的先驗概率(也就是上一次的后驗概率)就會大于50%,如果她繼續(xù)觀測大烏鴉而且都是黑的,這個概率還會繼續(xù)上升。

另一方面,一個人也有可能在進(jìn)行觀測之前就已經(jīng)帶著非常強(qiáng)的事前主見,其程度非常強(qiáng),需要有很大量的數(shù)據(jù)才能改變這個事前主見。在20世紀(jì)80年代,美國賓夕法尼亞州的三里島核電廠發(fā)生了近乎是災(zāi)難性的事故。反應(yīng)爐的操作員面對一個很大的操作盤,通過上面的各種儀表和指示燈來了解反應(yīng)爐的運轉(zhuǎn)情況。這些指示燈當(dāng)中有一些是警告燈,其中有的出過問題,以前曾經(jīng)發(fā)出過假的警告。當(dāng)時操作員有個事先的成見,當(dāng)他們看見任何一個新的警告燈亮?xí)r,總是認(rèn)為它是假的信號。結(jié)果,即使當(dāng)警告燈的型態(tài)及相關(guān)的指示器都一致顯示反應(yīng)爐的水位過低時,他們?nèi)匀恢弥焕怼K麄兊南闰灨怕侍珡?qiáng)了,以至于新的數(shù)據(jù)也無法使后驗概率產(chǎn)生多大的改變。

假定只有兩種可能性,就像前面署名有爭議的聯(lián)邦主義論文的例子:它不是麥迪遜寫的就是漢密爾頓寫的。于是,在應(yīng)用了貝葉斯定理之后,就會得到了一個先驗勝率(prior odds)與后驗勝率(posterior odds)之間的簡單關(guān)系,這里的數(shù)據(jù)可以歸納成一種稱為“貝葉斯因子”(Bayes factor)的東西。這是一種根本不用參考先驗勝率來刻畫數(shù)據(jù)的一種數(shù)學(xué)計算。有了這個計算工具,分析家就可以告訴讀者,插入任何他想要的先驗勝率,乘以計算出來的貝葉斯因子,再計算后驗勝率。莫斯特勒與華萊士對12篇署名有爭議的文章,每篇都是這樣處理的。

此外,他們對文章里的那些無特定含義的字出現(xiàn)的頻率,還進(jìn)行了兩種非貝葉斯分析。

這樣他們有了四種方法來判斷有爭議文章的作者:層次貝葉斯模型,計算的貝葉斯因子,以及兩個非貝葉斯分析方法。結(jié)果如何呢?所有12篇文章都壓倒性地指向麥迪遜。

實際上,如果使用計算的貝葉斯因子,那么對某幾篇文章來說,讀者認(rèn)為是漢密爾頓寫的先驗勝率可能要大于100000:1才有辦法讓后驗勝率為50:50。

評論  |   0條評論