圣彼得堡悖論
1.圣彼得堡悖論概述
圣彼得堡悖論是決策論中的一個悖論。
圣彼得堡悖論是數(shù)學(xué)家丹尼爾·伯努利(Daniel Bernoulli)的表兄尼古拉·伯努利(Nicola Bernoulli)在1738提出的一個概率期望值悖論,它來自于一種擲幣游戲,即圣彼得堡游戲(表1)。設(shè)定擲出正面或者反面為成功,游戲者如果第一次投擲成功,得獎金2元,游戲結(jié)束;第一次若不成功,繼續(xù)投擲,第二次成功得獎金4元,游戲結(jié)束;這樣,游戲者如果投擲不成功就反復(fù)繼續(xù)投擲,直到成功,游戲結(jié)束。如果第n次投擲成功,得獎金2n元,游戲結(jié)束。按照概率期望值的計算方法,將每一個可能結(jié)果的得獎值乘以該結(jié)果發(fā)生的概率即可得到該結(jié)果獎值的期望值。游戲的期望值即為所有可能結(jié)果的期望值之和。隨著n的增大,以后的結(jié)果雖然概率很小,但是其獎值越來越大,每一個結(jié)果的期望值均為l,所有可能結(jié)果的得獎期望值之和,即游戲的期望值,將為“無窮大”。按照概率的理論,多次試驗的結(jié)果將會接近于其數(shù)學(xué)期望。但是實際的投擲結(jié)果和計算都表明,多次投擲的結(jié)果,其平均值最多也就是幾十元。正如Hacking(1980)所說:“沒有人愿意花25元去參加一次這樣的游戲?!边@就出現(xiàn)了計算的期望值與實際情況的“矛盾”,問題在哪里? 實際在游戲過程中,游戲的收費應(yīng)該是多少? 決策理論的期望值準(zhǔn)則在這里還成立嗎?這是不是給“期望值準(zhǔn)則”提出了嚴(yán)峻的挑戰(zhàn)? 正確認(rèn)識和解決這一矛盾對于人們認(rèn)識隨機(jī)現(xiàn)象、發(fā)展決策理論和指導(dǎo)實際決策無疑具有重大意義。、
圣彼得堡問題對于決策工作者的啟示在于,許多悖論問題可以歸為數(shù)學(xué)問題,但它同時又是一個思維科學(xué)和哲學(xué)問題。悖論問題的實質(zhì)是人類自身思維的矛盾性。從廣義上講,悖論不僅包括人們思維成果之間的矛盾,也包括思維成果與現(xiàn)實世界的明顯的矛盾性。對于各個學(xué)科各個層次的悖論的研究,歷來是科學(xué)理論發(fā)展的動力。圣彼得堡悖論所反映的人類自身思維的矛盾性,首先具有一定的哲學(xué)研究的意義;其次它反映了決策理論和實際之間的根本差別。人們總是不自覺地把模型與實際問題進(jìn)行比較,但決策理論模型與實際問題并不是一個東西;圣彼得堡問題的理論模型是一個概率模型,它不僅是一種理論模型,而且本身就是一種統(tǒng)計的 “近似的”模型。在實際問題涉及到無窮大的時候,連這種近似也變得不可能了。
2.實驗的論文解釋
丹尼爾·伯努利對這個悖論的解答在1738年的論文里,提出了效用的概念以挑戰(zhàn)以金額期望值為決策標(biāo)準(zhǔn),論文主要包括兩條原理:
1、邊際效用遞減原理:一個人對于財富的占有多多益善,即效用函數(shù)一階導(dǎo)數(shù)大于零;隨著財富的增加,滿足程度的增加速度不斷下降,效用函數(shù)二階導(dǎo)數(shù)小于零。
2、最大效用原理:在風(fēng)險和不確定條件下,個人的決策行為準(zhǔn)則是為了獲得最大期望效用值而非最大期望金額值。
3.圣彼得堡悖論的消解歷史
圣彼得堡悖論的提出已有200多年了,所提出的消解方法大致可以歸納為以下幾種觀點:
(一)邊際效用遞減論
Daniel Bernoulli在提出這個問題的時候就給 出一種解決辦法。他認(rèn)為游戲的期望值計算不應(yīng) 該是金錢,而應(yīng)該是金錢的期望效用,即利用眾所 周知的“期望效用遞減律”,將金錢的效用測度函數(shù) 用貨幣值的對數(shù)來表示:效用=log(貨幣值),如表 2所示。所有結(jié)果的效用期望值之和將為一個有 限值log(4)≈ 0.60206,如果這里的效用函數(shù)符合 實際,則理性決策應(yīng)以4元為界。這一解釋其實并 不能令人滿意。姑且假定“效用遞減律”是對的,金 錢的效用可以用貨幣值的對數(shù)來表示。但是如果 把獎金額變動一下,將獎金額提高為l0的2n次方(n=3時,獎金為108),則其效用的期望值仍為無 窮大,新的悖論又出現(xiàn)了 當(dāng)然,我們并不清楚效 用值與貨幣值之間究竟有什么樣的關(guān)系,不過只要 我們按照效用的2n倍增加獎金,悖論就總是存在。
(二)風(fēng)險厭惡論
圣彼得堡悖論對于獎金額大小沒有限制,比如 連續(xù)投擲40次才成功的話,獎金為1.1萬億元。 但是這一獎金出現(xiàn)的概率極小,1.1萬億次才可能 出現(xiàn)一次。實際上,游戲有一半的機(jī)會,其獎金為 2元,四分之三的機(jī)會得獎4元和2元。獎金越 少,機(jī)會越大,獎金越大,機(jī)會越小。如果以前面 Hacking所說?;?5元的費用冒險參與游戲?qū)⑹?非常愚蠢的,雖有得大獎的機(jī)會,但是風(fēng)險太大。 因此,考慮采用風(fēng)險厭惡因素的方法可以消解矛 盾。Pual Weirich就提出在期望值計算中加人一種 風(fēng)險厭惡因子,并得出了游戲費用的有限期望 值,認(rèn)為這種方法實際上解決了該悖論。
但是這種方法也并不十分完美。首先,并非所 有人都是風(fēng)險厭惡的,相反有很多人喜歡冒險。如 每期必買的彩票,以及Casino(卡西諾)紙牌游戲, 其價格都高于得獎的期望值。你也可以說這些喜 歡冒險買彩票和賭博的人是非理性的,可他們自有 樂趣,喜歡這樣的風(fēng)險刺激??傊?,風(fēng)險厭惡的觀 點很難解釋清楚實際游戲平均值非常有限的問題。退一步說,即便承認(rèn)風(fēng)險厭惡的觀點,矛盾仍 然不能消除。我們?nèi)匀豢梢哉{(diào)整獎金額,最后,考 慮風(fēng)險厭惡情況的期望值仍然是無窮大而與實際 情況不符。
(三)效用上限論
對前兩種觀點的反駁,我們采用了增加獎金額 的方法來補償效用的遞減和風(fēng)險厭惡,兩者均是假 定效用可以無限增加。也有一種觀點認(rèn)為獎金的 效用可能有一個上限,這樣,期望效用之和就有了 一個極限值。Menger認(rèn)為效用上限是惟一能消解 該悖論的方法。設(shè)效用值等于貨幣值,上限為100 單位,則游戲的期望效用為7.56l25,如表3所示。 也許這里的效用上限太小了,不過我們可以任意選 定一個更大的值比如225 。有多人如Russell Har—din (1982),W illiam G uNtaNon (1994),Richard Jeffrey(1983)等都贊成這樣的觀點。不過這 種效用上限的觀點似乎不太令人信服。效用上限 與效用遞減不同,或許你認(rèn)為有225 的錢夠自己花的了,可是錢并不能給我們帶來所有的效用,有些 東西不是錢所能買來的。效用上限意味著再也沒 有價值可以添加了。但是一個人有了錢,還希望他 的朋友、親戚也像他一樣富有;同一個城市里的人 和他一樣富有...。而效用上限論認(rèn)為到了這一 上限他們就不用再做任何交易了,看起來這并不能 成立。對有些人來講,似乎期望和需求并不是無限 增加的,對于現(xiàn)有的有限需求他們已經(jīng)滿足了。他 們覺得這里的游戲期望效用值確實是有限的。不 過是不是確實有這樣的人還是一個不確定的問題, 或者是個經(jīng)驗性的問題。但認(rèn)為“越多越好”的人 確實是存在的。對于決策準(zhǔn)則這樣的理性選擇的 理論,不能基于可疑的和經(jīng)驗性的判斷而加以限 制,因而期望有限論不足以消解這里的矛盾。
(四)結(jié)果有限論
Gustason認(rèn)為,要避免矛盾,必須對期望值概 念進(jìn)行限制,其一是限制其結(jié)果的數(shù)目;其二是把 其結(jié)果值的大小限制在一定的范圍內(nèi)。這是典型 的結(jié)果有限論,這一觀點是從實際出發(fā)的。因為實 際上,游戲的投擲次數(shù)總是有限的數(shù)。比如對游戲 設(shè)定某一個投擲的上限數(shù)L,在投擲到這個數(shù)的時 候,如果仍然沒有成功,也結(jié)束游戲,不管你還能再投多少,就按照L付錢。因為你即便不設(shè)定L,實 際上也總有投到頭的時候,人的壽命總是有限的, 任何原因都可以使得游戲中止。現(xiàn)在設(shè)定了上限, 期望值自然也就可以計算了。
問題是,這已經(jīng)不是原來的那種游戲了!同時 也并沒有證明原來的游戲期望值不是無限大。原 來的游戲到底存在嗎? Jeffrey說:“任何提供這一 游戲的人都是一個騙子,誰也沒有無限大的銀行!” 是說實際上沒有這種游戲嗎? 恐怕這也不見的。 如果我邀請你玩這種游戲,你說我實際上不是在這 樣做嗎? 或者說我實際上邀請你玩的不是這種游 戲而是另外的什么游戲? 很多游戲場提供許多概 率極小、獎金額極大幾乎不可能的游戲,他們?nèi)匀?在經(jīng)營、在賺錢,照樣吃飯睡覺,一點兒也不擔(dān)心哪 一天會欠下一屁股債,崩盤倒閉。
Jeffrey在這樣說的時候,實際上是承認(rèn)了圣 彼得堡游戲的期望值是無窮大了。認(rèn)為游戲廳不 提供這樣的游戲,正是因為他們認(rèn)為其期望值是無 窮大,遲早他們會因此而破產(chǎn)倒閉。這正是用了常 規(guī)的決策理論,而反過來又說這種游戲?qū)嶋H上不存 在,應(yīng)該排除在期望值概念之外。因此,用限制期 望值概念的方法并不能消解悖論。
不能限制期望值概念的原因還有很多。比如, 我們不能用限制期望值概念的方法僅把圣彼得堡 游戲排除在外,而應(yīng)該是通用的。在人壽保險中, 有一個險種根據(jù)保險人的年齡,每長一歲給付一定 的賠付金額。采用人類壽命的經(jīng)驗曲線給出每個 年齡的生存機(jī)會。大于140歲的生存率已經(jīng)沒有經(jīng) 驗可以借鑒,但可以采用一定的函數(shù)將生存年齡擴(kuò) 展至無窮大,當(dāng)然其生存率趨向于零。注意到這里 的給付金額也是無限的,但是其在期望值計算方面 并沒有出現(xiàn)什么問題。
4.對決策理論與現(xiàn)實的啟示
雖然圣彼得堡游戲問題只是一個具體問題,但 是類似的實際決策問題是存在的。它們起碼是可 觀察的,其觀察值確實也是存在的。而且它確實也 給決策的期望值準(zhǔn)則提出了挑戰(zhàn),所提出的問題需 要我們給予解答。通過上述問題的消解,我們至少 可以給出下列有關(guān)問題的答案和啟示。
首先,理論上應(yīng)該承認(rèn)圣彼得堡游戲的“數(shù)學(xué) 期望”是無窮大的。但理論與實際是有差別的,在 涉及無窮大決策問題的時候,必須注意這種差別。
其次,實際試驗中隨著游戲試驗次數(shù)的增加, 其均值將會越來越大,并與實驗次數(shù)呈對數(shù)關(guān)系, 即樣本均值=log2(實驗次數(shù))=log(實驗次數(shù))/log2。
再次,實際問題的解決還是要根據(jù)具體問題進(jìn) 行具體分析。前面的圣彼得堡悖論消解方法都是 很實用的方法。也--I以設(shè)計其他方法,比如可以運 用“實際推斷原理”,根據(jù)實驗次數(shù)n設(shè)定一個相應(yīng) 的“小概率”,對于圣彼得堡問題來講,是一個很實 際的方法;或者建立一個近似模型,比如確定一個 最大可能成功的投擲次數(shù)n,將投擲n+1次以后 的概率設(shè)為1 / 2k,仍然符合概率分布的條件(所有結(jié)果的概率之和等于1)等等。
最后,圣彼得堡問題對于決策工作者的啟示在 于,許多悖論問題可以歸為數(shù)學(xué)問題,但它同時又 是一個思維科學(xué)和哲學(xué)問題。悖論問題的實質(zhì)是 人類自身思維的矛盾性。從廣義上講,悖論不僅包 括人們思維成果之間的矛盾,也包括思維成果與現(xiàn) 實世界的明顯的矛盾性。對于各個學(xué)科各個層次 的悖論的研究,歷來是科學(xué)理論發(fā)展的動力。圣彼 得堡悖論所反映的人類自身思維的矛盾性,首先具 有一定的哲學(xué)研究的意義;其次它反映了決策理論 和實際之間的根本差別。人們總是不自覺地把模 型與實際問題進(jìn)行比較,但決策理論模型與實際問 題并不是一個東西;圣彼得堡問題的理論模型是 一個概率模型,它不僅是一種理論模型,而且本 身就是一種統(tǒng)計的 “近似的”模型。在實際問 題涉及到無窮大的時候,連這種近似也變得不可能了。
決策科學(xué)是一門應(yīng)用學(xué)科,它的研究需要自然 科學(xué)和社會科學(xué)的各種基礎(chǔ)理論和方法,包括數(shù)學(xué) 方法。這些方法都具有很強(qiáng)的理論性和高度抽象 性。但是,決策科學(xué)更是一門應(yīng)用性、實踐性很強(qiáng) 的學(xué)科,要求決策理論與決策實踐緊密結(jié)合。因 此,我們在決策理論的研究和解決實際問題的時 候,應(yīng)高度重視理論和實踐的關(guān)系。理論模型的建 立,既要源于實踐,又不能囿于實踐,發(fā)揮主觀創(chuàng)造 力,才能有所突破,有所建立。