登錄

判別分析

百科 > 判別分析

1.什么是判別分析

判別分析產(chǎn)生于20世紀(jì)30年代,是利用已知類別的樣本建立判別模型,為未知類別的樣本判別的一種統(tǒng)計(jì)方法。近年來,判別分析在自然科學(xué)、社會(huì)學(xué)及經(jīng)濟(jì)管理學(xué)科中都有廣泛的應(yīng)用。判別分析的特點(diǎn)是根據(jù)已掌握的、歷史上每個(gè)類別的若干樣本的數(shù)據(jù)信息,總結(jié)出客觀事物分類的規(guī)律性,建立判別公式和判別準(zhǔn)則。當(dāng)遇到新的樣本點(diǎn)時(shí),只要根據(jù)總結(jié)出來的判別公式和判別準(zhǔn)則,就能判別該樣本點(diǎn)所屬的類別。判別分析按照判別的組數(shù)來區(qū)分,可以分為兩組判別分析和多組判別分析。

2.判別分析的方法

判別分析(Discriminatory Analysis)的任務(wù)是根據(jù)已掌握的1批分類明確的樣品,建立較好的判別函數(shù),使產(chǎn)生錯(cuò)判的事例最少,進(jìn)而對(duì)給定的1個(gè)新樣品,判斷它來自哪個(gè)總體。

根據(jù)資料的性質(zhì),分為定性資料的判別分析和定量資料的判別分析;采用不同的判別準(zhǔn)則,又有費(fèi)歇、貝葉斯、距離等判別方法。

費(fèi)歇(FISHER)判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個(gè)適當(dāng)?shù)耐队拜S,使所有的樣品點(diǎn)都投影到這個(gè)軸上得到一個(gè)投影值。對(duì)這個(gè)投影軸的方向的要求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。

貝葉斯(BAYES)判別思想是根據(jù)先驗(yàn)概率求出后驗(yàn)概率,并依據(jù)后驗(yàn)概率分布作出統(tǒng)計(jì)推斷。所謂先驗(yàn)概率,就是用概率來描述人們事先對(duì)所研究的對(duì)象的認(rèn)識(shí)的程度;所謂后驗(yàn)概率,就是根據(jù)具體資料、先驗(yàn)概率、特定的判別規(guī)則所計(jì)算出來的概率。它是對(duì)先驗(yàn)概率修正后的結(jié)果。

距離判別思想是根據(jù)各樣品與各母體之間的距離遠(yuǎn)近作出判別。即根據(jù)資料建立關(guān)于各母體的距離判別函數(shù)式,將各樣品數(shù)據(jù)逐一代入計(jì)算,得出各樣品與各母體之間的距離值,判樣品屬于距離值最小的那個(gè)母體。

評(píng)論  |   0條評(píng)論