登錄

統(tǒng)計推斷

百科 > 統(tǒng)計推斷

1.什么是統(tǒng)計推斷

統(tǒng)計在研究現(xiàn)象的總體數(shù)量關系時,需要了解的總體對象的范圍往往是很大的,有時甚至是無限的,而由于經(jīng)費、時間和精力等各種原因,以致有時在客觀上只能從中觀察部分單位或有限單位進行計算和分析,根據(jù)局部觀察結(jié)果來推斷總體。例如,要說明一批燈泡的平均使用壽命,只能從該批燈泡中抽取一小部分進行檢驗,推斷這一批燈泡的平均使用壽命,并給出這種推斷的置信程度。這種在一定置信程度下,根據(jù)樣本資料的特征,對總體的特征做出估計和預測的方法稱為統(tǒng)計推斷法。統(tǒng)計推斷是現(xiàn)代統(tǒng)計學的基本方法,在統(tǒng)計研究中得到了極為廣泛的應用,它既可以用于對總體參數(shù)的估計,也可以用作對總體某些分布特征的假設檢驗。

統(tǒng)計推斷是在概率論的基礎上依據(jù)樣本的有關數(shù)據(jù)和信息,對未知總體的質(zhì)量特性參數(shù),做出合理的判斷和估計。它的一般過程如圖l所示。

統(tǒng)計推斷

統(tǒng)計推斷有著廣泛的用途,幾乎遍及所有科學技術(shù)領域,在質(zhì)量管理活動中應用尤其普遍。因此,討論統(tǒng)計推斷是一個十分有意義的課題。

2.統(tǒng)計推斷的必要性

為什么我們不能直接研究對象的全部情況,而只能取得研究對象的部分信息來推斷和估計整體的某些規(guī)律呢?

1、在產(chǎn)品可靠性T程領域,研究某種產(chǎn)品在規(guī)定條件下和規(guī)定時間內(nèi)完成規(guī)定功能的概率時,通常要做破壞性檢驗和試驗,如燈泡的壽命測試、焊縫的強度檢驗、電視機無故障工作時間的確定等。我們只能通過抽取樣本,對樣本進行破壞性試驗后,推斷總體的可靠性指標。如果對所有產(chǎn)品進行破壞性檢測,就沒有產(chǎn)品可供銷售了,這違背了我們研究的本來目的。

2、還有一些研究對象,組成其整體的個體是無限多的,客觀上對全部個體進行觀察和檢驗是根本不可能的。如研究海水中微生物的情況時,不可能將全部海水都裝入試管中;分析魚池中全部活魚的重量與長度時,不能將池水抽干、逐條過秤等。因此,只能用隨機取樣統(tǒng)計推斷的方法。

3、有些情況對全部個體逐一研究、檢測是可以的,但需要付出非常多的財力、物力和時間。如自動化流水作業(yè)的生產(chǎn)過程,對每個產(chǎn)品進行檢測需要停機等。因此,我們也只能依賴于抽樣檢驗和調(diào)查,分析樣本后對整體做出判斷。

4、由于整體的不均勻性和樣本的隨機性,利用分析樣本得到的數(shù)據(jù)來推斷總體的情況必然會產(chǎn)生偏差。但是,在大多數(shù)情況下這種估計誤差的存在是合理的,也是可以容忍的。因為不同的問題有不同的精度要求,并不是所有問題都需要一個絕對準確的估量,也不是一切問題都能得到一個非常精確的結(jié)果,所以統(tǒng)計推斷是不可缺少的研究手段。

3.統(tǒng)計推斷的兩類錯誤

人們總是希望不犯錯誤,但是在統(tǒng)計推斷過程中不犯錯誤是不可能的。由于總體的不均勻性和樣本的隨機性,統(tǒng)計推斷必然存在風險(錯誤)。假設有一批未知質(zhì)量狀況的產(chǎn)品,現(xiàn)在隨機抽取其中的一個樣本,通過檢驗、分析樣本的質(zhì)量狀況,來推斷整批產(chǎn)品的質(zhì)量好壞,則可能出現(xiàn)如表3所示的四種情況。

統(tǒng)計推斷

A、假定這批產(chǎn)品質(zhì)量是好的,通過檢驗樣本發(fā)現(xiàn)樣本質(zhì)量也是好的,則推斷該批產(chǎn)品質(zhì)量好而決定接收。顯然,這個統(tǒng)計推斷是完全正確的。B、假定這批產(chǎn)品質(zhì)量不好,通過檢驗發(fā)現(xiàn)樣本質(zhì)量不好,則推斷該批產(chǎn)品質(zhì)量不好而拒收。該統(tǒng)計推斷結(jié)論也是合理的。C、如果該批產(chǎn)品質(zhì)量是好的,而通過檢驗樣本發(fā)現(xiàn)樣本質(zhì)量是壞的,則推斷該批產(chǎn)品質(zhì)量不好而拒收,就犯了“棄真”的錯誤,習慣上把它稱做第Ⅰ類錯誤。D、如果該批產(chǎn)品質(zhì)量不好,通過檢驗樣本發(fā)現(xiàn)樣本質(zhì)量是好的,則推斷該批產(chǎn)品質(zhì)量好而予以接收,則犯了“取偽”的錯誤,通常將其稱做第Ⅱ類錯誤。

犯錯誤就會造成損失,就會發(fā)生預測失誤、判斷失誤,就會導致不希望結(jié)果的發(fā)生。在統(tǒng)計推斷過程中上述兩類錯誤總是此漲彼消不可避免的,我們的原則是控制兩類錯誤帶來的損失最小且已知。

在不同的統(tǒng)計推斷過程中,對上述兩類錯誤有著不同的描述。在用控制圖進行統(tǒng)計過程控制中,第Ⅰ類錯誤叫“虛發(fā)警報”,即生產(chǎn)正常而點子偶然超出控制界限,依此就判異而犯“棄真”錯誤;第Ⅱ類錯誤叫“漏發(fā)警報”,即過程已經(jīng)異常,有部分點子仍位于控制界限內(nèi)。依此判過程正常而犯“取偽”錯誤。在抽樣檢驗過程中,第Ⅰ類錯誤為生產(chǎn)方風險,即對于給定的抽樣方案,當質(zhì)量水平為某一指定的可接收質(zhì)量時被拒收的概率,此時生產(chǎn)方遭受損失;第Ⅱ類錯誤為使用方風險,即對于給定的抽樣方案,當質(zhì)量水平為某一指定的不滿意質(zhì)量時被接收的概率,此時使用方承受損失。在假設檢驗過程中,犯兩類錯誤的情況如表4。

統(tǒng)計推斷

當原假設H0成立時,由于樣本觀察值落人拒絕域W中而誤認為H0不成立,犯“棄真”錯誤;當原假設H0實際上不成立,由于樣本觀察值未落人拒絕域W而誤認為H0成立,犯“取偽”錯誤。

4.統(tǒng)計推斷提高準確性的途徑

個體是總體的一部分,局部的特性能反映全局的特點,但是,由于總體的不均勻性和樣本的隨機性,又使得樣本不能精確地反映總體。因此,抽取部分個體經(jīng)分析得出有關總體的結(jié)論存在著差錯和不可靠。從理論上講有兩種途徑可以消除和減少這種差錯。其一,使總體最大限度地均勻??傮w是我們要研究的未知事物,我們往往不可能改變他的均勻性,當能夠使其達到理想的均勻時,已經(jīng)完全掌握了它,沒有研究的必要了。其二,采取適當?shù)某闃臃椒ù_保抽樣的“代表性”,可有效地控制和提高統(tǒng)計推斷的可靠性和正確性。

隨機抽樣的方法很多,常用的有:

1、簡單隨機抽樣

簡單隨機抽樣,是指抽樣過程應獨立進行并且總體中每個個體被抽到的機會均等。隨機抽樣不是隨便抽取,隨便抽取容易受到個人好惡的影響。為實現(xiàn)隨機化,可采取抽簽、擲隨機數(shù)骰子或查隨機數(shù)值表等辦法。如從100件產(chǎn)品中隨機抽取l0件組成樣本,可以把這100件產(chǎn)品從l開始編號直到100號,然后用抓鬮的辦法任意抽出l0個編號,由這l0個編號代表的產(chǎn)品組成樣本。此種抽樣方法的優(yōu)點是抽樣誤差小,缺點是手續(xù)繁雜。在實踐中真正做到每個個體被抽到的機會相等是不容易的。

2、周期系統(tǒng)抽樣

周期系統(tǒng)抽樣,又叫等距抽樣或機械抽樣,即將總體按順序編號,用抽簽或查隨機數(shù)值表的方法確定首件,進而按等距原則依次抽取樣本。如從120個零件中取五個做樣本,先按生產(chǎn)順序給產(chǎn)品編號,用簡單隨機抽樣法確定首件,然后按每隔24(由120÷5=24得)個號碼抽取一個,共抽取五個組成樣本。這種方法特別適用于流水線上取樣,操作簡便,實施起來不易出現(xiàn)差錯。但抽樣起點一經(jīng)確定,整個樣本就完全固定。對總體質(zhì)量特性含有某種周期性變化,而當抽樣間隔恰好與質(zhì)量特性變化周期吻合時,就可能得到一個偏差很大的樣本。

3、分層抽樣法

分層抽樣法,即從一個可以分成不同子總體的總體中,按規(guī)定比例從不同層中隨機抽取個體的方法。當不同設備、不同環(huán)境生產(chǎn)同一種產(chǎn)品時,由于條件差別產(chǎn)品質(zhì)量可能有較大差異,為了使所抽取的樣本具有代表性,可以將不同條件下生產(chǎn)的產(chǎn)品組成組,使同一組內(nèi)產(chǎn)品質(zhì)量均勻,然后在各組內(nèi)按比例隨機抽取樣品合成一個樣本。這種抽樣方法得到的樣本代表性比較好,抽樣誤差較小,缺點是抽樣手續(xù)較繁,常用于產(chǎn)品質(zhì)量檢驗。

4、整群抽樣法

這種方法是先將總體按一定方式分成多個群,然后隨機地抽取若干群并由這些群中的所有個體組成樣本。如按照生產(chǎn)過程將1000個零件分別裝入2O個箱中,每箱5O個,然后隨機抽取一箱,此箱中5O個零件組成樣本。這種抽樣方法實施方便,但樣本來自個別群體而不能均勻分布在總體中,因而代表性差,抽樣誤差較大。

評論  |   0條評論