抽樣調查有以下三個突出特點:
1、按隨機原則抽選樣本;
2、總體中每一個單位都有一定的概率被抽中;
3、可以用一定的概率來保證將誤差控制在規(guī)定的范圍之內。
3.抽樣調查方法的幾個主要常用的名詞
在抽樣調查中,常用的名詞主要有:
1、總體
總體是指所要研究對象的全體。它是根據(jù)一定研究目的而規(guī)定的所要調查對象的全體所組成的集合,組成總體的各研究對象稱之為總體單位。
2、樣本
樣本是總體的一部分,它是由從總體中按一定程序抽選出來的那部分總體單位所組成的集合。
3、抽樣框
抽樣框是指用以代表總體,并從中抽選樣本的一個框架,其具體表現(xiàn)形式主要有包括總體全部單位的名冊、地圖等。
抽樣框在抽樣調查中處于基礎地位,是抽樣調查必不可少的部分,其對于推斷總體具有相當大的影響。
4、抽樣比
抽樣比是指在抽選樣本時,所抽取的樣本單位數(shù)與總體單位數(shù)之比。
對于抽樣調查來說,樣本的代表性如何,抽樣調查最終推算的估計值真實性如何,首先取決于抽樣框的質量。
5、置信度
置信度也稱為可靠度,或置信水平、置信系數(shù),即在抽樣對總體參數(shù)作出估計時,由于樣本的隨機性,其結論總是不確定的。因此,采用一種概率的陳述方法,也就是數(shù)理統(tǒng)計中的區(qū)間估計法,即估計值與總體參數(shù)在一定允許的誤差范圍以內,其相應的概率有多大,這個相應的概率稱作置信度。
6、抽樣誤差
在抽樣調查中,通常以樣本作出估計值對總體的某個特征進行估計,當二者不一致時,就會產生誤差。因為由樣本作出的估計值是隨著抽選的樣本不同而變化,即使觀察完全正確,它和總體指標之間也往往存在差異,這種差異純粹是抽樣引起的,故稱之為抽樣誤差。
7、偏差
所謂偏差,也稱為偏誤,通常是指在抽樣調查中除抽樣誤差以外,由于各種原因而引起的一些偏差。
8、均方差
在抽樣調查估計總體的某個指標時,需要采用一定的抽樣方式和選擇合適的估計量,當抽樣方式與估計量確定后,所有可能樣本的估計值與總體指標之間離差平方的均值即為均方差。
4.幾種具體的抽樣方式
1、簡單隨機抽樣
簡單隨機抽樣也稱為單純隨機抽樣,是指從總體N個單位中任意抽取n個單位作為樣本,使每個可能的樣本被抽中的概率相等的一種抽樣方式。
簡單隨機抽樣一般可采用擲硬幣、擲骰子、抽簽、查隨機數(shù)表等辦法抽取樣本。在統(tǒng)計調查中,由于總體單位較多,前三種方法較少采用,主要運用后一種方法。
按照樣本抽選時每個單位是否允許被重復抽中,簡單隨機抽樣可分為重復抽樣和不重復抽樣兩種。在抽樣調查中,特別是社會經濟的抽樣調查中,簡單隨機抽樣一般是指不重復抽樣。
簡單隨機抽樣是其它抽樣方法的基礎,因為它在理論上最容易處理,而且當總體單位數(shù)N不太大時,實施起來并不困難。但在實際中,若N相當大時,簡單隨機抽樣就不是很容易辦到的。首先它要求有一個包含全部N個單位的抽樣框;其次用這種抽樣得到的樣本單位較為分散,調查不容易實施。因此,在實際中直接采用簡單隨機抽樣的并不多。
2、分層抽樣
分層抽樣又稱為分類抽樣、或類型抽樣,它首先是將總體的N個單位分成互不交叉、互不重復的k個部分,我們稱之為層;然后在每個層內分別抽選n1、n2、...... nk個樣本,構成一個容量為 個樣本的一種抽樣方式。
分層的作用主要有三:一是為了工作的方便和研究目的的需要;二是為了提高抽樣的精度;三是為了在一定精度的要求下,減少樣本的單位數(shù)以節(jié)約調查費用。因此,分層抽樣是應用上最為普遍的抽樣技術之一。
按照各層之間的抽樣比是否相同,分層抽樣可分為等比例分層抽樣與非等比例分層抽樣兩種。
實際上,分層抽樣是科學分組與抽樣原理的有機結合,前者是劃分出性質比較接近的層,以減少標志值之間的變異程度;后者是按照抽樣原理抽選樣本。因此,分層抽樣一般比簡單隨機抽樣和等距抽樣更為精確,能夠通過對較少的樣本進行調查,得到比較準確的推斷結果,特別是當總體數(shù)目較大、內部結構復雜時,分層抽樣常能取得令人滿意的效果。
3、整群抽樣
整群抽樣是首先將總體中各單位歸并成若干個互不交叉、互不重復的集合,我們稱之為群;然后以群為抽樣單位抽取樣本的一種抽樣方式。
整群抽樣特別適用于缺乏總體單位的抽樣框。應用整群抽樣時,要求各群有較好的代表性,即群內各單位的差異要大,群間差異要小。
整群抽樣的優(yōu)點是實施方便、節(jié)省經費;缺點是往往由于不同群之間的差異較大,由此而引起的抽樣誤差往往大于簡單隨機抽樣。
4、等距抽樣
等距抽樣也稱為系統(tǒng)抽樣、或機械抽樣,它是首先將總體中各單位按一定順序排列,根據(jù)樣本容量要求確定抽選間隔,然后隨機確定起點,每隔一定的間隔抽取一個單位的一種抽樣方式。
根據(jù)總體單位排列方法,等距抽樣的單位排列可分為三類:按有關標志排隊、按無關標志排隊以及介于按有關標志排隊和按無關標志排隊之間的按自然狀態(tài)排列。
按照具體實施等距抽樣的作法,等距抽樣可分為:直線等距抽樣、對稱等距抽樣和循環(huán)等距抽樣三種。
等距抽樣的最主要優(yōu)點是簡便易行,且當對總體結構有一定了解時,充分利用已有信息對總體單位進行排隊后再抽樣,則可提高抽樣效率。
5、多階段抽樣
多階段抽樣,也稱為多級抽樣,是指在抽取樣本時,分為兩個及兩個以上的階段從總體中抽取樣本的一種抽樣方式。其具體操作過程是:第一階段,將總體分為若干個一級抽樣單位,從中抽選若干個一級抽樣單位入樣;第二階段,將入樣的每個一級單位分成若干個二級抽樣單位,從入樣的每個一級單位中各抽選若干個二級抽樣單位入樣……,依此類推,直到獲得最終樣本。
多階段抽樣區(qū)別于分層抽樣,也區(qū)別于整群抽樣,其優(yōu)點在于適用于抽樣調查的面特別廣,沒有一個包括所有總體單位的抽樣框,或總體范圍太大,無法直接抽取樣本等情況,可以相對節(jié)省調查費用。其主要缺點是抽樣時較為麻煩,而且從樣本對總體的估計比較復雜。
6、雙重抽樣
雙重抽樣,又稱二重抽樣、復式抽樣,是指在抽樣時分兩次抽取樣本的一種抽樣方式,其具體為:首先抽取一個初步樣本,并搜取一些簡單項目以獲得有關總體的信息;然后,在此基礎上再進行深入抽樣。在實際運用中,雙重抽樣可以推廣為多重抽樣。
雙重抽樣的主要作用是提高抽樣效率、節(jié)約調查經費。
7、按規(guī)模大小成比例的概率抽樣
按規(guī)模大小成比例的概率抽樣,簡稱為PPS抽樣,它是一種使用輔助信息,從而使每個單位均有按其規(guī)模大小成比例的被抽中概率的一種抽樣方式。其抽選樣本的方法有漢森-赫維茨方法、拉希里方法等。
PPS抽樣的主要優(yōu)點是:使用了輔助信息,減少抽樣誤差;主要缺點是:對輔助信息要求較高,方差的估計較復雜等。
上述各種抽樣方式均為隨機抽樣方式。此外還有非隨機抽樣方式,即按照調查人員主觀設立的某個標準抽選樣本的抽樣方式,如偶遇抽樣、立意抽樣、配額抽樣等。