抽樣
1.什么是抽樣
抽樣就是從研究總體中選取一部分代表性樣本的方法。例如我們要研究某城市居民的生活方式問題,那么整個城市居民都是我們的研究對象。但限于研究條件等原因,我們難以對每一個居民進行調(diào)查研究,而只能采用一定的方法選取其中的部分居民作為調(diào)查研究的對象,這種選擇調(diào)查研究對象的過程就是抽樣。采用抽樣法進行的調(diào)查就稱為抽樣調(diào)查。抽樣調(diào)查是最常用的調(diào)查研究方法之一,它已被廣泛應用到社會調(diào)查、市場調(diào)查和輿論調(diào)查等多個領(lǐng)域。
抽樣對調(diào)查研究來說至關(guān)重要。社會科學研究的對象通常是非常復雜的,涉及到社會生活的方方面面,既包括個體行動者,也包括群體甚至整個社區(qū)或社會。但在大多數(shù)情況下,我們難以對全部的對象做研究,而只能研究其中的一部分。對這部分研究對象的選擇就要依靠抽樣來完成,如此可以節(jié)省研究的成本和時間。但我們的研究又不是停留在所選取的樣本本身,而是通過對有代表性的樣本的分析來研究總體。故抽樣的目的,就是從研究對象總體中抽選一部分作為代表進行調(diào)查分析,并根據(jù)這一部分樣本去推論總體情況。
2.抽樣類型
根據(jù)概率論原理常用的抽樣形式主要分為隨機抽樣和非隨機抽樣兩大類。二者的區(qū)別在于:前者按照隨機原則來抽取樣本,而后者不按隨機原則抽取樣本。
(一)隨機抽樣
隨機抽樣又稱概率抽樣,是指嚴格按照隨機原則來抽取樣本,要求總體中每個單位都有被抽取的同等機會。由隨機抽樣所抽取的樣本稱為隨機樣本,這類樣本具有較高的代表性。隨機抽樣法又分為下列五種不同的抽樣方法:
1、簡單隨機抽樣
簡單隨機抽樣,也稱純隨機抽樣,是指按照隨機原則從總體單位中直接抽取若干單位組成樣本。它是最基本的概率抽樣形式,也是其他幾種隨機抽樣方法的基礎(chǔ)。
2、等距隨機抽樣
等距隨機抽樣也稱機械隨機抽樣或系統(tǒng)隨機抽樣,是指按照一定的間隔,從根據(jù)一定的順序排列起來的總體單位中抽取樣本的一種方法。具體做法是:首先將總體各單位按照一定的順序排列起來,編上序號;然后用總體單位數(shù)除以樣本單位數(shù)得出抽樣間隔;最后采取簡單隨機抽樣的方式在第一個抽樣間隔內(nèi)隨機抽取一個單位作為第一個樣本,再依次按抽樣間隔做等距抽樣,直到抽取最后一個樣本為止。
3、分層隨機抽樣
分層隨機抽樣,也稱類型隨機抽樣,是指首先將調(diào)查對象的總體單位按照一定的標準分成各種不同的類別(或組),然后根據(jù)各類別(或組)的單位數(shù)與總體單位數(shù)的比例確定從各類別(或組)中抽取樣本的數(shù)量,最后按照隨機原則從各類(或組)中抽取樣本。
4、整群隨機抽樣
整群隨機抽樣,又稱聚類抽樣,是先把總體分為若干個子群,然后一群一群地抽取作為樣本單位。它通常比簡單隨機抽樣和分層隨機抽樣更實用,像后者那樣,它也需要將總體分成類群,所不同的是,這些分類標準往往是特殊的。具體做法是:先將各子群體編碼,隨機抽取分群數(shù)碼,然后對所抽樣本群或組實施調(diào)查。因此,整群抽樣的單位不是單個的分子,而是成群成組的。凡是被抽到的群或組,其中所有的成員都是被調(diào)查的對象。這些群或組可以是一個家庭、一個班級,也可以是一個街道、一個村莊。
5、分段隨機抽樣
分段隨機抽樣,也稱多段隨機抽樣或階段隨機抽樣,是一種分階段從調(diào)查對象的總體中抽取樣本進行調(diào)查的方法。它首先要將總體單位按照一定的標準劃分為若干群體,作為抽樣的第一級單位;再將第一級單位分為若干小的群體,作為抽樣的第二級單位;以此類推,可根據(jù)需要分為第三級或第四級單位。然后,按照隨機原則從第一級單位中隨機抽取若干單位作為第一級單位樣本,再從第一級單位樣本中隨機抽取若干單位作為第二級單位樣本,以此類推,直至獲得所需要的樣本。
(二)非隨機抽樣
在實際的調(diào)查過程中,還有一類抽樣方法,稱之為非隨機抽樣,即它不是嚴格按照隨機原則抽取樣本,而是根據(jù)調(diào)查者的主觀經(jīng)驗和主觀判斷選擇樣本的。
與隨機抽樣相比,雖然這類非隨機動抽樣的代表性差,提供的資料信息較零散,難以從樣本調(diào)查的結(jié)論中對總體做出準確的推斷。但是,由于它非常簡便易行,并能通過對樣本的調(diào)查而大致了解總體的某些情況,對調(diào)查研究工作很有啟發(fā)性。因此,它適用于那種調(diào)查對象的總體難以具體界定,以及不需要準確推斷總體情況的調(diào)查。常用非隨機抽樣的方法主要有以下幾種:
1、偶遇抽樣
偶遇抽樣,也稱方便抽樣,是指調(diào)查者將自己在特定場合下偶然遇到的對象作為樣本的一種方法。如在商店門口、街頭路口、車站碼頭、公園廣場等公共場所,隨便選取某些顧客、行人、旅客、觀眾等作為樣本進行調(diào)查研究.這種方法比較簡單方便,適用于探索性研究,但樣本的代表性較差,具有很大的偶然性。
2、立意抽樣
立意抽樣,也稱主觀抽樣,它是調(diào)查者根據(jù)自己的主觀印象、以往的經(jīng)驗和對調(diào)查對象的了解來選取樣本的一種方法;這種抽樣適用于那些總體范圍較小、總體單位之間的差異較大的調(diào)查。
這種主觀抽樣所抽取的樣本是否具有代表性、所得出的結(jié)論是否準確,完全取決于調(diào)查者本人的判斷能力,以及對調(diào)查對象的了解程度。因此這種方法具有很大的主觀隨意性。但是當對總體狀況較為熟悉時,用這一抽樣法所選擇的樣本也有較高的代表性。例如當在們對某一群體作調(diào)查時,就可以根據(jù)我們所了解的群體情況選取某些樣本做研究。
3、配額抽樣
配額抽樣,也稱定額抽樣,即調(diào)查者首先確定所要抽取樣本的數(shù)量,再按照一定的標準和比例分配樣本,然后從符合標準的對象中任意地抽取樣本。其方法類似于分層隨機抽樣,但它不是按照隨機原則抽取樣本。例如,我們可以根據(jù)研究目的,把總體按性別、民族等變量進行分組,然后分配相應的樣本數(shù)選取樣本。
這種配額抽樣比前兩種方法所抽取的樣本更有代表性,而且簡便易行,在民意調(diào)查中經(jīng)常使用。但這種方法也具有很大的主觀隨意性和局限性,如蓋洛普采用此抽樣法曾幾次成功地預測了美國的總統(tǒng)大選,但在1948年總統(tǒng)選舉的民意調(diào)查中卻失敗了。現(xiàn)在,人們有時把這一方法與隨機抽樣法結(jié)合起來使用,其效果會更好些。
4、滾雪球抽樣
滾雪球抽樣,即以少量樣本為基礎(chǔ),逐漸擴大樣本的規(guī)模,直至找出足夠的樣本。此法適用于對調(diào)查總體不甚清楚的情況,常用于探索性的實地研究,特別適用于對小群體關(guān)系的研究。例如我們要了解某個人經(jīng)常交往的社會圈子,就可以通過這個人提供的線索找到更多與他有關(guān)聯(lián)的人。
其具體做法是,先找到一個或幾個符合研究目的的對象,然后再根據(jù)這些對象所提供的線索找另外相關(guān)的對象,依次進行,直至達到研究目的。但滾雪球抽樣法所選擇的樣本有時會有很大的隨意性和特殊性,因而代表性不高。
3.抽樣設(shè)計與程序
在社會科學研究過程中,抽樣是必不可少的重要環(huán)節(jié)。這就要求必須做好抽樣設(shè)計,使所選擇的樣本具有代表性。抽樣設(shè)計就是確定抽樣的原理與形式、程序和方法等。其基本原則是:第一,目的性,即根據(jù)研究目的進行抽樣設(shè)計;第二,可度量性,即根據(jù)樣本值能做出有效的估計;第三,可行性,即在實際操作中能按預定的設(shè)計完成任務(wù);第四,經(jīng)濟性,即以最小的代價去實現(xiàn)抽樣的目的。
(一) 抽樣的原理與形式
抽樣通常分為概率抽樣和非概率抽樣兩大類,但以概率抽樣為主。概率抽樣的基本原理首先是概率論的隨機原理,所謂隨機原理,是指抽取樣本時必須嚴格遵循一定方法和規(guī)則,使得總體中每一個對象都有相同的機會被選入樣本。這又稱為等概率抽樣。因為只有按照隨機原則進行抽樣,所抽出的樣本才有充分的代表性,也才可以對抽樣誤差做出準確的計算,以估計它的可信度。
概率抽樣的理論基礎(chǔ)就是概率論。我們通常把因果關(guān)系分為兩種:一種是必然性的因果關(guān)系,即若A,則必然B;另一種是隨機性的因果關(guān)系,即若A,則可能B。大量的社會現(xiàn)象都是隨機現(xiàn)象。研究隨機現(xiàn)象的數(shù)學分支學科是概率論。概率是事物發(fā)生的可能性大小的量度。在概率論中,把不可能發(fā)生的事件的概率稱為最小概率,定為0,而把必然發(fā)生的事件的概率稱為最大概率,定為1。那么事件A出現(xiàn)的概率P(A)在0與l之間,即隨機事件發(fā)生的可能性在0到1之間,是個非負數(shù)。
(二) 抽樣的基本程序
按照一定原則進行抽樣時,大致可包括如下幾個步驟:
1、界定總體
界定總體包括明確總體的范圍、內(nèi)容和時間。實際調(diào)查的總體與理論上設(shè)定的總體會有所不同,總體越復雜,二者的差別越大。例如,要研究某地青少年的犯罪狀況,理論上的總體是這一地區(qū)符合一定條件的所有的青少年,但實際上我們能夠抽樣的總體并不能全部包括,也就是說只能根據(jù)我們所能夠掌握的這一地區(qū)符合一定條件的青少年進行抽樣。因此,抽樣總體有時不等于理論上的研究總體,樣本所代表的也只是明確界定的抽樣總體。此外,由于調(diào)查研究內(nèi)容的不同,對總體的限定也會有所不同。
2、確定抽樣框
這一步驟的任務(wù)就是依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并通過對名單進行統(tǒng)一編號進而組合成一種可供選擇的形式,如名單、代碼、符號等。抽樣框的形式受總體類型的影響:簡單的總體可直接根據(jù)其組成名單形成抽樣框;但對構(gòu)成復雜的總體,常常根據(jù)調(diào)查研究的需要,制定不同的抽樣框,分級選擇樣本。例如,進行全國人口抽樣調(diào)查,先以全國的省市為抽樣框選部分省、市為調(diào)查單位,然后再以這些省、市中的各縣、區(qū)為抽樣框選部分縣、區(qū)為調(diào)查單位,這樣依次到村或居委會。
在概率抽樣中,抽樣框的確定非常重要,它會直接影響到樣本的代表性。因此,抽樣框要力爭全面、準確。
3、樣本設(shè)計
樣本設(shè)計包括確定樣本規(guī)模和選擇抽樣的具體方式。抽樣的目的是用樣本來代表總體,自然樣本數(shù)越大,其代表性越高。但樣本數(shù)越大,調(diào)查研究的成本也越大。因此,確定合適的樣本規(guī)模和抽樣方式是抽樣設(shè)計中的一項重要內(nèi)容。我們在第三節(jié)中杵詳細討論這一問題。
4、評估樣本質(zhì)量
評估樣本質(zhì)量即通過對樣本統(tǒng)計值的分析,說明其代表性或誤差大小。對樣本代表性進行評估的主要標準是準確性和精確性:前者是指樣本的偏差,偏差越小,其準確性越高;后者是指抽樣誤差,誤差越小,其精確性或代表性越高。