抽樣的基本程序包括:界定總體、樣本設計。
1、界定總體
界定總體包括明確總體的范圍、內容和時間。實際調查的總體與理論上設定的總體會有所不同,總體越復雜,二者的差別越大。抽樣總體有時不等于理論上的研究總體,樣本所代表的也只是明確界定的抽樣總體。
2、樣本設計
樣本設計包括確定樣本規模和選擇抽樣的具體方式。抽樣的目的是用樣本來代表總體,自然樣本數越大,其代表性越高。但樣本數越大,調查研究的成本也越大。因此,確定合適的樣本規模和抽樣方式是抽樣設計中的一項重要內容。
樣本規模的確定:
確定樣本量的大小是比較復雜的問題,既要有定性的考慮也要有定量的考慮。
(1)定性方面的考慮
其考慮因素有:決策的重要性,調研的性質,變量個數,數據分析的性質,同類研究中所用的樣本量,發生率,完成率,資源限制等。具體地說,更重要的決策,需要更多的信息和更準確的信息,這就需要較大的樣本;探索性研究,樣本量一般較小,而結論性研究如描述性的調查,就需要較大的樣本;收集有關許多變量的數據,樣本量就要大一些。
(2)定量方面的考慮
有具體的統計學公式,不同的抽樣方法有不同的公式。歸納起來,樣本量的大小主要取決于:
①研究對象的變化程度,即變異程度;
②要求和允許的誤差大小,即精度要求;
③要求推斷的置信度,一般情況下,置信度取為95%;
④總體的大。
⑤抽樣的方法。
在無放回簡單隨機抽樣情況下,總體均值估計量的標準誤差的表達式:
其中,σ是總體的標準差。如果誤差界限設為e,那么:
這里Z是對應于某一置信水平的標準正態分布的分位點值。
為確定n,需要知道:期望的誤差界限e;置信水平;對應的標準正態分布的分位點值 Z;總體規模 N;總體方差σ2 ;其中,總體方差σ2是最不容易得到的,通常需要根據過去對類似總體所做的研究作近似計算。
常用的z值:
對于90% 的置信度,對應的z值為1.64;
對于95% 的置信度,對應的z值為1.96;
對于99% 的置信度,對應的z值為2.56。
也就是說,研究的問題越復雜,差異越大時,樣本量要求越大;要求的精度越高,可推斷性要求越高時,樣本量也越大;同時,總體越大,樣本量也相對要大,但是,增大呈現出一定對數特征,而不是線形關系。