第三章 參數(shù)估計
重點:
1.總體參數(shù)與統(tǒng)計量
2.樣本均值與樣本比例及其標(biāo)準(zhǔn)誤差
難點:
1.區(qū)間估計
2.樣本量的確定
知識點一:總體分布與總體參數(shù)
統(tǒng)計分析數(shù)據(jù)的方法包括:描述統(tǒng)計和推斷統(tǒng)計(第一章)
推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推 斷總體特征的統(tǒng)計學(xué)方法,包括參數(shù)估計和假設(shè)檢驗兩大類。
總體分布是總體中所有觀測值所形成的分布。
總體參數(shù)是對總體特征的某個概括性的度量。通常有
總體平均數(shù)( μ)
總體方差(σ2 )
總體比例( π)
知識點二:統(tǒng)計量和抽樣分布
總體參數(shù)是未知的,但可以利用樣本信息來推斷。
統(tǒng)計量是根據(jù)樣本數(shù)據(jù)計算的用于推斷總體的某些量,是對樣本特征的某個概括性度量。
統(tǒng)計量是樣本的函數(shù),如樣本均值()、樣本方差( s2)、樣本比例(p)等。
構(gòu)成統(tǒng)計量的函數(shù)中不能包括未知因素。
由于樣本是從總體中隨機抽取的,樣本具有隨機性,由樣本數(shù)據(jù)計算出的統(tǒng)計量也就是隨機的。統(tǒng)計量的取值是依據(jù)樣本而變化的,不同的樣本可以計算出不同的統(tǒng)計量值。
[例題·單選題]以下為總體參數(shù)的是( )
a.樣本均值b.樣本方差
c.樣本比例d.總體均值
答案:d
解析:總體參數(shù)是對總體特征的某個概括性的度量。通常有總體平均數(shù)、總體方差、總體比
例題·判斷題:統(tǒng)計量是樣本的函數(shù)。
答案:正確
解析:統(tǒng)計量是樣本的函數(shù),如樣本均值()、樣本方差()、樣本比例(p)等。構(gòu)成統(tǒng)計量的函數(shù)中不能包括未知因素。
[例題·判斷題]在抽樣推斷中,作為推斷對象的總體和作為觀察對象的樣本都是確定的、唯一的。
答案:錯誤
解析:作為推斷對象的總體是唯一的,但作為觀察對象的樣本不是唯一的,不同的樣本可以計算出不同的統(tǒng)計量值。。
(一)樣本均值的抽樣分布
設(shè)總體共有n個元素,從中隨機抽取一個容量為n的樣本,在重置抽樣時,共有nn 種抽法,即可以組成nn不同的樣本,在不重復(fù)抽樣時,共有 個可能的樣本。每一個樣本都可以計算出一個均值,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。
但現(xiàn)實中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布實際上是一種理論分布。
數(shù)理統(tǒng)計學(xué)的相關(guān)定理已經(jīng)證明:
即樣本均值的均值就是總體均值。
在重置抽樣時,樣本均值的方差為總體方的1/n,即
在不重置抽樣時,樣本均值的方差為
其中,為修正系數(shù),對于無限總體進行不重置抽樣時,可以按照重置抽樣計算,當(dāng)總體為有限總體,n比較大而n/n≥5% 時,修正系數(shù)可以簡化為1-n/n,當(dāng)n比較大,而n/n<5%時,修正系數(shù)可以近似為1,即可以按重置抽樣計算。
當(dāng)總體服從正態(tài)分布時,樣本均值一定服從正態(tài)分布,即有x~n(,)時,~n(,)
若總體為未知的非正態(tài)分布時,只要樣本容量 n足夠大(通常要求n ≥30),樣本均值仍會接近正態(tài)分布。樣本分布的期望值為總體均值,樣本方差為總體方差的1/n 。這就是統(tǒng)計上著名的中心極限定理。
該定理可以表述為:從均值為,方差為的總體中,抽取樣本量為n的隨機樣本,當(dāng)n充分大時(通常要求n ≥30),樣本均值的分布近似服從均值為,方差為的正態(tài)分布。
如果總體不是正態(tài)分布,當(dāng)n為小樣本時(通常n<30),樣本均值的分布則不服從正態(tài)分布。
[例題·單選題]設(shè)一個總體共有5個元素,從中隨機抽取一個容量為2的樣本,在重置抽樣時,共有( )個樣本
a.25 b.10 c.5 d.1
答案:a
解析:在重置抽樣時,共有nn 種抽法,共有樣本nn個,即52=5×5=25個。
[例題·單選題]設(shè)一個總體共有5個元素,從中隨機抽取一個容量為2的樣本,在不重置抽樣時,共有( )個樣本
a.25 b.10
c.5 d.1
答案:b
解析:在不重復(fù)抽樣時,共有個可能的樣本。即(個)
(二)樣本比例的抽樣分布
比例是指具有某種屬性的單位占全部單位數(shù)的比重。
總體比例(通常用 π表示)是總體中具有某種屬性的單位數(shù)占全部總體單位數(shù)的比例,是一個參數(shù),通常是未知的,也是我們想通過抽樣得到的說明總體特征的數(shù)據(jù)。
樣本比例(通常用p表示)是隨機抽取的樣本中具有某種屬性的單位數(shù)占樣本全部單位數(shù)的比例,是一個樣本統(tǒng)計量,是隨機變量,對于一個已經(jīng)抽取出來的樣本來講,是可以觀察到的。描述所有可能樣本比例的概率分布就是樣本比例的抽樣分布。
當(dāng)樣本容量比較大時,樣本比例p近似服從正態(tài)分布,且有p的數(shù)學(xué)期望就是總體比率π ,即σ(p)=π
而p的方差與抽樣方法有關(guān),在重置抽樣下為,在不重置抽樣下為
即在重置抽樣時, p的分布為p~n(,)
在不重置抽樣時, p的分布為p~n(,)
一般講,當(dāng) np≥5,并n(1-p) ≥5時,就可以認(rèn)為樣本容量足夠大。對于無限總體進行不重置抽樣時,可以按照重置抽樣計算,當(dāng)總體為有限總體,當(dāng)n比較大,而n/n ≤ 5%時,修正系數(shù) 會趨向1,這時也可以按重置抽樣計算方差。
從上述分析可以看出,隨著樣本容量的增大,樣本比例的方差愈來愈小,說明樣本比例隨樣本容量增大,圍繞總體比例分布的峰度愈來愈高。
[例題·單選題]當(dāng)樣本容量比較大時,在重置抽樣條件下,樣本比例p的方差為( )
a. b. c. d.
解析:當(dāng)樣本容量比較大時,在重置抽樣條件下,樣本比例p的方差為
[例題·單選題]設(shè)一個總體含有3個可能元素,取值分別為1,2,3。從該總體中采取重復(fù)抽樣方法抽取樣本量為2的所有可能樣本,樣本均值為2的概率值是( )
a.1/9 b.2/9 c.1/3 d. 4/9
答案:c
解析:在重復(fù)抽樣下,樣本為1,2,3的概率都是1/3。
[例題·判斷題] 樣本容量是指從一個總體中可能抽取的樣本個數(shù)。
解析:樣本容量是樣本中個體的數(shù)目。一個總體可以有多個樣本,各個樣本的的容量可以相同可以不同。
[例題·判斷題]在確定總體比例估計中的樣本容量時,如果缺少比例的方差,常取比例值為 0.5。
知識點三:統(tǒng)計量的標(biāo)準(zhǔn)誤差
統(tǒng)計量的標(biāo)準(zhǔn)誤差也稱為標(biāo)準(zhǔn)誤,是指樣本統(tǒng)計量分布的標(biāo)準(zhǔn)差。可用于衡量樣本統(tǒng)計量的離散程度。在參數(shù)估計中,它是用于衡量樣本統(tǒng)計量與總體參數(shù)之間差距的一個重要尺度。
樣本均值的標(biāo)準(zhǔn)誤計算公式為:
當(dāng)總體標(biāo)準(zhǔn)差 σ未知時,可用樣本標(biāo)準(zhǔn)差s代替計算,這時計算的標(biāo)準(zhǔn)誤差稱為估計標(biāo)準(zhǔn)誤差。
相應(yīng)地,樣本比例的標(biāo)準(zhǔn)誤計算公式為
同樣,當(dāng)總體比例的方差π(1-π )未知時,可用樣本比例的方差p(1-p)代替。
[例題·單選題] 樣本均值的標(biāo)準(zhǔn)誤差計算公式為( )
解析:樣本均值的標(biāo)準(zhǔn)誤差計算公式為
[例題·單選題]樣本比例的標(biāo)準(zhǔn)誤差計算公式為( )
解析:樣本比例的標(biāo)準(zhǔn)誤差計算公式為
[例題·單選題]統(tǒng)計量的標(biāo)準(zhǔn)誤差也稱為標(biāo)準(zhǔn)誤,其大小與()。
a. 樣本量的平方根成反比 b. 樣本量的大小成反比
c. 樣本量的大小成正比 d. 總體的標(biāo)準(zhǔn)差成反比
解析:樣本均值的標(biāo)準(zhǔn)誤計算公式為:,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比,與樣本量的平方根成反比。
[例題·多選題]在參數(shù)估計中統(tǒng)計量的標(biāo)準(zhǔn)誤差可用于()
a.衡量樣本統(tǒng)計量與總體參數(shù)之間的差距
b.衡量樣本統(tǒng)計量的離散程度
c.衡量樣本統(tǒng)計量的集中程度
d.衡量總體參數(shù)的離散程度
e.衡量總體參數(shù)的集中程度。
答案:ab
解析:統(tǒng)計量的標(biāo)準(zhǔn)誤差也稱為標(biāo)準(zhǔn)誤,是指樣本統(tǒng)計量分布的標(biāo)準(zhǔn)差??捎糜诤饬繕颖窘y(tǒng)計量的離散程度。在參數(shù)估計中,它是用于衡量樣本統(tǒng)計量與總體參數(shù)之間差距的一個重要尺度。