第三章 參數(shù)估計(jì)
重點(diǎn):
1.總體參數(shù)與統(tǒng)計(jì)量
2.樣本均值與樣本比例及其標(biāo)準(zhǔn)誤差
難點(diǎn):
1.區(qū)間估計(jì)
2.樣本量的確定
知識(shí)點(diǎn)一:總體分布與總體參數(shù)
統(tǒng)計(jì)分析數(shù)據(jù)的方法包括:描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)(第一章)
推斷統(tǒng)計(jì)是研究如何利用樣本數(shù)據(jù)來推 斷總體特征的統(tǒng)計(jì)學(xué)方法,包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩大類。
總體分布是總體中所有觀測(cè)值所形成的分布。
總體參數(shù)是對(duì)總體特征的某個(gè)概括性的度量。通常有
總體平均數(shù)( μ)
總體方差(σ2 )
總體比例( π)
知識(shí)點(diǎn)二:統(tǒng)計(jì)量和抽樣分布
總體參數(shù)是未知的,但可以利用樣本信息來推斷。
統(tǒng)計(jì)量是根據(jù)樣本數(shù)據(jù)計(jì)算的用于推斷總體的某些量,是對(duì)樣本特征的某個(gè)概括性度量。
統(tǒng)計(jì)量是樣本的函數(shù),如樣本均值()、樣本方差( s2)、樣本比例(p)等。
構(gòu)成統(tǒng)計(jì)量的函數(shù)中不能包括未知因素。
由于樣本是從總體中隨機(jī)抽取的,樣本具有隨機(jī)性,由樣本數(shù)據(jù)計(jì)算出的統(tǒng)計(jì)量也就是隨機(jī)的。統(tǒng)計(jì)量的取值是依據(jù)樣本而變化的,不同的樣本可以計(jì)算出不同的統(tǒng)計(jì)量值。
[例題·單選題]以下為總體參數(shù)的是( )
a.樣本均值b.樣本方差
c.樣本比例d.總體均值
答案:d
解析:總體參數(shù)是對(duì)總體特征的某個(gè)概括性的度量。通常有總體平均數(shù)、總體方差、總體比
例題·判斷題:統(tǒng)計(jì)量是樣本的函數(shù)。
答案:正確
解析:統(tǒng)計(jì)量是樣本的函數(shù),如樣本均值()、樣本方差()、樣本比例(p)等。構(gòu)成統(tǒng)計(jì)量的函數(shù)中不能包括未知因素。
[例題·判斷題]在抽樣推斷中,作為推斷對(duì)象的總體和作為觀察對(duì)象的樣本都是確定的、唯一的。
答案:錯(cuò)誤
解析:作為推斷對(duì)象的總體是唯一的,但作為觀察對(duì)象的樣本不是唯一的,不同的樣本可以計(jì)算出不同的統(tǒng)計(jì)量值。。
(一)樣本均值的抽樣分布
設(shè)總體共有n個(gè)元素,從中隨機(jī)抽取一個(gè)容量為n的樣本,在重置抽樣時(shí),共有nn 種抽法,即可以組成nn不同的樣本,在不重復(fù)抽樣時(shí),共有 個(gè)可能的樣本。每一個(gè)樣本都可以計(jì)算出一個(gè)均值,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。
但現(xiàn)實(shí)中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布實(shí)際上是一種理論分布。
數(shù)理統(tǒng)計(jì)學(xué)的相關(guān)定理已經(jīng)證明:
即樣本均值的均值就是總體均值。
在重置抽樣時(shí),樣本均值的方差為總體方的1/n,即
在不重置抽樣時(shí),樣本均值的方差為
其中,為修正系數(shù),對(duì)于無限總體進(jìn)行不重置抽樣時(shí),可以按照重置抽樣計(jì)算,當(dāng)總體為有限總體,n比較大而n/n≥5% 時(shí),修正系數(shù)可以簡(jiǎn)化為1-n/n,當(dāng)n比較大,而n/n<5%時(shí),修正系數(shù)可以近似為1,即可以按重置抽樣計(jì)算。
當(dāng)總體服從正態(tài)分布時(shí),樣本均值一定服從正態(tài)分布,即有x~n(,)時(shí),~n(,)
若總體為未知的非正態(tài)分布時(shí),只要樣本容量 n足夠大(通常要求n ≥30),樣本均值仍會(huì)接近正態(tài)分布。樣本分布的期望值為總體均值,樣本方差為總體方差的1/n 。這就是統(tǒng)計(jì)上著名的中心極限定理。
該定理可以表述為:從均值為,方差為的總體中,抽取樣本量為n的隨機(jī)樣本,當(dāng)n充分大時(shí)(通常要求n ≥30),樣本均值的分布近似服從均值為,方差為的正態(tài)分布。
如果總體不是正態(tài)分布,當(dāng)n為小樣本時(shí)(通常n<30),樣本均值的分布則不服從正態(tài)分布。
[例題·單選題]設(shè)一個(gè)總體共有5個(gè)元素,從中隨機(jī)抽取一個(gè)容量為2的樣本,在重置抽樣時(shí),共有( )個(gè)樣本
a.25 b.10 c.5 d.1
答案:a
解析:在重置抽樣時(shí),共有nn 種抽法,共有樣本nn個(gè),即52=5×5=25個(gè)。
[例題·單選題]設(shè)一個(gè)總體共有5個(gè)元素,從中隨機(jī)抽取一個(gè)容量為2的樣本,在不重置抽樣時(shí),共有( )個(gè)樣本
a.25 b.10
c.5 d.1
答案:b
解析:在不重復(fù)抽樣時(shí),共有個(gè)可能的樣本。即(個(gè))
(二)樣本比例的抽樣分布
比例是指具有某種屬性的單位占全部單位數(shù)的比重。
總體比例(通常用 π表示)是總體中具有某種屬性的單位數(shù)占全部總體單位數(shù)的比例,是一個(gè)參數(shù),通常是未知的,也是我們想通過抽樣得到的說明總體特征的數(shù)據(jù)。
樣本比例(通常用p表示)是隨機(jī)抽取的樣本中具有某種屬性的單位數(shù)占樣本全部單位數(shù)的比例,是一個(gè)樣本統(tǒng)計(jì)量,是隨機(jī)變量,對(duì)于一個(gè)已經(jīng)抽取出來的樣本來講,是可以觀察到的。描述所有可能樣本比例的概率分布就是樣本比例的抽樣分布。
當(dāng)樣本容量比較大時(shí),樣本比例p近似服從正態(tài)分布,且有p的數(shù)學(xué)期望就是總體比率π ,即σ(p)=π
而p的方差與抽樣方法有關(guān),在重置抽樣下為,在不重置抽樣下為
即在重置抽樣時(shí), p的分布為p~n(,)
在不重置抽樣時(shí), p的分布為p~n(,)
一般講,當(dāng) np≥5,并n(1-p) ≥5時(shí),就可以認(rèn)為樣本容量足夠大。對(duì)于無限總體進(jìn)行不重置抽樣時(shí),可以按照重置抽樣計(jì)算,當(dāng)總體為有限總體,當(dāng)n比較大,而n/n ≤ 5%時(shí),修正系數(shù) 會(huì)趨向1,這時(shí)也可以按重置抽樣計(jì)算方差。
從上述分析可以看出,隨著樣本容量的增大,樣本比例的方差愈來愈小,說明樣本比例隨樣本容量增大,圍繞總體比例分布的峰度愈來愈高。
[例題·單選題]當(dāng)樣本容量比較大時(shí),在重置抽樣條件下,樣本比例p的方差為( )
a. b. c. d.
答案:a
解析:當(dāng)樣本容量比較大時(shí),在重置抽樣條件下,樣本比例p的方差為
[例題·單選題]設(shè)一個(gè)總體含有3個(gè)可能元素,取值分別為1,2,3。從該總體中采取重復(fù)抽樣方法抽取樣本量為2的所有可能樣本,樣本均值為2的概率值是( )
a.1/9 b.2/9 c.1/3 d. 4/9
答案:c
解析:在重復(fù)抽樣下,樣本為1,2,3的概率都是1/3。
[例題·判斷題] 樣本容量是指從一個(gè)總體中可能抽取的樣本個(gè)數(shù)。
答案:錯(cuò)誤
解析:樣本容量是樣本中個(gè)體的數(shù)目。一個(gè)總體可以有多個(gè)樣本,各個(gè)樣本的的容量可以相同可以不同。
[例題·判斷題]在確定總體比例估計(jì)中的樣本容量時(shí),如果缺少比例的方差,常取比例值為 0.5。
答案:正確
知識(shí)點(diǎn)三:統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差
統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差也稱為標(biāo)準(zhǔn)誤,是指樣本統(tǒng)計(jì)量分布的標(biāo)準(zhǔn)差??捎糜诤饬繕颖窘y(tǒng)計(jì)量的離散程度。在參數(shù)估計(jì)中,它是用于衡量樣本統(tǒng)計(jì)量與總體參數(shù)之間差距的一個(gè)重要尺度。
樣本均值的標(biāo)準(zhǔn)誤計(jì)算公式為:
當(dāng)總體標(biāo)準(zhǔn)差 σ未知時(shí),可用樣本標(biāo)準(zhǔn)差s代替計(jì)算,這時(shí)計(jì)算的標(biāo)準(zhǔn)誤差稱為估計(jì)標(biāo)準(zhǔn)誤差。
相應(yīng)地,樣本比例的標(biāo)準(zhǔn)誤計(jì)算公式為
同樣,當(dāng)總體比例的方差π(1-π )未知時(shí),可用樣本比例的方差p(1-p)代替。
[例題·單選題] 樣本均值的標(biāo)準(zhǔn)誤差計(jì)算公式為( )
a. b. c. d.
答案:b
解析:樣本均值的標(biāo)準(zhǔn)誤差計(jì)算公式為
[例題·單選題]樣本比例的標(biāo)準(zhǔn)誤差計(jì)算公式為( )
a. b. c. d.
答案:a
解析:樣本比例的標(biāo)準(zhǔn)誤差計(jì)算公式為
[例題·單選題]統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差也稱為標(biāo)準(zhǔn)誤,其大小與()。
a. 樣本量的平方根成反比 b. 樣本量的大小成反比
c. 樣本量的大小成正比 d. 總體的標(biāo)準(zhǔn)差成反比
答案:a
解析:樣本均值的標(biāo)準(zhǔn)誤計(jì)算公式為:,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比,與樣本量的平方根成反比。
[例題·多選題]在參數(shù)估計(jì)中統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差可用于()
a.衡量樣本統(tǒng)計(jì)量與總體參數(shù)之間的差距
b.衡量樣本統(tǒng)計(jì)量的離散程度
c.衡量樣本統(tǒng)計(jì)量的集中程度
d.衡量總體參數(shù)的離散程度
e.衡量總體參數(shù)的集中程度。
答案:ab
解析:統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差也稱為標(biāo)準(zhǔn)誤,是指樣本統(tǒng)計(jì)量分布的標(biāo)準(zhǔn)差??捎糜诤饬繕颖窘y(tǒng)計(jì)量的離散程度。在參數(shù)估計(jì)中,它是用于衡量樣本統(tǒng)計(jì)量與總體參數(shù)之間差距的一個(gè)重要尺度。