公眾號(hào):mywangxiao
及時(shí)發(fā)布考試資訊
分享考試技巧、復(fù)習(xí)經(jīng)驗(yàn)
新浪微博 @wangxiaocn關(guān)注微博
聯(lián)系方式 400-18-8000
二、數(shù)值型數(shù)據(jù)的整理與顯示
上面介紹的品質(zhì)數(shù)據(jù)的整理與圖示方法,也都適用于對(duì)數(shù)值型數(shù)據(jù)的整理與顯示。但數(shù)值型數(shù)據(jù)還有一些特定的整理和圖示方法,并不適用于品質(zhì)數(shù)據(jù)。
(一)數(shù)據(jù)的分組
數(shù)據(jù)分組就是根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同的組別。分組后再計(jì)算出各組中出現(xiàn)的次數(shù)或頻數(shù),形成一張頻數(shù)分布表。分組的方法有單變量值分組和組距分組兩種。單變量值分組是把每一個(gè)變量值作為一組,這種分組方法通常只適合于離散變量且變量值較少的情況。在連續(xù)變量或變量值較多的情況下,通常采用組距分組。
組距分組是將全部變量值依次劃分為若干個(gè)區(qū)間,并將這一區(qū)間的變量值作為一組。下面結(jié)合具體的例子說(shuō)明分組的過(guò)程和頻數(shù)分布表的編制過(guò)程。
例如,某高中一年級(jí)一班共有55名學(xué)生,高一語(yǔ)文考試中成績(jī)分別為:
59 73 87 65 89 85 77 94 69 9 7
56 80 68 95 96 50 63 88 91 90
96 92 93 79 74 65 74 89 83 51
74 79 94 67 92 92 93 70 87 86
54 87 86 54 62 76 86 73 86 70
100 110 108 102 112
采用組距分組需要經(jīng)過(guò)以下幾個(gè)步驟:
第一步,確定分組組數(shù)。確定分組組數(shù)的要求是:第一,劃分的組數(shù),既不應(yīng)太多也不應(yīng)太少。組數(shù)過(guò)多,達(dá)不到通過(guò)分組壓縮資料的目的;組數(shù)太少,將造成原始資料的信息丟失過(guò)多。第二,組數(shù)的確定:要盡量保證組間資料的差異性與組內(nèi)資料的同質(zhì)性。第三,采用的分組辦法,要能夠充分顯示客觀現(xiàn)象本身存在的狀態(tài)。
關(guān)于統(tǒng)計(jì)分組組數(shù)問(wèn)題,不少統(tǒng)計(jì)學(xué)家曾做過(guò)研究,并給出了經(jīng)驗(yàn)公式。比較有代表性的是斯特基(H.A.Sturges)方法。計(jì)算公式為:
K為分組組數(shù),Ⅳ為數(shù)據(jù)個(gè)數(shù)。
在本例中,,即應(yīng)分為7組。
由于實(shí)際情況可能比較復(fù)雜,可根據(jù)數(shù)據(jù)的多少和特點(diǎn)及分析的要求,參考以上經(jīng)驗(yàn)公式,靈活確定組數(shù)。
第二步,對(duì)原始資料進(jìn)行排序。結(jié)果如下:
50 51 54 54 56 59 62 63 65 65
67 68 69 70 70 73 73 74 74 74
76 77 79 79 80 83 85 86 86 86
86 87 87 87 88 89 89 90 91 92
92 92 93 93 94 94 95 96 96 97
100 102 108 110 112
第三步,求極差。將最大的觀察值與最小的觀察值相減便得到極差(下一章還將專門介紹極差)。此例中,極差值為112-50=62。
第四步,確定各組組距。在實(shí)行等距分組的情況下,組距的確定辦法為:
組距=極差/組數(shù)
根據(jù)上式計(jì)算出來(lái)的組距,可能帶有小數(shù),為了編表和計(jì)算方便,也是審美習(xí)慣使然,最好把它取成接近于能被5除盡的一個(gè)數(shù)。例如,根據(jù)公式計(jì)算出來(lái)的組距如果是5.4、3.8、8.7、0.4等,可以把組距定為5.5、5、10、0.5。本例中,組距=62/7=≈8.9,組距可取10。
用極差與組數(shù)相除確定組距的意義很明顯,它表明分組組數(shù)給定的情況下,應(yīng)取多大的組距才能覆蓋全部數(shù)據(jù)。組距與組數(shù)成反比關(guān)系,組數(shù)越多,組距越小;組數(shù)越少,組距越大。
組距是每組觀察值的最大差,即每組的上限值與下限值之間的差。用公式表示就是:
組距=某組的上限值-該組的下限值
第五步,確定組限。組限是組與組之間的界限,或者說(shuō)是每組觀察值變化的范圍。組限有上限與下限之分,在組距分組中,一個(gè)組的最小值稱為下限,最大值稱為上限;上限與下限的差值稱為組距;上限值與下限值的平均數(shù)稱為組中值。組中值的代表性如何,取決于組中觀察值的變化是否呈對(duì)稱分布狀態(tài)。組中值的一般計(jì)算方法為:
組中信= (上限值-下限值)/2
確定組限時(shí)應(yīng)注意:第一,第一組的下限值應(yīng)比最小的觀察值小一點(diǎn),最后一組的上限值應(yīng)比最大的觀察值大一點(diǎn)。第二,特別需要或不得已的情況除外,最好不要使用開(kāi)口組。第三,組限應(yīng)取得美觀些,按數(shù)字偏好,組限值應(yīng)能被5除盡,且一般要用整數(shù)表示。本例中,我們把第一組的下限值定為50,那么各組的組限依次為:
50~60,60~70,70~80,80~90,90~100,100~110,110~120。
第六步,確定各組觀察值出現(xiàn)的頻數(shù)。凡觀察值落在某一區(qū)間的,就計(jì)發(fā)生一次,最后統(tǒng)計(jì)各組觀察值發(fā)生的總次數(shù)。采用組距分組時(shí),需要遵循“不重不漏’’的原則。‘‘不重,,是指一項(xiàng)觀察值只能分在其中的某一組,不能在其他組重復(fù)出現(xiàn);“不漏”是指組別能夠窮盡,即在所分的全部組別中每項(xiàng)數(shù)據(jù)都能分在其中的某一組,不能遺漏。
為解決“不重”的問(wèn)題,統(tǒng)計(jì)分組時(shí)習(xí)慣上規(guī)定“上組限不在內(nèi)”,即當(dāng)相鄰兩組的上下限重疊時(shí),恰好等于某一組上限的觀察值不算在本組內(nèi),而計(jì)算在下一組內(nèi)。例如在本例中,70這一數(shù)值不計(jì)算在“60~70”這一組中,而計(jì)算在“70—80”這一組中。
第七步,制作頻數(shù)分布表,并填上相關(guān)的內(nèi)容,以及其他需要說(shuō)明的事項(xiàng)。本例中的頻數(shù)分布如表23—6所示
表23—6 頻數(shù)分布表
(二)數(shù)值型數(shù)據(jù)的圈示
通過(guò)數(shù)據(jù)分組后形成的頻數(shù)分布表,我們可以初步看出數(shù)據(jù)分布的一些特征和規(guī)律。如果我們進(jìn)一步用圖形來(lái)表示這一分布的結(jié)果,會(huì)更形象直觀。顯示分組數(shù)據(jù)頻數(shù)分布特征的圖形有直方圖、折線圖等,上面介紹的條形圖、圓形圖等也都適用于顯示數(shù)值型數(shù)據(jù)。
1.直方圖
直方圖是用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形。在平面直角坐標(biāo)中,我們用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,這樣,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖。
例如根據(jù)表23—6中的組距分組數(shù)據(jù)繪制的直方圖如圖23—4所示
圖23—4某班高一語(yǔ)文成績(jī)分布的直方圖
對(duì)于等距分組的數(shù)據(jù),我們可以用矩形的高度直接表示頻數(shù)的分布。如果是不等距分組數(shù)據(jù),用矩形的高度來(lái)表示各組頻數(shù)的分布就不再適用。這時(shí),如果我們不是用矩形的皇竺!
是用矩形的面積來(lái)表示各組的頻數(shù)分布,或根據(jù)頻數(shù)密度來(lái)繪制直方圖,就可以準(zhǔn)確地表示各組數(shù)據(jù)分布的特征。實(shí)際上,無(wú)論是等距分組的數(shù)據(jù)還是不等距分組的數(shù)據(jù),我們用矩形的面積或頻數(shù)密度來(lái)表示各組的頻數(shù)分布更為合適,因?yàn)檫@樣可使直方圖下的總面積等于1。比如在等距分組中,矩形的高度與各組的頻數(shù)成比例,如果取矩形的寬度(各組組距)為一個(gè)單位,高度表示比例(即頻率),則直方圖下的總面積等于1。在直方圖中,我們實(shí)際上用矩形的面積表示各組的頻數(shù)分布。
直方圖與條形圖不同,條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的;直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,因此其高度與寬度均有意義。此外,由于分組數(shù)據(jù)具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開(kāi)排列。
2.折線圖
折線圖也稱頻數(shù)多邊形圖,它是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(即組中值)用直線連接起來(lái),再把原來(lái)的直方圖抹掉就是折線圖。需要注意,折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是將第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸。這樣才會(huì)使折線圖下所圍成的面積與直方圖的面積相等,從而使二者所表示的頻數(shù)分布是一致的。例如,在圖23-4的基礎(chǔ)上繪制的折線圖如圖23-5所示。
圖23—5某班高一語(yǔ)文成績(jī)分布的折線圖
相關(guān)文章:
中大網(wǎng)校經(jīng)濟(jì)師考試輔導(dǎo)專題8.20—8.25
2012年中級(jí)經(jīng)濟(jì)師考試經(jīng)濟(jì)基礎(chǔ)知識(shí)教材知識(shí)匯總
(責(zé)任編輯:中大編輯)
近期直播
免費(fèi)章節(jié)課
課程推薦
經(jīng)濟(jì)師
[協(xié)議護(hù)航班-不過(guò)退費(fèi)]
7大模塊 準(zhǔn)題庫(kù)資料 協(xié)議退費(fèi)校方服務(wù)
經(jīng)濟(jì)師
[沖關(guān)暢學(xué)班]
5大模塊 準(zhǔn)題庫(kù)資料 協(xié)議續(xù)學(xué)校方支持
經(jīng)濟(jì)師
[精品樂(lè)學(xué)班]
3大模塊 題庫(kù)練習(xí) 精品課程