第四部分 統(tǒng)計
一 統(tǒng)計與統(tǒng)計數據
1 統(tǒng)計含義
統(tǒng)計包含三層含義:統(tǒng)計工作,統(tǒng)計數據,統(tǒng)計學。
2 統(tǒng)計數據及其類型
統(tǒng)計數據分三類:分類的數據,順序的數據,數值型數據。
3 統(tǒng)計指標及其類型
統(tǒng)計指標:一是用來反映現象總體數量狀況的基本概念;二是反映現象總體數量概念和數值。
統(tǒng)計指標按其所反映的內容或其數值表現形式上看,有總量指標、相對指標和平均指標三種。
總量指標按其所反映的時間狀況不同又可分為時期指標和時點指標。
相對指標是兩個絕對數之比,表現形式為比例和比率。
平均指標又分平均數或均值,所反映的是現象在某一空間或時間上的平均數量狀況。
4 統(tǒng)計數據的來源
來源:一是直接的調查和科學試驗,直接來源。二是來源于別人調查或試驗數據,間接來源。
統(tǒng)計調查是取得社會經濟數據的主要來源。統(tǒng)計調查方式為普查、抽樣調查、統(tǒng)計報表。
抽樣調查特點:經濟性,時效性強,適應面廣,準確性高。
報表按報送單位的多少不同分為全面報表和非全面報表。
重點調查:從調查對象的全部單位中選擇少數重點單位進行調查。
典型調查:從調查對象全部單位中選擇一個或少數具有代表性的單位進行全面深入的調查。
抽樣調查是隨機抽取,可根據結果推斷總體數量特征;而重點調查和典型調查不是隨機的,具有主觀性的,調查結果不能推斷總體。
5 統(tǒng)計數據的質量
統(tǒng)計數據的誤差:登記性誤差和代表性誤差。
登記性誤差:人為因素所造成的誤差,理論上可以清除。
代表性誤差:用樣本數據推斷時所產生的隨機誤差,無法消除。
統(tǒng)計數據質量要求:精度要求,準確性,關聯性,及時性,一致性,最低成本。
二 統(tǒng)計數據的整理與顯示
分類數據和順序數據是做分類整理,數值型數據做分組整理。
1 分類數據的整理和圖示
整理:頻數與頻數分布,比例,百分比,比率。
圖示:條形圖(單式和復式)和圓形圖。
2 順序數據的整理和圖示
分類數據的整理也適合順序數據,還有累積頻數和累積頻率。
3 數值型數據的整理和圖示
數據分組:1) 確定組數:K=1+lgN/lg2 ;2)確定組距:(最大值-最小值)÷組數;3)根據分組整理成頻數分布表。
采用組距分組時,遵循“不重不漏”原則。為解決“不重”問題,統(tǒng)計分組時習慣上規(guī)定“上組限不在內”。
對于離散變量,采用相鄰組限間斷的辦法解決。對于連續(xù)變量,采取相鄰兩組組限重疊的辦法??梢詫σ粋€組的上限值采用小數點的形式。圖示:條形圖,圓形圖和直方圖。
4 統(tǒng)計表
統(tǒng)計表一般由表頭,行標題,列標題,數字資料組成。
統(tǒng)計表設計:1)合理安排結構。2)表頭一般包括表號,總標題和表中數據單位等內容,3W(時間、地點、數據)。3)上下兩條橫線用粗線,中間的其他線用細線,左右不封口。4)必要時,加注釋。
三 數據特征的測度
分布的集中趨勢,分布的離散程度,分布的偏態(tài)和峰度。
1 集中趨勢的測度
眾數:出現次數最多的變量。(M0)是一個位置代表值,不受數據中極端值的影響。
中位數:排序后,處于中間位置上的數值。(Me)中間數位置:(N+1)/2,奇數時,具體數值是一個,偶數時是中間兩個數的平均數。
均值:算數平均數,全部數據的算數平均。分簡單平均和加權平均。
幾何平均:幾何平均數是N個變量值乘積的N次方根。適用于特殊數據的一種平均數,主要用于計算比率或平均速度的平均。實際應用中主要用于社會經濟現象的平均發(fā)展速度。
2 離散程度的測度
極差:最大值與最小值之差。
標準差:個變量與其均值離差平方的平均數的平方根。(σ)
離散系數:Vσ=σ/ X,離散系數大,數據離散程度大。
四 時間序列
1 時間序列及其分類
從觀察值的表現形式分:絕對、相對和平均數時間序列。
絕對數時間序列根據觀察值的時間狀況分時期序列和時點序列。
時期序列數值可以相加,時點序列數值通常是不能相加的。
人口自然增長率是相對數時間序列,居民消費水平是平均數時間序列。
2 時間序列的水平分析
序時平均數:現象在不同時間上的觀察值的平均值。(股票市場方面)
時期序列平均數:觀察值直接相加,再除以觀察值個數。
時點序列平均數:與時期不同,是某個時間點上取得觀察值。
對于以“天”為統(tǒng)計間隔的時點序列,序時平均數與時期相同。對于統(tǒng)計時點間隔在一天上的時點序列,先求兩個相鄰觀察值平均數,求出整個觀察其間的總量,再求平均數。公式:
相對數或平均數時間序列平均數:兩個絕對數對比形成。
增長量與平均增長量:
增長量是報告期與基期水平之差。逐期增長與累積增長。
逐期增長是報告期與前一期水平差。累積增長是報告期與某一固定時期的水平差。
平均增長量是觀察期各逐期增長量的平均數。
平均增長量=逐期增長量之合/逐期增長量個數=累積增長量/(觀察值個數-1)
3 時間序列的速度分析
發(fā)展速度:是報告期與基期水平之比。環(huán)比發(fā)展速度和定基發(fā)展速度。環(huán)比是報告期與前一期水平比,定基是報告期與某一固定期水平比。觀察期內個環(huán)比發(fā)展速度連乘積等與最末期的定基發(fā)展速度。相鄰定基發(fā)展速度,后者除以前者等于相應環(huán)比發(fā)展速度。
增長速度:增長率,是增長量與基期水平之比。(發(fā)展速度-1)。分為環(huán)比與定基增長速度。
由環(huán)比增長速度推算定基增長速度時,先將環(huán)比增長速度加1后連乘,再將結果-1即為定基增長速度。
平均發(fā)展速度:各個時期環(huán)比發(fā)展速度的平均數。平均增長速度用平均發(fā)展速度-1求得。
計算平均發(fā)展速度方法是水平法,即幾何平均法。公式為:
速度分析與應用:當時間序列的觀察值出現0和藹負數時,不宜計算速度。有些情況,不能單純就速度論速度,注意速度與水平的結合分析。
增長1%絕對值=逐期增長量/(環(huán)比增長速度*100)=前期水平/100
五 統(tǒng)計指數
1 指數的概念
指數是經濟分析的特殊統(tǒng)計方法,反映事物數量相對變化程度。
類型:按反映內容分為數量指數與質量指數。按計入指數項目多少分個體指數與綜合指數。
2 綜合指數
價格綜合指數:產品價格乘以報告期相應數量。
P1/0=∑p1q1/∑p0q1
數量綜合指數:產品數量乘以基期相應價格。
q1/0=∑p0q1/∑p0q0
3 指數體系
V1/0=∑p1q1/∑p0q0= ∑p1q1/∑p0q1×∑p0q1/∑p0q0
絕對水平:∑p1q1-∑p0q0=(∑p1q1-∑p0q1)+(∑p0q1-∑p0q0)
六 相關與回歸
相關分析研究變量間的關系密切程度,回歸分析研究變量間數量伴隨關系。
1 相關關系
變量之間的關系形態(tài)分為函數關系和統(tǒng)計關系。函數關系是一一對應的確定關系。變量之間存在的不確定的數量關系為相關關系。
類型:線性相關,非線性相關,完全相關,不完全相關。
如果一個變量的取值完全依賴于另一個變量,各觀察點落在一直線上,完全相關。
正相關:一變量增加減少,另一變量也隨著增加減少。負相關反之。
為準確度量兩個變量之間的關系密切程度,需要計算相關系數。公式:
相關系數取值范圍+1和-1之間。r=1完全正相關;r=-1完全負相關;r=0不存在線性相關,可能存在非線性相關。
線性關系的密切程度:|r|≥0.8高度相關,0.5≤|r|≤0.8中度相關,0.3≤|r|≤0.5低度相關,r|≤|0.3相關程度極弱,視為不相關。
2 一元線性回歸
Y=a+bx 確定常數a b的方法為最小二乘法。計算公式為:
(責任編輯:)