關於迴歸統計學論文

  迴歸分析是確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。下文是小編為大家整理的的範文,歡迎大家閱讀參考!

  篇1

  廣西CPI指數統計資料多元迴歸分析

  摘要:本文針對目前大眾所最關心的物價問題,通過多元迴歸分析模型,結合廣西1999~2009年消費品零售價格和服務專案價格變動相關資料,分析價格波動對居民消費的影響程度,給出影響廣西CPI指數上漲的主要因素,並提出相應的措施。

  關鍵詞:CPI指數;多元迴歸;主成分分析

  物價與日常生活息息相關,居民消費物價指數CPI主要包括食品、工業消費品、服務類教育、醫療、交通等的價格,是根據與居民生活有關的產品及勞務價格統計出來的物價變動指標。在廣西,居民消費支出是消費的主體且相對薄弱,價格總水平低位執行,但2007年以來居民消費物價指數增長速度產生了顯著的波動。針對目前大眾所最關心的物價問題,分析消費品零售價格和服務專案價格變動的相關資料,瞭解CPI變化規律和價格波動對居民消費的影響程度,為採取相應的措施提供依據,具有十分重要的意義。

  一、建立居民消費價格指數迴歸分析模型

  在實際問題的研究和分析中,往往涉及多個變數,國家統計局將構成中國CPI指標的200多種商品和服務分為8個主要的類別。其中,中國CPI中食品的權重佔到34%,食品價格的變動對於CPI的變動有很大的影響。下面根據收集的資料建立數學模型做具體的分析。

  由中國統計年鑑和廣西統計年鑑,收集廣西1999~2009年來居民消費價格指數的有關資料。設Y為居民消費價格總指數,考慮的主要因素有:食品x1,菸酒及其用品x2,衣著x3,家庭裝置用品和維修服務x4,醫療保健和個人用品x5,交通和通訊x6,娛樂教育文化用品和服務x7,居住x8。建立多元線性迴歸模型。其表示式為:Y=b0+ bixi,式中b0,…,b8為迴歸係數。建模資料,見表1。

  二、用SPSS求迴歸係數及分析

  使用SPSS軟體對錶1的因變數與所有自變數做相關分析,可得迴歸方程:

  Y=-8.399+0.282x1+0.191x2+0.111x3+0.071x4+0.015x5+0.089x6+0.118x7+0.21x81

  由此可知,所定義的各自變數對居民消費價格指數Y的影響都比較顯著,且能通過檢驗F=612.780。

  關於模型是否成立的方差分析結果,可以看出,自變數對因變數有解釋作用,所建立的線性迴歸模型具有合理性。

  三、模型的檢驗與分析

  建立多元線性迴歸數學模型後,還需要進行檢驗處理,使得到的數學模型更加完善。

  1、擬合優度檢驗。

  係數R2=0.998,測度了迴歸直線對資料的擬合程度,即迴歸方程中的8個自變數可以對價格指數Y進行99.8%的解釋。說明迴歸方程的擬合度不錯,模型較好地反映了8個自變數對CPI變動的共同影響。迴歸估計的標準誤差S=0.1478,它是衡量回歸直線代表性大小的統計分析指標,說明樣本回歸效果較好。

  2、共線性檢驗與分析。

  在實際問題的分析中,往往涉及的自變數個數較多,這樣在建立模型時就可能會出現嚴重的共線性,也給合理分析問題和解決問題帶來困難。因此,需要對迴歸方程中的變數進行共線性診斷,並且確定它們對引數估計的影響。當變數的方差膨脹因子VIF值大於2被認為有共線性問題。由用SPSS軟體分析的共線性診斷表得知,各指標的VIF值都較大,條件指數大於30,特徵根為0或接近於0,表示這些自變數存在多重共線性;常量與菸酒用品、家庭裝置及維修這三項的方差比例值均很高,分別為0.94、0.91、0.81,表示三者高度相關。

  3、主成分分析。

  下面用主成分分析法對模型的原變數進行處理。表4表4中前4個主成分特徵值的累積貢獻率為90.158%,反映了原指標90.158%的資訊,後面的特徵值貢獻越來越少,因此,也可用前4個主成分來代替原來的8個指標變數。Z1、Z2、Z3、Z4表示主成分。

  成分得分系數表示某個主成分中,各變數所起作用的大小,其絕對值越大表示主成分對該變數的代表性也越大。其中,第一主成分主要與食品、家庭裝置用品及維修服務相關;第二主成分主要與衣著、交通和通訊、娛樂教育文化用品及服務相關;第三主成分主要與菸酒及用品、醫療保健和個人用品相關;第四主成分與居住呈現高度相關。每個主成分都可由它的特徵向量給出主成分方程。用SPSS將得到的4個主成分因子作為自變數建立多元線性迴歸方程:Y=101.648+2.878Z1+1.103Z2+0.673Z3+0.619Z4,帶入4個主成分方程可得:Y=101.648+0.9371X1+0.6391X2+0.42X3+0.7054X4+0.0153X5+0.7445X6+0.5489X7+1.0236X8,這裡的Xii=1,…,8為標準指標變數。

  分析主成分迴歸結果,R2=0.964,方差分析p=0.000,模型擬合較好。

  將標準自變數還原為原自變數,得到消除共線影響後的Y與原自變數之間的線性迴歸方程:

  Y=-78.5485+0.11805x1+0.52518x2+0.22392x3+0.35219x4+0.00609x5+0.20905x6+0.12291x7+0.24395x82

  經過上述分析可知所得方程2比方程1更加合理。

  四、結論及建議

  通過對模型的分析可知,各自變數均對廣西居民消費價格指數有正向推動作用。

  首先,中國CPI中食品的權重佔到34%,食品價格的上漲對於CPI上漲有很大的推動作用。食品價格指數每提高1%會導致居民消費指數增長0.282%,標準化迴歸係數Beta=0.685,說明具有非常強的影響效果。廣西第一產業的發展較落後,農業生產效率較低,造成農產品供求失衡。2009年廣西農業增加值佔生產總值比重首次降到20%以下,2010年的西南大旱使得糧食總產量同比下降3.9%,而遊資炒作更加推高了廣西部分農產品價格。因此,應大力推動現代農業發展,推廣節本高效農業技術,保障農產品有效供給。政府部門可制定相關的措施抑制主要農資價格的上揚,加強農業生產資料和主要農產品的市場調控,穩定食品價格。

  其次,CPI持續上漲的主要驅動因素中居住的上漲趨勢也非常明顯。近年來,廣西北部灣經濟區開發建設和城鎮化建設快速推進,環境的改善吸引了外來購買力,從而擴大了對房地產市場的需求。房地產價格的一路攀升,對整體物價的上漲具有很大的刺激作用,成為居民消費的主要支出和生活負擔。建議繼續加強和改善房地產調控,採取長效措施遏制房價過快上漲,同時在引導商品房產業健康發展的同時,結合舊城改造大力建設保障性住房,增加住房有效供應,打擊投資投機。

  參考文獻:

  [1]宋志剛,謝蕾蕾,何旭洪.SPSS16實用[M].北京:科技出版社,2004.

  [2]楊凌雲,王凡彬,潘瑞,樑傑.CPI指數預測的統計迴歸模型.重慶文理學院學報自然科學版,2010.2.

  [3]李毛俠.安徽省消費需求影響因素的主成分迴歸分析.現代物業,2010.2.

  篇2

  對統計中相關分析與迴歸分析的論述

  摘要:客觀事物之間存在一定的依存關係,對這種關係的分析具有重要意義。本文闡述了相關分析與迴歸分析的概念,提出了分析中應注意的問題。

  關鍵詞:依存關係;相關分析;迴歸分析;

  一切客觀事物都是互相聯絡的。而且每一事物的運動都和它的周圍其它事物相聯絡互相影響。客觀現象間的互相聯絡,可以通過一定的數量關係反映出來。例如氣溫與降雨量之間,消費品需求量與居民收入水平之間,勞動生產率與產品成本之間,投入與產出之間等等,都存在著一定的依存關係。

  一、相關分析與迴歸分析的概念。

  一客觀現象之間存在的互相依存關係叫相關關係,對現象之間相關關係密切程度的研究,叫相關分析。相關分析具有如下兩個特點。

  1.現象之間確實存在著數量上的依存關係。

  如果一個現象發生數量上的變化,則另一個現象也會相應地發生數量上的變化。例如商品流通費增加,一般商品銷售額也會增加,反過來,如果商品銷售額增加,一般商品流通費也要增加。身材較高的人,一般體重也較重。反過來,體重較重的人,一般身材也較高。再如,年齡與血壓、播種量與糧食收穫量之間等等都有數量上的依存關係。

  2.現象之間數量上的關係不是確定的。

  相關關係的全稱為統計相關關係,它屬於變數之間的一種不完全確定的關係。這意味著一個變數雖然受另一個或一組變數影響,卻並不由這一個或一組變數完全確定。例如,身高1.7米的人其體重有許多個值;體重為60公斤的人,其身高也有許多個值。身高與體重之間沒有完全嚴格確定的數量關係存在。再如產品單位成本和勞動生產率的變動之間存在著一定的依存關係,但是除了勞動生產率的變動以外,還會受到材料消耗、裝置折舊、能源耗用以及管理費用等諸因素變動的影響。

  由此可見,相關關係是現象間確實存在的,但相關關係數值是不完全確定的相互依存關係。

  二回歸分析的概念。相關關係說明現象間有關係,但它不能說明一個現象發生一定量的變化。也就是說,它不能說明兩個變數之間的一般關係值。

  迴歸分析是指對具有相關關係的現象,根據其關係形態,選擇一個適合的數學模型稱為迴歸方程式,用來近似的表示變數間的平均變化關係的一種統計分析方法。它實際上是相關現象間不確定、不規則的數量關係一般化、規則化。

  二、相關分析與迴歸分析的區別與聯絡

  一、相關分析與迴歸分析的區別:

  1.相關分析所研究的兩個變數是對等關係,迴歸分析所研究的兩個變數不是對等關係,必須根據研究目的,先確定其中一個是自變數,另一個是因變數。

  2.對兩個變數x和y來說,相關分析只能計算出―個反映出一個反映兩個變數間相關密切程度的相關係數,計算中改變x和y的地位不影響相關係數的數值;迴歸分析有時可以根據研究目的不同分別建立兩個不同的迴歸方程。以x自變數,y為因變數,可以得出y對x的迴歸方程。以y為自變數,x為因變數,可得出x對y的迴歸方程。

  3.相關分析對資料的要求是,兩個變數都必須是隨機變數,而回歸分析對資料的要求是,自變數是可以控制的變數給定的變數,因變數是隨機變數。

  二、相關分析與迴歸分析的聯絡

  1.相關分析是迴歸分析的基礎和前提。如果缺少相關關係,沒有從定性上說明現象間是否具有相關關係,沒有對相關關係的密切程度作出判斷,就不能進行迴歸分析,即便勉強進行了迴歸分析,也是沒有實際意義的。

  2.迴歸分析是相關分析的深入和繼續。僅僅說明現象具有密切的相關關係是不夠的,只有進行了迴歸分析,擬合了迴歸方程,才可能進行有關分析的迴歸預測,相關分析才有實際的意義。因此,如果僅有迴歸分析而缺少相關分析,將會因為缺乏必要的基礎和前提而影響迴歸分析的可靠性;如果僅有相關分析而缺少迴歸分析,就會降低相關分析的意義。只有把兩者結合起來,才能達到統計分析的目的。

  三、應用相關分析與迴歸分析應注意的問題

  一在定性分析的基礎上進行定量分析

  在定性分析的基礎上進行定量分析,是保證正確運用相關分析和迴歸分析的必要條件。也就是在確定哪些變數作自變數,哪些變數作因變數之前,必須對所研究的問題有充分正確的認識。相關分析的方法解釋不了相關關係產生的原因,它本身不能判斷現象之間是否存在相關關係。

  二要注意現象質的界限及相關關係作用的範圍

  在進行相關分析和迴歸分析時要注意現象質的界限及相關關係作用的範圍。超出了這個範圍,分析結果就會歪曲事實。我們用數學模型得到的迴歸方程,一般都是根據一定範圍內的有限資料來計算的,其有效性,一般只適用於該範圍內,不適宜用於該範圍外。也就是說利用迴歸方程,一般只適宜用於內插預測,不宜用於外推預測。這是因為最小平方法指的是對現有資料範圍配合一條“最佳”線,如果外推到範圍以外,就不一定是“最佳”線了。根據樣本資料所建立的迴歸方程的代表了經濟變數之間的數量關係,這種關係是在一定條件下建立的,因此也只能在一定的條件下才能夠成立,忽視了相關關係建立的條件,把這種關係無限制地向外推廣是不正確的,由此得到的結論是值得懷疑的。例如施肥量和農作物生產量只在一定的範圍內才具有正相關關係。

  三要具體問題具體分析

  迴歸方程是根據實際統計資料計算的,一般是一種經驗公式。因此在分析時一定要注意具體問題具體分析。若條件發生變化,不能機械照搬,以免造成失誤。利用迴歸方程對經濟現象進行分析,最後得到的經濟變數之間的數量關係是一種統計關係,要使我們所得到的這種關係具有真實性、可靠性,排除偶然性,一定要注意對具體問題分析,並注意對經濟現象的觀察必須是大量的。

  四要考慮社會經濟現象的複雜性

  社會經濟現象之間的關係比較自然技術現象之間的關係複雜得多。影響社會經濟現象之間關係的不僅有自然技術因素,而且有政治的,經濟的,道德的甚至心理的因素等等。而且社會條件的變化比較多和比較快,因此,在推廣應用是要注意社會經濟現象的複雜性。

  五對迴歸模型中計算出來的引數的有效性應進行檢驗

  在迴歸分析中對迴歸模型計算出來的引數包括常數項及迴歸係數的有效性應進行顯著性檢驗,以判斷迴歸預測的有效性。經過檢驗,如發現某迴歸係數的數值沒有顯著意義,或某些自變數間存在著多重共線性,則具有這種情況的自變數應從迴歸方程中剔除出去,以保證迴歸預測的有效性。