1. 回歸模型的能解決什麼問題
多元線性回歸模型表示一種地理現象與另外多種地理現象的依存關系,這時另外多種地理現象共同對一種地理現象產生影響,作為影響其分布與發展的重要因素。
設變數Y與變數X1,X2,…,Xm存在著線性回歸關系,它的n個樣本觀測值為Yj,Xj1,Xj2,…Xjm(j=1,2,n),於是多元線性回歸的數學模型可以寫為:
可採用最小二乘法對上式中的待估回歸系數β0,β1,…,βm進行估計,求得β值後,即可利用多元線性回歸模型進行預測了。
計算了多元線性回歸方程之後,為了將它用於解決實際預測問題,還必須進行數學檢驗。多元線性回歸分析的數學檢驗,包括回歸方程和回歸系數的顯著性檢驗。
回歸方程的顯著性檢驗,採用統計量:
式中: ,為回歸平方和,其自由度為m; ,為剩餘平方和,其自由度為(n-m-1)。
利用上式計算出F值後,再利用F分布表進行檢驗。給定顯著性水平α,在F分布表中查出自由度為m和(n-m-1)的值Fα,如果F≥Fα,則說明Y與X1,X2,…,Xm的線性相關密切;反之,則說明兩者線性關系不密切。
回歸系數的顯著性檢驗,採用統計量:
式中,Cii為相關矩陣C=A-1的對角線上的元素。
對於給定的置信水平α,查F分布表得Fα(n-m-1),若計算值Fi≥Fα,則拒絕原假設,即認為Xi是重要變數,反之,則認為Xi變數可以剔除。
多元線性回歸模型的精度,可以利用剩餘標准差
來衡量。S越小,則用回歸方程預測Y越精確;反之亦然。
2. 相關線性回歸問題,要詳細過程。。以下為10家商店銷售額和利潤率的資料:
⊙﹏⊙b汗!這個很多年沒接觸啦。朋友,希望有人能幫助你。
3. 多重共線性問題的幾種解決方法
多重共線性問題的幾種解決方法
在多元線性回歸模型經典假設中,其重要假定之一是回歸模型的解釋變數之間不存在線性關系,也就是說,解釋變數X1,X2,……,Xk中的任何一個都不能是其他解釋變數的線性組合。如果違背這一假定,即線性回歸模型中某一個解釋變數與其他解釋變數間存在線性關系,就稱線性回歸模型中存在多重共線性。多重共線性違背了解釋變數間不相關的古典假設,將給普通最小二乘法帶來嚴重後果。
這里,我們總結了8個處理多重共線性問題的可用方法,大家在遇到多重共線性問題時可作參考:
1、保留重要解釋變數,去掉次要或可替代解釋變數
2、用相對數變數替代絕對數變數
3、差分法
4、逐步回歸分析
5、主成份分析
6、偏最小二乘回歸
7、嶺回歸
8、增加樣本容量
這次我們主要研究逐步回歸分析方法是如何處理多重共線性問題的。
逐步回歸分析方法的基本思想是通過相關系數r 、擬合優度R2 和標准誤差三個方面綜合判斷一系列回歸方程的優劣,從而得到最優回歸方程。具體方法分為兩步:
第一步,先將被解釋變數y對每個解釋變數作簡單回歸:
對每一個回歸方程進行統計檢驗分析(相關系數r 、擬合優度R2 和標准誤差),並結合經濟理論分析選出最優回歸方程,也稱為基本回歸方程。
第二步,將其他解釋變數逐一引入到基本回歸方程中,建立一系列回歸方程,根據每個新加的解釋變數的標准差和復相關系數來考察其對每個回歸系數的影響,一般根據如下標准進行分類判別:
1.如果新引進的解釋變數使R2 得到提高,而其他參數回歸系數在統計上和經濟理論上仍然合理,則認為這個新引入的變數對回歸模型是有利的,可以作為解釋變數予以保留。
2.如果新引進的解釋變數對R2 改進不明顯,對其他回歸系數也沒有多大影響,則不必保留在回歸模型中。
3.如果新引進的解釋變數不僅改變了R2 ,而且對其他回歸系數的數值或符號具有明顯影響,則認為該解釋變數為不利變數,引進後會使回歸模型出現多重共線性問題。不利變數未必是多餘的,如果它可能對被解釋變數是不可缺少的,則不能簡單舍棄,而是應研究改善模型的形式,尋找更符合實際的模型,重新進行估計。如果通過檢驗證明回歸模型存在明顯線性相關的兩個解釋變數中的其中一個可以被另一個很好地解釋,則可略去其中對被解釋變數影響較小的那個變數,模型中保留影響較大的那個變數。
下邊我們通過實例來說明逐步回歸分析方法在解決多重共線性問題上的具體應用過程。
具體實例
例1 設某地10年間有關服裝消費、可支配收入、流動資產、服裝類物價指數、總物價指數的調查數據如表1,請建立需求函數模型。
表1 服裝消費及相關變數調查數據
年份
服裝開支
C
(百萬元)
可支配收入
Y
(百萬元)
流動資產
L
(百萬元)
服裝類物價指數Pc
1992年=100
總物價指數
P0
1992年=100
1988
8.4
82.9
17.1
92
94
1989
9.6
88.0
21.3
93
96
1990
10.4
99.9
25.1
96
97
1991
11.4
105.3
29.0
94
97
1992
12.2
117.7
34.0
100
100
1993
14.2
131.0
40.0
101
101
1994
15.8
148.2
44.0
105
104
1995
17.9
161.8
49.0
112
109
1996
19.3
174.2
51.0
112
111
1997
20.8
184.7
53.0
112
111
(1)設對服裝的需求函數為
用最小二乘法估計得估計模型:
模型的檢驗量得分,R2=0.998,D·W=3.383,F=626.4634
R2接近1,說明該回歸模型與原始數據擬合得很好。由得出拒絕零假設,認為服裝支出與解釋變數間存在顯著關系。
(2)求各解釋變數的基本相關系數
上述基本相關系數表明解釋變數間高度相關,也就是存在較嚴重的多重共線性。
(3)為檢驗多重共線性的影響,作如下簡單回歸:
各方程下邊括弧內的數字分別表示的是對應解釋變數系數的t檢驗值。
觀察以上四個方程,根據經濟理論和統計檢驗(t檢驗值=41.937最大,擬合優度也最高),收入Y是最重要的解釋變數,從而得出最優簡單回歸方程。
(4)將其餘變數逐個引入,計算結果如下表2:
表2服裝消費模型的估計
結果分析:
①在最優簡單回歸方程中引入變數Pc,使R2由0.9955提高到0.9957;根據經濟理論分析,正號,負號是合理的。然而t檢驗不顯著(),而從經濟理論分析,Pc應該是重要因素。雖然Y與Pc高度相關,但並不影響收入Y回歸系數的顯著性和穩定性。依照第1條判別標准,Pc可能是「有利變數」,暫時給予保留。
②模型中引入變數L ,R2 由0.9957提高到0.9959, 值略有提高。一方面,雖然Y 與L ,Pc與L 均高度相關,但是L 的引入對回歸系數、的影響不大(其中的值由0.1257變為0.1387,值由-0.0361變為-0.0345,變化很小);另一方面,根據經濟理論的分析,L與服裝支出C之間應該是正相關關系,即的符號應該為正號而非負號,依照第2條判別標准,解釋變數L不必保留在模型中。
③捨去變數L ,加入變數P0 ,使R2 由0.9957提高到0.9980,R2 值改進較大。、、均顯著(這三個回歸系數的t檢驗值絕對值均大於),從經濟意義上看也是合理的(服裝支出C與Y,P0之間呈正相關,而與服裝價格Pc之間呈負相關關系)。根據判別標准第1條,可以認為Pc、P0皆為「有利變數」,給予保留。
④最後再引入變數L ,此時R2 =0.9980沒有增加(或幾乎沒有增加),新引入變數對其他三個解釋變數的參數系數也沒有產生多大影響,可以確定L 是多餘變數,根據判別標准第2條,解釋變數L 不必保留在模型中。
因此我們得到如下結論:回歸模型為最優模型。
通過以上案例的分析,我們從理論和實際問題兩方面具體了解了逐步回歸分析是如何對多重共線性問題進行處理的。事實上,一般統計軟體如SPSS,在回歸模型的窗口中都會提供變數逐步進入的選項,勾選後實際上就是選擇了運用逐步回歸的思想來構建回歸模型。運用SPSS軟體不需要我們懂得其背後的運行規律,然而作為分析師,了解並理解模型背後的理論知識,將更有助於我們理解模型、解釋結論背後的內在含義,從而達到更好地分析問題的目的。
4. 關於線性回歸演算法還可以解決日常生活中哪些問題
趨勢線
一條趨勢線代表著時間序列數據的長期走勢。它告訴我們一組特定數據(如GDP、石油價格和股票價格)是否在一段時期內增長或下降。雖然我們可以用肉眼觀察數據點在坐標系的位置大體畫出趨勢線,更恰當的方法是利用線性回歸計算出趨勢線的位置和斜率。
流行病學
有關吸煙對死亡率和發病率影響的早期證據來自採用了回歸分析的觀察性研究。為了在分析觀測數據時減少偽相關,除最感興趣的變數之外,通常研究人員還會在他們的回歸模型里包括一些額外變數。例如,假設我們有一個回歸模型,在這個回歸模型中吸煙行為是我們最感興趣的獨立變數,其相關變數是經數年觀察得到的吸煙者壽命。研究人員可能將社會經濟地位當成一個額外的獨立變數,已確保任何經觀察所得的吸煙對壽命的影響不是由於教育或收入差異引起的。然而,我們不可能把所有可能混淆結果的變數都加入到實證分析中。例如,某種不存在的基因可能會增加人死亡的幾率,還會讓人的吸煙量增加。因此,比起採用觀察數據的回歸分析得出的結論,隨機對照試驗常能產生更令人信服的因果關系證據。當可控實驗不可行時,回歸分析的衍生,如工具變數回歸,可嘗試用來估計觀測數據的因果關系。
金融
資本資產定價模型利用線性回歸以及Beta系數的概念分析和計算投資的系統風險。這是從聯系投資回報和所有風險性資產回報的模型Beta系數直接得出的。
經濟學
線性回歸是經濟學的主要實證工具。例如,它是用來預測消費支出,固定投資支出,存貨投資,一國出口產品的購買,進口支出,要求持有流動性資產,勞動力需求、勞動力供給。
5. 多元線性回歸在解決實際問題上的基本思想以及主要步驟是什麼。
由多個自變數的最優組合共同來預測或估計因變數。是用來做預測的。你可以用eviews或者spss都可以,多元線性回歸模型算是比較基礎的了。步驟包括變數設置、數據採集、數據擬合、檢驗、預測等。
6. 線性回歸方程需要注意哪些問題,如何處理
建立回歸方程應注意以下幾點:
(1)討論的問題要有意義,回歸方程的選擇要符合實際需要。
(2)擬合都是在一定范圍內進行的,即在我們處理的數據的范圍內。不能把我們得到的回歸方程任意擴大范圍。比如,我們處理人的身高和體重,其身高在1.6—1.9米。它們的關系可以近似是一條直線,但是超出這個范圍,例如身高2米以上,就可能就是一條曲線。
(3)由最小二乘法的解法,不難看出,x關於y的回歸方程,與y關於x的回歸方程不是互為反函數的關系。這在中學無需討論,但教師應該有所了解。 (4)得到了回歸方程bxay後,可以用它來作預報和控制。預報是指給定x的值代入回歸方程,得到y的預報值。控制是指,要求y達到某一確定的值,利用回歸方程確定x的值
7. 線性回歸的優缺點
了解決多元線性回歸中自變數之間的多重共線性問題,常用的有三種方法: 嶺回歸、主成分回歸和偏最小二乘回歸。本文以考察職工平均貨幣工資為例,利用三種方法的sas程序進行了回歸分析,根據分析結果總結出三種方法的優缺點,結果表明如果能夠使用定性分析和定量分析結合的方法確定一個合適的k值,則嶺回歸可以很好地消除共線性影響;主成分回歸和偏最小二乘回歸採用成份提取的方法進行回歸建模,由於偏最小二乘回歸考慮到與因變數的關系,因而比主成分回歸更具優越性。
8. 我在寫一篇統計學論文,是使用一元線性回歸分析來解決生活中或者社會中的實際問題的研究課題,
整個環節是一體的一個過程,學術容不得造假的,所以自己得親自體驗啊,一元線性回歸其實在實際中並不多見,如農業的年份和產量之類可能存在;在試驗研究中的某個環節相對來說較多,比如吸光度和濃度的關系等,所以你首先得明確方向,你要做哪一方面的論文。
9. 什麼是回歸分析回歸分析有什麼用主要解決什麼問題
我只介紹一元線性回歸的基本思想。 我們作一系列的隨機試驗,得到n組數據: (x1,y1),(x2,y2),…,(xn,yn). 如果我們研究的是確定性現象,當然這n個點是在同一直線上的。但是現在X與Y都是隨機變數,即使X與Y之間真的存在線性關系,即確實有Y=aX+b的關系成立,由於隨機因素的作用,一般地說,這n個點也不會在同一直線上。而X與Y之間實際上並不存在線性關系,由於隨機因素的作用,這n個點在平面上也可能排成象在一條直線上那樣的。回歸分析,就是要解決這樣的問題,即從試驗得到的這樣一組數據,我們是否應該相信X與Y之間存在線性關系,這當然要用到概率論的思想與方法。
10. 多元線性回歸分析要解決的主要問題是什麼
主要解決的是兩組變數之間的因果關系