11. 5 迴歸模型的殘差分析 判定假設的正確性,先假定「迴歸模型的假設是正確,然後再利用現有的資料去驗証其正確性」。此現有的資料就是殘差,因為所有變化的資料均在殘差內,所以利用分析殘差的結果來判斷假設的正確性是合理可行的,此謂之「殘差分析」。 但必須知道「即使所有的假設均通過驗証,也不能完全斷言迴歸模式是正確無誤,而僅能表示以現有的資料,並不能判定其不合理」。 要分析殘差以驗証假設,可用圖示法來分析: A. 繪殘差次數分配圖,判定是否為常態分配。 B. 依收集資料的順序,繪殘差點圖。 C. 繪殘差 e i 與迴歸估計值 y i 的對應圖。 D. 繪殘差 e i 與自變數 X (即 x i )的對應圖。
12. 5.1 殘差相關變數和意義 未標準化的預測量(估計量: PRED ) 估計量為 , i=1 、 2 、 ... 、 n 估計值為 , i=1 、 2 、 ... 、 n 1 Leverage 值( Hat 矩陣對角元素 h i : LEVER ) 2 預測值的標準差( SPERED ) 3
16. 5.2 驗証常態分配 要驗証誤差變數是否具常態分配,可繪殘差次數分配圖,由該圖可概略判斷母群體的誤差變數是否是常態分配?且其平均數(期望值)是否為零。 另一種方法是利用「常態點圖( normal plot )」,將每個殘差分別描繪在圖上。若誤差變數是常態分配,則圖上點之連線應近似一直線。
17. 5.3 驗証變異數(標準差)相等 《圖 18.5-1 》標準常態分配機率圖 繪標準化殘差次數分配圖 1 繪殘差 e i 與迴歸估計值 y i 的對應圖 2 繪殘差 e i 與自變數 X 的對應圖 3
18. 5.4 驗証線性假設 若自變數只有一個,則可繪依變數和自變數的散佈圖,檢視此圖是否近似直線。若否,就不應該以此兩變數作簡單迴歸分析。 繪「殘差 e i 與迴歸估計值 y i 的對應圖」和「殘差 e i 與自變數 X 的對應圖」。若圖型顯示不成一「以零為中心的水平帶狀」時,也表示其關係並非線性。此時也可利用將依變數轉換的方式處理(如取對數或開根號等)。 1 2