大樣本下的杜賓-沃森檢驗革新:用Z檢驗替代傳統查表法

大樣本下的杜賓-沃森檢驗革新:用Z檢驗替代傳統查表法

大樣本下的杜賓-沃森檢驗革新:用Z檢定替代傳統查表法

作者:Mei-Yu Lee
杜賓-沃森檢定(Durbin-Watson test) 大樣本理論 Z檢定 自由度 中央極限定理
論文截圖
1

研究背景與痛點

杜賓-沃森(Durbin-Watson)檢定是檢測時間序列數據序列相關性的經典方法,但傳統方法依賴預先計算的臨界值表(如Savin and White, 1977),存在兩大問題:

  • 臨界值有界性:DW檢定表給出固定範圍值,而非基於真實分布(如\(Z/t/χ²\)分布),違反假設檢定的理論基礎。
  • 小樣本局限:傳統認為DW檢定僅適用於小樣本,對「大樣本」的界定模糊(如Lee, 2014b指出LM檢定需\(>1000\)樣本)。

關鍵問題

DW統計量的真實抽樣分布未知,且其計算依賴迴歸殘差,受模型設定限制(Lee, 2014a)。

2

核心發現:DW統計量的大樣本性質

通過大規模電腦模擬(\(32,768×2×1024\)次重複計算),作者驗證以下結論:

1. DW統計量的期望值與變異數

  • 期望值\(E(DW)\)恆為2:在無序列相關的虛無假設下,無論樣本大小,DW統計量的均值穩定趨近於\(2\)(表2)。
  • 變異數 - \(Var(DW)\) - 與自由度相關

自由度 - \(df = T−k−1 > 200\) 時:

$$\text{Var(DW)} \approx \frac{4}{df}$$

\(df ≤ 200\) 時:

$$\text{Var(DW)} \approx 0.0027 + \frac{3.1188}{df}$$

自由度定義

\(T\)為樣本數,\(k\)為自變量個數。

2. 大樣本下服從常態分布

  • 樣本量(\(T ≥ 200\)) 時,DW統計量的抽樣分布收斂於常態分布(中央極限定理)。
  • 偏態\(γ₁(DW)≈0\)、峰態\(γ₂(DW)≈2.7\)(圖1),符合常態分布特徵。

3. 自變量與自由度的影響

  • 小樣本(\(df\)小):自變量的取值會顯著干擾DW統計量分布(圖1)。
  • 大樣本(\(df ≥ 50\)):干擾消失,分布穩定性增強(圖2)。
3

實踐應用:DW檢定的Z檢定公式

基於上述結論,作者提出 Z檢定替代傳統DW查表法,適用條件為 \(df ≥ 50\)

假設檢定類型 Z統計量公式 拒絕域
雙尾檢定 \(H₁: ρ ≠ 0\) $$ Z = \frac{2 - \text{DW}}{\sqrt{\text{Var(DW)}}} $$ \(\|Z\| > Z_{α/2}\)
左尾檢定 \(H₁: ρ < 0\) 同上 \( Z < -Z_{α} \)
右尾檢定 \(H₁: ρ > 0\) 同上 \(Z > Z_{α}\)

重要限制

  • \(df\) 小於 50 時:Z檢定可能失效,建議以模擬方式處理。
  • \(df\) 小於 30 時:必須基於具體案例計算臨界值。
4

模擬實驗設計

1. 數據生成

  • 設定線性迴歸模型:$$ Y = X B + \varepsilon $$(誤差項ε獨立同分布)。
  • 自變量 \(X\) 取值固定,係數 \(β\) 全設為\(0\)(消除參數估計干擾)。

2. 重複計算

  • 生成殘差 → 計算DW統計量
  • 重複 \(2^{16} = 65,536\) 次。

3. 統計量提取

  • 從抽樣分布中計算 \(E(DW)\) 、 \( Var(DW)\) 、偏態、峰態。
5

研究價值總結

理論突破

首次建立DW統計量變異數與自由度的數學關係,解決傳統臨界值表的理論缺陷。

應用革新

\(df ≥ 50\) 時,Z檢定提供更簡便、標準化的序列相關性檢測工具。

實用建議

  • 大樣本( \(df ≥ 200\) ):直接使用 $$ \text{Var(DW)} = 4/df $$
  • 簡單迴歸模型:DW檢定在 \(df ≥ 15\) 時已表現優異(表2 Case 4)。

論文原文

Lee, M-Y. (2016). Int. J. Computational Economics and Econometrics, 6(1), 114–121.

結語

這項研究將杜賓-沃森檢定從「查表時代」推進到「公式化時代」,為計量經濟學提供了更嚴謹的大樣本理論支持。下次當您的迴歸分析自由度超過50時,不妨嘗試直接用Z檢驗取代傳統查表法!

延伸閱讀