大樣本下的杜賓-沃森檢驗革新:用Z檢定替代傳統查表法
作者:Mei-Yu Lee
杜賓-沃森檢定(Durbin-Watson test)
大樣本理論
Z檢定
自由度
中央極限定理
1
研究背景與痛點
杜賓-沃森(Durbin-Watson)檢定是檢測時間序列數據序列相關性的經典方法,但傳統方法依賴預先計算的臨界值表(如Savin and White, 1977),存在兩大問題:
- 臨界值有界性:DW檢定表給出固定範圍值,而非基於真實分布(如\(Z/t/χ²\)分布),違反假設檢定的理論基礎。
- 小樣本局限:傳統認為DW檢定僅適用於小樣本,對「大樣本」的界定模糊(如Lee, 2014b指出LM檢定需\(>1000\)樣本)。
關鍵問題
DW統計量的真實抽樣分布未知,且其計算依賴迴歸殘差,受模型設定限制(Lee, 2014a)。
2
核心發現:DW統計量的大樣本性質
通過大規模電腦模擬(\(32,768×2×1024\)次重複計算),作者驗證以下結論:
1. DW統計量的期望值與變異數
- 期望值\(E(DW)\)恆為2:在無序列相關的虛無假設下,無論樣本大小,DW統計量的均值穩定趨近於\(2\)(表2)。
- 變異數 - \(Var(DW)\) - 與自由度相關:
當 自由度 - \(df = T−k−1 > 200\) 時:
$$\text{Var(DW)} \approx \frac{4}{df}$$
當 \(df ≤ 200\) 時:
$$\text{Var(DW)} \approx 0.0027 + \frac{3.1188}{df}$$
自由度定義
\(T\)為樣本數,\(k\)為自變量個數。
2. 大樣本下服從常態分布
- 當 樣本量(\(T ≥ 200\)) 時,DW統計量的抽樣分布收斂於常態分布(中央極限定理)。
- 偏態\(γ₁(DW)≈0\)、峰態\(γ₂(DW)≈2.7\)(圖1),符合常態分布特徵。
3. 自變量與自由度的影響
- 小樣本(\(df\)小):自變量的取值會顯著干擾DW統計量分布(圖1)。
- 大樣本(\(df ≥ 50\)):干擾消失,分布穩定性增強(圖2)。
3
實踐應用:DW檢定的Z檢定公式
基於上述結論,作者提出 Z檢定替代傳統DW查表法,適用條件為 \(df ≥ 50\):
假設檢定類型 | Z統計量公式 | 拒絕域 |
---|---|---|
雙尾檢定 \(H₁: ρ ≠ 0\) | $$ Z = \frac{2 - \text{DW}}{\sqrt{\text{Var(DW)}}} $$ | \(\|Z\| > Z_{α/2}\) |
左尾檢定 \(H₁: ρ < 0\) | 同上 | \( Z < -Z_{α} \) |
右尾檢定 \(H₁: ρ > 0\) | 同上 | \(Z > Z_{α}\) |
重要限制
- \(df\) 小於 50 時:Z檢定可能失效,建議以模擬方式處理。
- \(df\) 小於 30 時:必須基於具體案例計算臨界值。
4
模擬實驗設計
1. 數據生成
- 設定線性迴歸模型:$$ Y = X B + \varepsilon $$(誤差項ε獨立同分布)。
- 自變量 \(X\) 取值固定,係數 \(β\) 全設為\(0\)(消除參數估計干擾)。
2. 重複計算
- 生成殘差 → 計算DW統計量
- 重複 \(2^{16} = 65,536\) 次。
3. 統計量提取
- 從抽樣分布中計算 \(E(DW)\) 、 \( Var(DW)\) 、偏態、峰態。
5
研究價值總結
理論突破
首次建立DW統計量變異數與自由度的數學關係,解決傳統臨界值表的理論缺陷。
應用革新
\(df ≥ 50\) 時,Z檢定提供更簡便、標準化的序列相關性檢測工具。
實用建議
- 大樣本( \(df ≥ 200\) ):直接使用 $$ \text{Var(DW)} = 4/df $$
- 簡單迴歸模型:DW檢定在 \(df ≥ 15\) 時已表現優異(表2 Case 4)。
論文原文
Lee, M-Y. (2016). Int. J. Computational Economics and Econometrics, 6(1), 114–121.
結語
這項研究將杜賓-沃森檢定從「查表時代」推進到「公式化時代」,為計量經濟學提供了更嚴謹的大樣本理論支持。下次當您的迴歸分析自由度超過50時,不妨嘗試直接用Z檢驗取代傳統查表法!
延伸閱讀
- 傳統DW臨界值表:Stanford University Reference
- 作者提供的DW模擬軟體:Welsh Corgi Program (已停止供應)
- 作者出版專作:Demythologize Durbin-Watson Test Statistic
Social Plugin