从0开始学习R语言--Day42--LM检验
区别于Moran's I检验,前者在初步观察空间数据的分布时,能给出暗含规律的结果,但具体是什么规律是无法分辨的,而LM检验可以给出到底是因为邻接的数据还是因为其他的因素,比如在分析房价起伏时,前者只能给出房价高的扎堆在一起,有某种规律,而后者可以给出类似一片区域靠近学校,所以这片区域的房价较高的结论。
以下是一个例子:
library(spdep)
library(spatialreg)# 生成模拟空间数据集
set.seed(123)
n <- 100 # 观测点数量
x <- runif(n, 0, 10) # x坐标
y <- runif(n, 0, 10) # y坐标
coords <- cbind(x, y) # 坐标矩阵# 创建空间权重矩阵(这里使用k近邻,k=4)
knn <- knn2nb(knearneigh(coords, k=4))
W <- nb2listw(knn, style="W") # 行标准化权重矩阵# 生成解释变量和被解释变量
X1 <- rnorm(n)
X2 <- rnorm(n)
# 生成具有空间自相关的误差项
rho <- 0.4 # 空间自相关系数
e <- solve(diag(n) - rho * listw2mat(W), rnorm(n))
Y <- 2 + 1.5*X1 - 0.8*X2 + e # 真实模型包含空间误差# 拟合普通OLS模型
ols_model <- lm(Y ~ X1 + X2)# 进行LM检验
lm_tests <- lm.LMtests(ols_model, listw=W, test=c("LMerr", "LMlag", "RLMerr", "RLMlag", "SARMA"))
summary(lm_tests)# 查看检验结果
print(lm_tests)
输出:
Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial dependencedata:
model: lm(formula = Y ~ X1 + X2)
test weights: listwRSerr = 0.9902, df = 1, p-value = 0.3197Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial dependencedata:
model: lm(formula = Y ~ X1 + X2)
test weights: listwRSlag = 4.5736, df = 1, p-value = 0.03247Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial dependencedata:
model: lm(formula = Y ~ X1 + X2)
test weights: listwadjRSerr = 0.6968, df = 1, p-value = 0.4039Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial dependencedata:
model: lm(formula = Y ~ X1 + X2)
test weights: listwadjRSlag = 4.2802, df = 1, p-value = 0.03856Rao's score (a.k.a Lagrange multiplier) diagnostics for spatial dependencedata:
model: lm(formula = Y ~ X1 + X2)
test weights: listwSARMA = 5.2704, df = 2, p-value = 0.0717
结果显示,LM-error的p值大于0.05,说明误差项中没有显著的空间自相关,不需要考虑这个;而LM-lag的p小于0.05,说明在分析时需要考虑空间的滞后项,也就是数据点临近数据对其的影响。