Geographically_Weighted_Regression。
# 序
GWmodelS 桌面端软件作为一款用户友好型的GWR建模软件,加载地理数据后能一键进行GWR分析,省去了自行创建权重文件等步骤。# 空间关系异质性/非平稳性特征
空间异质性(Spatial Heterogeneity)/空间非平稳性(Spatial Non-stationarity)是指生态、社会等空间过程和格局在空间分布上的不均匀性及其复杂性。因为存在空间异质性,所以在不同的研究区域或范围内,同一空间变量关系呈现不同的量化特征。
根据是否考虑到空间异质性,模型可分为全局模型和局部模型。全局模型对空间过程或变量关系建模的过程中,认为空间过程或变量关系是固定不变的,与空间位置无关。局部模型将全局模型在空间上进行了区分,结果具有典型的位置指向性特征。
# 基础GWR分析
地理加权回归越来越被更多的领域所运用,如流行病问题、环境问题、气候变化问题、生态多样性问题。在讲地理加权回归分析之前可以先看看基于最小二乘法的线性回归分析,基于最小二乘法的线性回归可以得到一组阐述,但该过程和空间没有什么关系。
线性回归分析的表达式
线性回归求出的 β0β1…βm 是常数,而地理加权回归求出的 β0(ui,vi)…βm(ui,vi) 是关于空间坐标的函数。(ui,vi)是在空间位置i处的空间坐标。
地理加权回归的系数估计是会根据空间变化而变化的,通过随空间位置变化而改变的模型系数估计,能反映出空间关系异质性。这也是和基于OLS的线性回归分析最不同的地方。
地理加权回归的表达式
线性回归的解算算子是线性最小二乘,地理加权回归的解算算子是加权线性最小二乘。根据不同核函数的选择可以得到不同的权重。
解算算子(加权线性最小二乘)
式子里的 W 是一个对角矩阵,如下所示。
下图中有六种基于距离衰减的权重计算方式,如果设 wij=1 ,那么地理加权回归会变成线性回归。
可以看到上图中绿色虚线对应的 Box-car ,在阈值内为1,阈值外为0。包括下面两个函数也是截断型的和上面连续型的,会需要设定一个阈值 b ,该阈值被称为带宽(Bandwidth)。
带宽分固定型带宽和可变型带宽。下图会解释得很清楚它们的区别。带宽的选择会造成地理加权回归不同的效果。那么优选方式有两个:
1.交叉验证
和机器学习的CV一样,在既定带宽下计算代价函数,然后作比较。选使得代价值最小的带宽。
2.Akaike Information Criterion(AIC信息准则)
输入好带宽后做出模型,然后诊断它。
通过模型的残差、R2、AIC来诊断这个地理加权回归模型的表现。
# GWR模型分析要点
1.GWR是否适用?
如果全球范围的研究以国家为单位进行区分,效果就不好,不适用。因为国家大小不一,带宽设定了也不好用等。
2.如何计算权重?
选什么核函数?距离用什么度量?带宽怎么选?
3.诊断信息和解释?
做出模型后需要有残差平方和、R2、AICc等诊断信息,和线性回归做做对比。然后再制图。