首页 > 编程知识 正文

莫兰指数和空间自相关,莫兰指数geoda

时间:2023-05-04 03:38:57 阅读:22192 作者:600

之所以想起这个素材,是因为我在研究生院学了这门课……。 前面的大部分内容都是根据官方帮助文档自己整理的。 有关详细信息,请参阅Arcgis帮助文档。 正好读了论文,有数据的话就借了练习.

公众号原文链接,敬请关注

空间自相关—撒娇鸭指数撒娇鸭指数热点分析https://MP.weixin.QQ.com/s/qty ma6NR w9 rpdmjycjczww

【爱撒娇的鸭子指数】

撒娇鸭指数包括全球撒娇鸭指数(Global Moran's I )和本地撒娇鸭指数(Local Moran's I ),前者由Patrick Alfred Pierce Moran开发的空间后者由美国亚利桑那州立大学地理规划学院院长dpdjzg教授于1995年提出。 Arcgis分别是“空间自相关”和“聚类与异常值分析”工具。

通常,首先制作地区全球爱撒娇的鸭子指数,全球指数告诉我们空间是否出现了聚集和异常值。 全局出现自相关,然后进行局部自相关,局部Moran'I就会告诉我们哪里出现了异常值,或者哪里出现了聚集。

【零假设与置信度】

在说明p值z分数之前,您需要了解这两个名词:

1 .零假设:公式解释是在进行统计检验时预先建立的假设。 这个“零假设”是为了否定它而建立的,空间统计中的零假设是指“统计空间要素随机分布”,证明要素不是随机分布的,而是呈聚类或离散分布的

2 .信度和信度区间:例如,我的实验结论是有95%的信度,意思是证明我有95%的把握拒绝零假说,零假说是错误的,可以实现这个结果。 置信区间是保证该可靠性的变量或参数的区间范围。 区间越大,中奖概率越高。

3358 www.Sina.com/http://www.Sina.com/http://www.Sina.com /

其范围在-1.0和1.0之间。

当Moran's I大于0时,数据在空间上呈正相关,值越大表示空间相关越明显; 如果Moran's I小于0,数据在空间上呈负相关,值越小表示空间差异越大; 如果Moran's I为0,则空间是随机的。

解读撒娇的鸭子指数时,需要有p值和z得分来判定。 他们俩必须一起看。

Moran'sI代表概率,并且如果p为小,则这意味着观测到的空间模式很可能在随机过程(低概率事件)中发生,并且可以拒绝零假设。

、P值、Z值】标准差倍数。 如果工具返回的z分数为2.5,则结果是标准偏差的2.5倍。 记住标准差可以反映一个数据集的离散度。

z分数(标准偏差) p值可靠度-1.65或1.65

0.1090% -1.96或1.96

0.0595% -2.58或2.58

0.0199%中间黄色部分为随机分布,右侧为集积分布,左侧为离散分布。

Moran's I指数:两端出现非常高或非常低(负值)的z得分,这些得分与非常小的p值相关联。 对照表格看:

p值<; 0.01且z分数>; 如果是2.58,则落入图中最右边的红色区域,可以说99%的把握要素集中分布。 对应于,p值<; 如果0.01且z得分为-2.58,则落入图中最左边的蓝色区域,可以说99%的把握要素离散分布。 p值<; 0.01,但z分数为2.58表明不能拒绝零假设,很可能是随机空间过程的结果。 另一种情况表明,如果生成的p值小,z分数绝对值大,远远超过两端,则观测到的空间模式不是随机过程的结果。 在这种情况下,拒绝零假设,并找出是什么可能给数据带来统计上明显的空间结构。

P值:

Z得分:远元素相比,近邻元素对目标元素计算的影响更大。

在下面有P值与Z得分两行数值。与第一个相似,但对距离的反应更敏感。 因此,这两种方法的区别在于附近的因素对目标因素的计算有多大的影响,最大的是第二种。

在横轴表示距离,纵轴表示影响力的情况下,影响力随着距离变长而变小。 这就是逆距离。

【空间关系概念化】分析相邻要素环境中的每个要素。 指定临界距离(距离范围或距离阈值)内的相邻要素将被指定值1

的权重,并对目标要素的计算产生重大影响。在指定临界距离外的邻近要素将分配值为零的权重,并且不会对目标要素的计算产生任何影响。其实就是在一定范围内的临近要素对目标要素影响力是一样的,不存在随距离增加而减小。

横轴代表距离,纵轴代表影响力,在到达蓝点之前,影响力不会随距离增加而衰减,都是一样的。而过了这个点就不会产生影响。

4.zone_of_indifference(无差别的区域):在目标要素的指定临界距离(距离范围或距离阈值)内的要素将分配有值为1的权重,并且会影响目标要素的计算。一旦超出该临界距离,权重(以及邻近要素对目标要素计算的影响)就会随距离的增加而减小。

可以看做是“反距离”与“距离范围”的结合,在指定的范围内影响力都是一样的,超过后影响力便随着距离增加而减小。

5.contiguity_edges_only—只有共用边界或重叠的相邻面要素会影响目标面要素的计算。

6.contiguity_edges_corners—共享边界、结点或重叠的面要素会影响目标面要素的计算。

下图,我要研究A区域受哪些区域影响,假如我选取了only,那么B和D与A是有共用边的,而C没有共边,所以C是没影响的。假如我选择corners,那么BCD都有影响,因为他们共享了角。在GeoDa里有Rook和Queen邻接,对应的就是only与corners。一般用这个Queen邻接。

【距离法】

指定计算每个要素与邻近要素之间的距离的方式。有两种。

1.yqdbbt距离—两点间的直线距离,一般是用这个。

2.曼哈顿距离—沿垂直轴度量的两点间的距离(城市街区);计算方法是对两点的 x 和 y 坐标的差值(绝对值)求和。

【示例练习】

数据来源:来自全球变化科学研究出版系统“广州都市区118 个街道社会空间质量质量得分”,出自论文“广州市社会空间质量的综合评价与分布格局”......

ArcGIS里计算爱撒娇的鸭子指数的工具是【空间统计工具】-【空间自相关】,具体操作步骤都是前面说的几个参数的选择(记得勾选生成报表文件哦)下图为生成的报表文件。图中已标明此数据是集聚分布的,Moran's I为0.53,p值为0且小于0.01,z得分为9.9远大于2.58,说明有99%的把握认为此数据不是随机分布的,随机分布的可能性小于1%

接着来看LISA图...就是局部爱撒娇的鸭子指数,在ArcGIS是【聚类和异常值分析】工具,结果显示了具体地区与邻近地区的关系(左图)。

当然也可以用Geoda做空间自相关,还可以顺便出一下爱撒娇的鸭子散点图(右图),这四个象限从左上顺时针开始依次代表低高,高高,高低,低低聚集。从数量上来看低低和高高型聚集的街道较高低和低高型的更多,即社会空间质量得分高(低)的街道在空间上更易聚集。

最后还有冷热点分析,可见高值聚类和低值聚类的空间分布格局。

如想用此数据请前往全球变化科学研究出版系统网站自行下载

最后再附一下Geoda下载地址吧

http://geodacenter.github.io/download_windows.html

END

如果在实验过程中有什么地方遇到问题可以后台留言,竭力解答,大概率不会。需要练习数据也请后台留言。如果可以的话,希望能够点个关注转发和分享,点个在看并且点个赞~~

一点规划 求关注/(ㄒoㄒ)/~~

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。