LISA 空间自相关分析系统 v2.0 - 用户手册

📊 软件概述

LISA 空间自相关分析系统是一款专业的空间统计分析工具,集成了 Local Indicators of Spatial Association (LISA) 分析、全局 Moran's I 计算、热点识别和可视化功能。采用现代化图形界面,支持灵活的空间权重矩阵配置,可满足复杂的空间经济学研究需求。

核心功能

局部空间自相关分析 (LISA) - 识别空间聚类模式(HH、LL、HL、LH) - 计算局部 Moran's I 指标 - 显著性检验(蒙特卡洛模拟)

📈 全局空间自相关分析 - 全局 Moran's I 计算 - z-score 和 p-value 统计 - 多年份趋势分析

🔥 热点/冷点识别 - Jenks 自然断点分类 - 热点、次热点、次冷点、冷点四级分类 - 多配色方案支持

🗺️ 专业地图可视化 - 中国地图底图(基于 frykit 内置数据) - 省界/国界自动绘制 - 南海诸岛小图 - 比例尺、指北针、图例 - 省名标注(中英文可选) - 高分辨率导出(PDF/PNG/SVG/JPG/EPS)

⚙️ 灵活的空间权重矩阵配置 - 4 种内置矩阵类型(Queen/Rook/KNN/距离阈值) - 3 种标准化方式(行标准化/二进制/全局标准化) - 支持自定义矩阵文件(CSV/GAL/GWT) - 每年可使用不同的权重矩阵(独创功能) - 自动孤岛检测和处理

🎯 批量分析 - 多年份同时分析 - 自动生成分析报告 - 结果自动保存(CSV + 地图)


🖥️ 界面功能详解

主界面布局

软件采用左右分栏设计:

  • 左侧:5 个功能标签页(数据输入、空间权重矩阵、分析设置、地图样式、导出设置)
  • 右侧:实时运行日志
  • 底部:进度条和控制按钮

📑 标签页 1:数据输入

功能说明

用于输入地理数据和指标数据。

界面组件

1. 地理数据(SHP 文件)

作用:提供省级行政区划的地理边界数据

要求: - 文件格式:Shapefile (.shp + .shx + .dbf + .prj) - 坐标系统:WGS84 (EPSG:4326) 或其他地理坐标系 - 必需字段:省份名称列(如"省名"、"NAME"、"省份")

示例文件省界_region.shp

2. 指标数据(Excel 文件)

作用:提供各省份的指标数据(时间序列)

要求: - 文件格式:Excel (.xlsx, .xls) - 数据结构: - 第一列:省份名称 - 其他列:各年份的指标值(列名为年份,如"2007"、"2011")

Excel 文件示例(随机生成的示例数据):

省份 2007 2011 2016 2021
北京 125.8 138.4 152.3 168.7
天津 98.3 107.6 118.2 130.5
河北 56.7 62.4 68.9 76.2
山西 48.2 53.1 58.7 64.8
内蒙古 52.9 58.3 64.5 71.2
辽宁 73.5 80.9 89.2 98.5
吉林 61.4 67.6 74.6 82.3
黑龙江 58.9 64.8 71.5 78.9
上海 142.6 156.9 173.1 191.2
江苏 108.4 119.3 131.7 145.4
浙江 102.7 113.1 124.8 137.8
... ... ... ... ...

数据说明: - 数值可以是任何指标(GDP、创新指数、绿色发展指数等) - 支持不同年份的数据 - 省份名称必须与 SHP 文件中的省份名称一致

3. 年份选择

作用:选择要分析的年份(支持多选)

操作: - 勾选要分析的年份 - 默认选中前 4 个年份 - 按住 Ctrl 可多选


🔢 标签页 2:空间权重矩阵(⭐核心功能)

功能说明

这是 v2.0 的核心增强功能,支持灵活配置空间权重矩阵。

界面组件

1. 默认矩阵类型

矩阵类型详解

类型 适用场景 优点 缺点
Queen 邻接 大陆省份分析 符合地理邻接概念 海岛会成为孤岛
Rook 邻接 严格邻接分析 更严格的邻接定义 更多孤岛
KNN 包含海岛地区 确保所有区域有邻居 可能产生不自然的邻居
距离阈值 考虑地理距离 基于实际距离 需要调参

推荐设置: - 大陆省份分析 → Queen 邻接 - 包含海南等海岛 → KNN (k=4-6) - 考虑距离影响 → 距离阈值(500-1000 km)

2. KNN 参数配置

K 值建议: - K=4:标准配置(推荐) - K=6-8:增加邻居数量 - K=1-3:过少,不推荐

3. 距离阈值参数

阈值建议: - 300-500 km:邻近省份 - 500-1000 km:区域范围 - 1000+ km:跨区域影响

4. 矩阵标准化方式(重要!)

标准化方式详解

方式 效果 使用场景
行标准化 (R) 每行和为 1 大多数研究(默认推荐)
二进制 (B) 0-1 矩阵 需要原始邻接关系
全局标准化 (V) 全局和为 1 全局空间效应分析

5. 自定义矩阵文件(按年份)⭐ 核心功能

功能说明: - 可为每个年份指定不同的矩阵文件(独创功能!) - 未指定的年份将使用默认矩阵类型 - 支持混合使用(部分年份用自定义,部分用默认) - 支持格式:CSV、GAL、GWT

使用场景: - 经济距离矩阵(每年的 GDP 结构不同) - 技术溢出矩阵(每年的专利引用关系变化) - 贸易流量矩阵(每年的省际贸易额变化)

自定义 CSV 矩阵文件准备指南

文件格式要求

基本结构(CSV 三列格式):

1
2
3
4
5
6
7
8
9
i,j,weight
0,1,0.85
0,2,0.62
1,0,0.85
1,2,0.73
2,0,0.62
2,1,0.73
2,3,0.55
...

关键要求: 1. 三列固定i, j, weight 2. 索引从 0 开始:0 表示第一个省份,1 表示第二个省份 3. 只记录有邻居关系的配对:不需要对角线(i=i) 4. 对称矩阵需双向记录:(i,j) 和 (j,i) 都要写

应用场景示例

场景 1:经济距离矩阵

说明:基于经济发展水平的相似度,值越小表示经济距离越近(联系越紧密)

示例数据 (economic_distance_2021.csv):

1
2
3
4
5
6
7
8
9
10
11
12
13
i,j,weight
0,1,0.12
0,2,0.35
0,3,0.48
1,0,0.12
1,2,0.28
1,3,0.42
2,0,0.35
2,1,0.28
2,3,0.18
3,0,0.48
3,1,0.42
3,2,0.18

解释: - 省份 0 和 1 的经济距离为 0.12(经济结构相似) - 省份 0 和 3 的经济距离为 0.48(经济结构差异大) - 对称矩阵(0→1 和 1→0 权重相同)

场景 2:技术溢出矩阵

说明:基于专利引用关系,反映技术从一个省份向另一个省份的单向溢出

示例数据 (tech_spillover_2021.csv):

1
2
3
4
5
6
7
8
9
10
i,j,weight
0,1,0.75
0,2,0.42
0,3,0.28
1,0,0.35
1,2,0.58
2,0,0.18
2,1,0.32
2,3,0.45
3,2,0.22

解释: - 省份 0 对省份 1 的技术溢出强度为 0.75 - 省份 1 对省份 0 的技术溢出强度为 0.35(非对称) - 权重可以根据专利引用数量计算

场景 3:贸易流量矩阵

说明:基于省际贸易额(单位:亿元)

示例数据 (trade_flow_2021.csv):

1
2
3
4
5
6
7
8
9
i,j,weight
0,1,1523.5
0,2,2387.8
1,0,1184.3
1,2,856.6
2,0,2156.4
2,1,792.2
2,3,1087.7
3,2,943.3

解释: - 省份 0 到省份 1 的贸易额为 1523.5 亿元 - 省份 1 到省份 0 的贸易额为 1184.3 亿元(非对称) - 可以使用行标准化处理

场景 4:文化距离矩阵

说明:基于方言、习俗、历史联系,值越大文化距离越近

示例数据 (cultural_distance.csv):

1
2
3
4
5
6
7
8
9
i,j,weight
0,1,0.9
0,2,0.7
1,0,0.9
1,2,0.6
2,0,0.7
2,1,0.6
2,3,0.8
3,2,0.8

解释: - 省份 0 和 1 的文化距离很近(0.9) - 通常为对称矩阵 - 文化变化慢,可跨年使用

制作工具推荐

方法 1:Excel 计算 1. 在 Excel 中建立完整的 n×n 矩阵 2. 使用公式计算权重 3. 转换为三列格式(i, j, weight) 4. 另存为 CSV 文件

方法 2:使用专业软件 - GeoDa:导出为 GAL/GWT 格式 - Stata:使用 spmatrix export 命令 - R (spdep):使用 write.gal() 函数

矩阵验证要点

检查项目: - ✅ 列名是否为 i,j,weight - ✅ 是否有标题行 - ✅ 索引是否从 0 开始 - ✅ 是否有自环(i=j)—— 应该没有 - ✅ 权重值是否合理(无负数、无异常大值) - ✅ 对称性检查(如果应该对称)


⚙️ 标签页 3:分析设置

界面组件

1. 显著性水平

说明: - 默认 0.05(5% 显著性水平) - 可调整为 0.01(1%)或 0.10(10%) - 影响 LISA 聚类的显著性判断

2. 热点分类

说明: - 使用 Jenks 自然断点法 - 可选 2-6 类 - 默认 4 类:热点、次热点、次冷点、冷点

3. 忽略区域

说明: - 勾选的区域将被排除在分析之外 - 数据缺失的区域建议勾选 - 常见忽略区域:台湾、西藏、香港、澳门


🎨 标签页 4:地图样式

界面组件

1. 配色方案

配色方案预览

方案 热点 次热点 次冷点 冷点
黄蓝 🟧 深橙 🟨 橙黄 🔵 浅蓝 🔷 深蓝
红蓝 🔴 深红 🔺 红色 🔵 蓝色 🔷 深蓝
绿紫 🟢 深绿 🟩 绿色 🟣 紫色 🟪 深紫
橙青 🟠 深橙 🟧 橙色 🔵 青色 🔷 深青

2. 图像尺寸

推荐设置: - 论文:14×10 英寸 - 报告:12×8 英寸 - 演示:16×12 英寸

3. 地图元素

可选元素: - ☑ 显示省界 - ☑ 显示国界 - ☑ 显示省名标注 - ☑ 显示图例 - ☑ 显示比例尺 - ☑ 显示指北针 - ☑ 显示南海小图 - ☑ 显示LISA阴影

LISA 阴影说明: - ////:HH 高-高聚类(热点聚集) - \\\\:HL 高-低异常点 - xxxx:LL 低-低聚类(冷点聚集) - ----:LH 低-高异常点

4. 标注设置

语言对照: - English:Beijing, Shanghai, Guangdong... - 中文:北京、上海、广东...

字体大小:建议 8-12


💾 标签页 5:导出设置

界面组件

1. 输出目录

选择结果保存的文件夹

2. 导出格式

格式建议

格式 特点 适用场景
PDF 矢量图,可缩放 论文、报告(推荐)
PNG 位图,高质量 网页、PPT
SVG 可编辑矢量图 设计编辑
JPG 压缩较大 一般不推荐
EPS 专业矢量图 学术期刊要求

3. 图像质量

DPI 建议: - 72-150:屏幕显示 - 300:印刷标准(推荐) - 600:高质量印刷

4. 结果保存

  • ☑ 保存CSV结果文件
  • ☑ 保存全局Moran汇总

🚀 使用流程

完整分析步骤

Step 1:准备数据文件

需要准备: 1. ✅ SHP 文件(省界) 2. ✅ Excel 数据文件 3. ⭐ (可选)自定义矩阵文件(CSV/GAL/GWT)

Step 2:启动软件

双击运行 LISA_GUI.exe(或命令行运行)

Step 3:配置分析参数

标签页 1 - 数据输入: 1. 点击"浏览"选择 SHP 文件 2. 点击"浏览"选择 Excel 文件 3. 勾选要分析的年份

标签页 2 - 空间权重矩阵: 1. 选择默认矩阵类型(或使用 Queen 默认) 2. 选择标准化方式(推荐行标准化) 3. 【可选】为特定年份指定自定义矩阵文件

标签页 3 - 分析设置: 1. 设置显著性水平(默认 0.05) 2. 设置热点分类数量(默认 4) 3. 勾选要忽略的区域

标签页 4 - 地图样式: 1. 选择配色方案 2. 调整图像尺寸 3. 勾选要显示的地图元素 4. 设置标注语言和字体大小

标签页 5 - 导出设置: 1. 选择输出目录 2. 勾选导出格式 3. 设置 DPI

Step 4:开始分析

点击 "开始分析" 按钮,系统将自动: 1. 读取并验证数据 2. 计算空间权重矩阵 3. 执行 LISA 分析 4. 绘制地图 5. 保存结果文件

Step 5:查看结果

在输出目录查看: - 地图文件(PDF/PNG 等) - CSV 结果文件 - Moran 汇总文件


📊 输出结果详解

文件结构

1
2
3
4
5
6
7
8
9
10
输出目录/
├── LISA_map_2007.pdf # 2007年地图
├── LISA_map_2011.pdf # 2011年地图
├── LISA_map_2016.pdf # 2016年地图
├── LISA_map_2021.pdf # 2021年地图
├── LISA_results_2007.csv # 2007年详细结果
├── LISA_results_2011.csv # 2011年详细结果
├── LISA_results_2016.csv # 2016年详细结果
├── LISA_results_2021.csv # 2021年详细结果
└── Moran_global_summary.csv # 全局Moran汇总

地图文件内容

地图包含元素: - 🗺️ 中国省界底图(frykit 内置数据) - 🎨 热点/冷点填色 - 📐 LISA 聚类阴影(斜纹) - 🏷️ 省名标注 - 📏 比例尺(500 km) - 🧭 指北针 - 📊 图例(热点类型 + LISA 类型) - 🏝️ 南海小图

CSV 结果文件格式

LISA_results_2021.csv 示例:

省份 原始指标值 lisa p_value quadrant cluster significant
北京 168.7 2.34 0.002 1 HH True
天津 130.5 1.85 0.012 1 HH True
河北 76.2 0.42 0.324 1 NS False
山西 64.8 -1.23 0.008 3 LL True
... ... ... ... ... ... ...

字段说明: - 省份:省份名称 - 原始指标值:该年份的指标数据 - lisa:局部 Moran's I 值 - p_value:显著性 p 值 - quadrant:象限(1=HH, 2=LH, 3=LL, 4=HL) - cluster:聚类类型(HH/LL/HL/LH/NS/NA) - significant:是否显著(True/False)

全局 Moran 汇总文件

Moran_global_summary.csv 示例:

year moran_i p_value z_score significant_count
2007 0.425 0.001 3.87 18
2011 0.468 0.001 4.12 20
2016 0.492 0.000 4.35 22
2021 0.515 0.000 4.58 24

字段说明: - year:年份 - moran_i:全局 Moran's I 值(-1 到 1) - p_value:显著性 p 值 - z_score:标准化 z 值 - significant_count:显著聚类的省份数量

Moran's I 解释: - 接近 1:强正相关(空间聚集) - 接近 0:无空间相关 - 接近 -1:强负相关(空间分散)


🎯 高级应用案例

案例 1:经济发展的空间溢出效应研究

研究问题:分析 GDP 增长的空间聚集模式

配置建议: - 矩阵类型:Queen 邻接 - 标准化:行标准化 - 年份:2007, 2011, 2016, 2021 - 显著性:0.05

预期结果: - 识别经济增长的热点区域(东部沿海) - 识别经济增长的冷点区域(西部内陆) - 观察时间演变趋势

案例 2:创新扩散的距离衰减效应

研究问题:技术创新如何随距离衰减

配置建议: - 矩阵类型:距离阈值(500 km) - 标准化:行标准化 - 指标:专利授权量 - 年份:2015-2021(逐年)

优势: - 考虑地理距离的影响 - 反映创新的空间扩散

案例 3:经济距离与空间溢出 ⭐核心案例

研究问题:经济结构相似度对空间溢出的影响

配置建议: - 矩阵类型:自定义 CSV - 自定义矩阵:经济距离矩阵(每年不同) - 标准化:行标准化 - 指标:全要素生产率

操作步骤: 1. 计算每年的产业结构相似系数 2. 转换为经济距离矩阵(CSV 格式) 3. 为每年生成一个 CSV 文件 4. 在软件中为每年指定对应的矩阵文件 5. 运行分析

优势: - ⭐ 考虑经济联系而非地理邻接 - ⭐ 反映真实的经济互动 - ⭐ 每年矩阵可以变化(动态权重)

案例 4:多维权重矩阵对比

研究问题:不同权重矩阵对结果的影响

配置建议: - 运行 4 次分析,分别使用: 1. Queen 邻接 2. KNN (k=6) 3. 距离阈值(500 km) 4. 经济距离矩阵

分析内容: - 对比 4 种矩阵的 Moran's I 值 - 对比聚类模式的异同 - 敏感性分析


🛠️ 故障排查

常见问题

Q1: "No module named 'frykit_data'" 错误

原因:软件依赖包未正确安装

解决:联系技术支持获取完整安装包

Q2: "AttributeError" 错误

原因:软件版本问题

解决:确保使用最新版本 v2.0

Q3: "WARNING: X is an island (no neighbors)" 警告

原因:使用 Queen/Rook 矩阵时有孤岛(如海南)

解决: - 方法 1:切换为 KNN 矩阵 - 方法 2:系统会自动处理(切换为 KNN) - 方法 3:在"分析设置"中忽略该区域

Q4: 自定义矩阵加载失败

原因:CSV 格式不正确

解决: 1. 检查列名是否为 i,j,weight 2. 检查是否有标题行 3. 检查索引是否从 0 开始 4. 检查是否有自环(i=j) 5. 使用 Excel 重新保存为标准 CSV

Q5: 地图显示不完整

原因:DPI 设置过高或图像尺寸不当

解决: - 降低 DPI(如 300 → 150) - 调整图像尺寸(14×10 → 12×8)

Q6: Excel 文件读取失败

原因:数据格式问题

解决: - 确保第一列为省份名称 - 确保列名为年份(如"2007") - 删除空行和空列 - 保存为标准 Excel 格式(.xlsx)


💡 最佳实践

数据准备

  1. ✅ SHP 文件和 Excel 数据的省份名称要对应
  2. ✅ 检查数据完整性(无缺失值)
  3. ✅ 坐标系统统一为 WGS84
  4. ✅ 自定义矩阵索引与 SHP 顺序一致

矩阵选择

  1. 🎯 基础研究:使用 Queen 邻接
  2. 🎯 包含海岛:使用 KNN
  3. 🎯 经济联系:使用自定义经济距离矩阵
  4. 🎯 对比研究:多种矩阵对比

可视化

  1. 🎨 论文:黄蓝配色 + PDF 格式 + 300 DPI
  2. 🎨 演示:鲜艳配色 + PNG 格式 + 150 DPI
  3. 🎨 英文期刊:English 标注
  4. 🎨 中文期刊:中文标注

结果解释

  1. 📊 Moran's I > 0:空间正相关(聚集)
  2. 📊 HH 区域:高值聚集(热点)
  3. 📊 LL 区域:低值聚集(冷点)
  4. 📊 HL/LH:空间异常点
  5. 📊 NS:不显著,无明显空间关联

📚 理论背景

LISA 分析原理

局部 Moran's I 公式

1
I_i = (z_i / m_2) × Σ_j w_ij × z_j

其中: - z_i = (x_i - x̄) / σ:标准化值 - w_ij:空间权重 - m_2 = Σ_i z_i² / n:二阶矩

LISA 聚类类型

类型 含义 解释
HH 高-高 高值被高值包围(热点聚集)
LL 低-低 低值被低值包围(冷点聚集)
HL 高-低 高值被低值包围(空间离群点)
LH 低-高 低值被高值包围(空间离群点)
NS 不显著 无显著空间关联
NA 不可用 孤岛或缺失数据

全局 Moran's I

公式

1
I = (n / S_0) × (Σ_i Σ_j w_ij (x_i - x̄)(x_j - x̄)) / Σ_i (x_i - x̄)²

解释: - I > 0:正空间自相关(相似值聚集) - I ≈ 0:随机分布 - I < 0:负空间自相关(相异值聚集)


🌟 核心优势总结

相比其他工具的优势

功能 LISA GUI v2.0 GeoDa ArcGIS Stata
图形界面 ✅ 现代化
多矩阵类型 ✅ 4种+自定义
按年份矩阵 独创
批量分析 ⚠️ ⚠️
中国地图 ✅ 内置
自动孤岛处理
免费开源

创新功能

  1. 动态权重矩阵:每年可使用不同的空间权重矩阵
  2. 自动孤岛处理:智能检测并自动切换为 KNN
  3. 中国地图优化:内置高质量中国地图数据
  4. 批量分析:一键完成多年份分析
  5. 专业可视化:学术级地图输出

📞 技术支持

文档资源

  • 📖 用户手册:本文档
  • 📖 空间权重矩阵使用说明:详细的矩阵配置指南
  • 📖 孤岛问题说明:孤岛问题的解释和处理
  • 📖 更新日志:版本更新记录

示例文件

软件安装目录中包含示例文件: - 📄 CSV 矩阵示例example_weight_matrix.csv - 📊 示例数据:随机生成的示例数据

软件信息

  • 版本:v2.0
  • 发布日期:2025
  • 协议:专有软件
  • 系统要求:Windows 7/10/11, 4GB RAM

🎓 引用和参考

建议引用格式

如果在研究中使用本软件,建议引用:

1
LISA 空间自相关分析系统 v2.0 [Computer software]. (2025).

核心算法参考文献

  1. Anselin, L. (1995). Local Indicators of Spatial Association—LISA. Geographical Analysis, 27(2), 93-115.

  2. Moran, P. A. (1950). Notes on continuous stochastic phenomena. Biometrika, 37(1/2), 17-23.

  3. Rey, S. J., & Anselin, L. (2010). PySAL: A Python library of spatial analytical methods. The Review of Regional Studies, 37(1), 5-27.

  4. Jenks, G. F. (1967). The data model concept in statistical mapping. International yearbook of cartography, 7, 186-190.


🚀 快速开始示例

5 分钟快速上手

步骤 1:双击运行 LISA_GUI.exe

步骤 2:选择文件 - SHP: 点击"浏览"选择省界 shapefile - Excel: 点击"浏览"选择数据文件 - 年份: 勾选 2007, 2011, 2016, 2021

步骤 3:配置矩阵(使用默认) - 矩阵类型: Queen 邻接(默认) - 标准化: 行标准化(默认)

步骤 4:点击"开始分析"

步骤 5:查看结果 - 地图: LISA_map_.pdf - 数据: LISA_results_.csv - 汇总: Moran_global_summary.csv

高级用户:使用自定义矩阵

额外步骤:在"空间权重矩阵"标签页 1. 为 2007 年选择 economic_distance_2007.csv 2. 为 2011 年选择 economic_distance_2011.csv 3. 为 2016 年选择 economic_distance_2016.csv 4. 为 2021 年选择 economic_distance_2021.csv

系统将为每个年份使用对应的经济距离矩阵进行分析。


📝 版本历史

v2.0 (2024) - 重大更新

新功能: - ✅ 新增"空间权重矩阵"配置标签页 - ✅ 支持 4 种内置矩阵类型 - ✅ 支持自定义矩阵文件(CSV/GAL/GWT) - ✅ 支持每年使用不同矩阵(独创) - ✅ 自动孤岛检测和处理 - ✅ 矩阵标准化方式可选

改进: - 更稳定的错误处理 - 更详细的日志输出 - 更完善的用户文档

v1.0 (2023) - 初始版本

基础功能: - LISA 分析 - 全局 Moran's I - 地图可视化 - 批量分析


🎉 结语

LISA 空间自相关分析系统 v2.0 是一款功能强大、易于使用的空间统计分析工具。无论您是:

  • 📚 学术研究者:需要进行严谨的空间计量分析
  • 💼 政策制定者:需要识别区域发展的空间格局
  • 🏢 企业分析师:需要分析市场的空间分布
  • 🎓 在校学生:学习空间统计学方法

本软件都能为您提供专业、高效的解决方案。

核心亮点: - ⭐ 动态权重矩阵:每年可使用不同矩阵(全球首创) - ⭐ 智能分析:自动处理孤岛问题 - ⭐ 专业输出:学术级地图可视化 - ⭐ 简单易用:现代化图形界面

立即开始您的空间分析之旅! 🚀

获取软件

请联系微信 canglang12002 任公子


最后更新:2025年11月
文档版本:v2.0
适用软件版本:LISA 空间自相关分析系统 v2.0