大指数下DO指数模型计算优化
DO指数模型概述
DO指数(Duranton-Overman
Index)是由Duranton和Overman于2005年提出的产业空间集聚测度方法,它通过分析企业间的精确地理距离分布来识别产业集聚模式。与传统集聚指标相比,DO指数具有两大优势:
跨行政边界分析:基于实际地理坐标而非行政边界
统计显著性检验:通过反事实模拟建立置信区间
核心计算
1. 加权核密度估计
\[
K^{\mathrm{EMP}}(d) = \frac{1}{h \sum_{i=1}^{n-1} \sum_{j=i+1}^{n} (e_i
+ e_j)} \sum_{i=1}^{n-1} \sum_{j=i+1}^{n} (e_i + e_j) f\left( \frac{d -
d_{i,j}}{h} \right)
\]
其中:
ei,ej:企业i和j的就业人数(规模权重)
di,j:企业间地理距离
h:带宽(按Silverman准则计算)
f:高斯核函数
2. 反事实模拟
通过若干次随机抽样构建置信区间
大数据计算瓶颈
当处理大规模企业数据时,DO指 ...
动态面板部分线性模型估计工具
突破传统线性限制:部分线性函数系数模型解析
在经济学和金融学的实证研究中,变量间的复杂关系往往难以用简单的线性框架刻画。部分线性函数系数模型(Partially
Linear Functional-Cefficient
Models)应运而生,成为捕捉经济现象中非线性与异质性的利器。今天我们将结合Du等学者的最新研究,解析这一模型的理论特点与应用价值。
🔍 模型是什么?
部分线性函数系数面板模型巧妙结合了线性结构与非参数灵活性,其基本形式如下:
\[Y_{it}=Z^{\prime}_{it}\mathbf{g}(U_{it})+X^{\prime}_{it}\beta+a_{i}+\varepsilon_{it}\]
其中: - \(Y_{it}\):被解释变量 -
\(X_{it}\):线性部分变量(系数\(\beta\)为常数) - \(Z_{it}\):函数系数部分变量(系数\(\mathbf{g}(\cdot)\)随\(U_{it}\)变化) - \(U_{it}\):决定系数变化的连续变量(如时间、收入水平等)
- \(a_i\):个体固定效应
...
含有非期望产出EBM及其改进模型
含有非期望产出的EBM模型及其改进模型
今天推出的是含有非期望产出的EBM模型及其两种改进模型。
参考文献:《基于数字经济要素组合的绿色全要素生产率提升研究中的模型》杜娟,张子承,王熠
本文构建了考虑非期望产出的改进EBM(epsilon-based
measure)模型,并结合Malmquist指数测算了中国各省级行政区2016-2020年绿色全要素生产率指数。进一步运用模糊集定性比较分析方法,探索数字经济多个层级要素驱动绿色全要素生产率提升的组态效应。
原始EBM模型
原始的EBM模型由Tone和Tsutsui提出,综合考虑径向改进和非径向改进的混合距离函数。该模型充分利用投入和产出数据的信息,能够更加准确地衡量决策单元的相对效率水平。
\[
\begin{aligned}
\min \rho_k = & \frac{\theta - \varepsilon_x \sum_{i=1}^{m}
\frac{w_i^- s_i^-}{x_{ik}}}{\varphi + \varepsilon_y \sum_{r=1}^{s}
\frac{w_r^+ s_ ...
中立性DEA交叉效率评价方法
今天推出中立性DEA模型的计算工具
参考文献:《中立性DEA交叉效率评价方法》袁剑波,吴立辉,魏思
中立性DEA交叉效率评价方法
在数据包络分析(DEA)对决策单元效率评价的方法中,对抗性DEA交叉效率方法把所有决策单元均视为敌对方,而仁慈性DEA交叉效率方法把所有决策单元均视为盟友,这是不符合实际的。为解决对抗性和仁慈性DEA交叉效率方法的弊端,提出了一种中立性DEA交叉效率方法,既不把决策单元视为盟友,又不把决策单元视为敌对方,而是从中立性的原则去选择权重,进而得出效率评价结果。这种权重选择策略更加客观和公正,更能应用于实践当中。
现有DEA交叉效率方法综述
假设有\(n\)个部门或单位(称为决策单元,Decision
Making Units),这\(n\)个决策单元都是具有可比性的。每个决策单元都有\(m\)种类型的输入和\(s\)种类型的输出。对于第\(j\)个决策单元,记其第\(i\)种投入为\(x_{ij}\),第\(r\)种产出为\(y_{ij}\)(\(i=1,2,\ldots,m; j=1,2,\ldots,n;
r=1,2,\ldots,s\))。
...
Shapley方法测算DEA模型变量重要性
今天推出的是利用Shapley方法,测算DEA中投入产出变量重要性的方法。
Shapley 值法是由 L. S. Shapley 于 1953 年提出的方法。Shapley
值的特点为参与人之间的平等性。可以通过构造联盟、联盟内外平等和联盟中参与人平等性这三个角度体现。基于
Shapley
值进行联盟成员的利益分配体现了各盟员对联盟总目标的贡献程度,避免了分配上的平均主义。通过每个变量的
Shapley
值,可以求出变量在效率中的边际影响,从而合理筛选投入产出指标,构建科学的投入产出指标体系,为后续测算煤炭生态效率奠定基础。
参考文献:《A Shapley value index on the importance of variables in
DEA models》Yongjun Li, Liang Liang
DEA模型中的效率贡献率(ECR)
1. 引言
Wagner和Shimshak(2007)开发了一种逐步减少变量的程序方法。该方法的核心是计算每个变量对效率评估的影响程度;在他们的论文中,给定变量的影响被定义为包含和不包含该变量的两个DEA模型中所有D ...
非平衡面板Malquist指数计算工具
今天推出的工具是非平衡面板的malquist指数计算
参考文献:《非平衡面板数据的全要素生产率测算方法》马占新,苏日古嘎
下面是该理论部分的主要内容。
1. 传统 DEA-Malmquist 指数方法及其 RD 分解模型
假设共有 \(n\)
个决策单元,每个决策单元在第 \(t\) 期
\((t=1,2,\cdots,T)\) 均用 \(m\) 种投入获得 \(s\) 种产出。其中,第 \(j\) 个决策单元在第 \(t\) 期的投入产出值为 \((x_j^t, y_j^t) > 0\)。则根据 DEA
方法的基本原理 (Charnes 等, 1978; Banker 等, 1984),可以给出第 \(t\) 期的生产可能集如下:
\[
S_c^t = \{(x^t,y^t)|\sum_{j=1}^n \lambda_jx_j^t \leq x^t, \sum_{j=1}^n
\lambda_jy_j^t \geq y^t, \sum_{j=1}^n \lambda_j = \delta, \lambda_j \geq
0, j = 1,2,\cdots, ...
复合系统协调度工具
今天推出的是复合系统协调度这个模型的工具。
参考文献:《“干线公路—城市结点”复合系统协调度分析模型》
复合系统整体协调度模型以协同学的序参量原理和役使原理为基础,模型的参变量选择是模型合理性的前提,
重点选择在整个系统发展演变过程中起主导性作用的因素作为模型序参量变量,它决定着系统演化的特征和规律。
模型具体如下:
1、计算子系统有效度
将"干线公路—城市结点"系统表示为 \(S=\{S_1,S_2, S_3,S_4\}\),其中 \(S_i\) 为第 \(i\) 子系统,\(i=1, 2, 3,
4\),分别对应干线公路、社会经济、城市交通和生态环境等四个子系统;
设子系统 \(S_i\)
发展过程中的序参量为:\(x_i=(x_{i1},x_{i2},\cdots,x_{in})\),其中
\(a_{ij} \leq x_{ij} \leq
\beta_{ij}\),\(a_{ij}\),\(\beta_{ij}\) 为序参量 \(x_{ij}\) 的阈值。
则第 i 个子系统的有序度\(\mu_\mathrm{i}(\mathbf{x}_\mathrm{ ...
存在共享投入的两阶段博弈交叉DEA模型
今天推出的是存在共享投入的两阶段博弈交叉DEA模型。
网络 DEA
博弈交叉效率模型不仅适用于基本两阶段网络结构,还适用于多种网络结构,本文进一步将模型拓展为存在共享投入的两阶段DEA
博弈交叉效率模型。 存在共享投入的两阶段网络结构中,假设有 n 个
DMU;在第一阶段,\(DMU_j(j=1,2,...,n)\)用 m
种共享比例分别为\(\alpha_{ij}(i=1,2,...,m)\)的外源投入\(x_ij(i=1,2,...,m)\)产生 q 种产出\(z_pj(p=1,2,...,q);\) 在第二阶段,\(DMU_{j}(j=1,2,...,n)\)用 m
种共享比例分别为的外源投入\[(1-\alpha_{i_{i}})\],\(x_{ij}(i=1,2,....,m)\)和第一阶段的 q
种产出\(z_{pj}(p=1,2,...,q)\)产生 S
种产出\(y_{rj}(r=1,2,....,s)\),这 S
种产出离开系统。其中,共享比例\(\alpha_{i_i}(i=1,2,...,m)\)是未知参数,管理者可根据现实情况设置共享比例的下界 ...
度量空间集聚的DO指数计算工具
今天推出的是DO指数计算工具。
DO 指数方法由Duranton and
Overman(2005)提出,用于对产业空间集聚程度进行度量。 DO
指数的计算分为三步:
(1)计算核密度函数。假定行业\(I\)中存在\(n\)
家企业,运用每家企业的经纬度数据,可以计算出\(n( n- 1)
/2\)个两两企业对彼此的空间距离,它与实际交通距离存在一定偏差,但对估计结果影响不大,Duranton
and
Overman(2005)曾详细阐述了这一问题。计算该行业两两企业彼此距离的核密度函数\(\hat{K}(d)\)的公式如下: \[
\hat{K}(d)=\frac{1}{n(n-1)h}\sum_{i=1}^{n-1}\sum_{j=i+1}^{n}f(\frac{d-d_{i,j}}{h})
\] 其中,\(d\)
表示两两企业彼此的空间距离,\(d_{i,j}\)表示企业\(i\) 与企业\(j\) 之间距离值,\(f\)为高斯核密度函数,h 表示窗宽。
因为企业规模的大小会明显地影响企业的分布模式特征,所以本文采用企业就业人数作为规模的权重进入核密度函数 ...
EG指数计算工具
今天推出的是EG指数计算工具。
EG 指数法的运用相对成熟,它弥补了早期测度方法的劣势,解决了Gini
系数法失真的原因并结合
了赫芬达尔指数法的使用,同时对能够采集到的数据具有良好的适用性。
其计算公式如下:
\[\gamma_{EG}=\frac{G-(1-\sum_{i=1}^{M}x_{i}^{2})H}{(1-\sum_{i=1}^{M}x_{i}^{2})(1-H)}=\frac{\sum_{i=1}^{M}(s_{i}-x_{i})^{2}-(1-\sum_{i=1}^{M}x_{i}^{2})\sum_{j=1}^{N}Z_{j}^{2}}{(1-\sum_{i=1}^{M}x_{i}^{2})(1-\sum_{j=1}^{N}Z_{j}^{2})}\]
其中,N为经济体中某产业企业的个数;M
代表经济体地理区域的划分个数\(;_{\lambda_i}\)表示\(i\)市总就业人数占全国总就业人数的比重;s_i表示\(i\)市旅游产业就业人数占该产业全部就业人数的比重;\(G=\sum_{i=1}^{n}(s_i-x_i)^2\)为空间Gini
系数\( ...