工具视界 - 要做八九点钟的太阳

发表于2023-02-01|计量经济

var模型的matlab代码，摘自：https://sites.google.com/site/jnakajimaweb/var 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018 ...

广义SBM模型的matlab代码

发表于2023-01-28|计量经济

今天推出的依然是DEA模型---广义SBM模型。该模型在对有效决策单元做进一步排序时参考集是保持不变的，通过移动因子的变化，可以有效预测有效决策单元的下一步变化。该模型的规划式如下：模型1 其中的δ参数为0时为规模报酬不变情况，为1时表示规模报酬可变情况，d为移动因子。当决策单元（x，y）不属于T（d）时，模型1没有可行解，为了进一步计算决策单元效率值，提出改进模型，其规划式如下：模型2 这里使用matlab实现了模型2。论文结果与计算结果对比如下：结果对比有需要的联系我微信canglang12002 参考文献： [1]孙娜,那日萨,马占新.基于样本评价的广义SBM的效率度量方法[J].系统工程,2019,37(06):107-118. [2]孙娜,那日萨,马占新.基于样本评价的广义SBM方法及其有效性[J].系统工程,2019,37(03):132-140.

Panda_DEA增加RAM-DEA和BAM-DEA模型

发表于2023-01-04|计量经济

今天要更新的是DEA模型中的RAM和BAM模型，这两个模型已经加入到新版本的Panda_DEA中，可以很方便地计算其效率值。 RAM-DEA是1998年由Aida和Cooper等提出的一种非径向DEA模型，由于该模型构建对投入产出指标的设计考虑了指标之间的相互影响效应，并对这些效应进行了定性分析，因此得到了广泛的研究与应用。相比于传统DEA及衍生模型，RAM-DEA模型的长处在于可以涵盖多类投入产出指标，目标函数的设计考虑到指标数量与数据极差对结果的影响，使得测算出的效率值不会因指标数量变化产生偏差。决策单元的投入产出指标数不再影响最优方案选择，也不需要对原始数据进行预处理。基本的RAM-DEA模型规划式如下：经济效率为：1-RAMp，效率值在0到1之间。上式中，Rnx表示决策单元K中第n种投入要素的最大值与最小值之差，Rmy表示决策单元K中第m种期望产出的最大值与最小值之差。 BAM模型由于RAM模型中的参数是由投入和产出的极差构成，会出现无效率值过小，因此导致不同的决策单元效率极为接近，难以有效区分的情形，因此Cooper et al( ...

QLab1.4正式发布！增加全排列多边形图示指标法

发表于2022-12-16|QLAB

鉴于DKM之前的版本都是命令行版本，操作起来并不方便，因此特意加上了GUI界面，并更名为QLab。新版本对于常见的数据错误，如空间邻接矩阵不对称，某些行列全部为0等情况，会给出提示弹窗，方便用户操作。 QLab的界面如下：用户可以自行选择数据文件，以及对应的保存目录，数据文件不需要使用特定的文件名，运行结果的文件名自动加上时间戳，多次运行，也不用关闭之前的结果文件。下面是关于全排列多边形图示指标法的介绍：全排列多边形图示指标法定义为：设共有n 个指标(标准化后的值),以这些指标的上限值为半径构成一个中心n 边形,各指标值的连线构成一个不规则中心n 边形,这个不规则中心n 边形的顶点是n 个指标的首尾相接的全排列,n 个指标总共可以构成(n-1)! /2 个不同的不规则中心n 边形,综合指数定义为所有这些不规则多边形面积的均值与中心多边形面积的比值。指标值标准化采用双曲线标准化函数：其中U为指标x的上限，取最大值，L为指标x的下限，取最小值，T为指标x的临界值，取平均值。标准化及综合指数计算公式如下：根据标准化后的数据，和综合指数，可以 ...

大量数据时的Dagum基尼系数分解工具

发表于2022-10-21|计量经济

去年写过的Dagum基尼系数分解工具，本来已经足够使用，但是前天有一位用户，数据量有近15w行，我从未设想过会出现如此大的数据，程序足足运行了将近5个小时才跑出结果，然而用户还有很多类似的数据，不能总是如此。于是在原先的工具基础上，做了优化，优化后的运行速度得到极大提升，同样的数据，在优化后，只用了不到30分钟就运行出结果，时间缩短到未优化前的1/10。以下是结果对比：未优化前优化之后需要的可以联系我微信，canglang12002 除了公众号的这些工具，大家有想做的模型，找不到代码，或者做起来比较繁琐，也欢迎与我们联系。往期推荐： Panda-DEA_1.0正式发布！含有非期望产出的ZSG-DEA模型两阶段网络DEA模型及其计算 Panda-DEA，一款新的DEA模型软件 DKM_1.3更新---CCM收敛交叉映射 DKM_1.2:两阶段嵌套泰尔指数工具 DKM_1.1--新增熵值法功能数量经济学工具DKM_1.0 空间马尔科夫链工具空间静态kernel核密度、空间动态kernel核密度工具更新马尔科夫链之传统马尔可夫 ...

按收入来源分解基尼系数的工具

发表于2022-10-01|计量经济

今天推出一个小工具，按收入来源分解基尼系数。由于学界对基尼系数的计算没有统一，有很多方法可以计算基尼系数，但是大多比较复杂，在此基础上，1999年诺丁汉大学的姚树洁提出了一种新的计算方法，公式如下：其中，n表示全省一共n个县城，Pk表示第k个县城的人口在全省人口总数中的份额，Wk为第k个县城收入在全省县级收入总额中的比重，Qk是第一个县累积到第k个县的收入比重之和。在按上述公式计算基尼系数的时候，应该按照各个县城财力大小由小到大排序。姚树洁提出了按照收入来源分解基尼系数的方法，简单明了，计算方便，最大的优势在于对不均等分组同样适用。公式如下：假设全省一共n个县，mk，pk分别为第k个县的人均收入和人口比重，把所有县城按照mk的升序排列。如果k个县城的总收入来源于f种收入，则基尼系数可以按照这些来源分解为F个部分。Wf为第f种收入在所有收入额中的占比，gf为第f种来源的人均值，g为全部收入的人均值，Cf表示f收入来源的集中率。Qfk是第f种收入从第1个县城累积到k个县城的合计数在全部收入中的占比，Wfk是第k个县的第f种收入在全部县f来源总和中的份额，mfk是第k ...

Panda-DEA_1.0正式发布！

发表于2022-09-29|计量经济

经过一段时间的努力工作，Panda-DEA_1.0版本终于正式发布了！软件的模型选项界面如下：距离函数导向规模报酬模型面板模型此外，一些比较前沿的DEA模型论文的复现和常见的基础模型，Panda-DEA提供了快捷选择模型模块，只需准备好相应的数据，可以一键复现论文的结果，参考理论，复现结果，最大减轻大家写论文的苦恼。在模型方面，目前包括径向和至前沿最远距离（SBM）两种距离函数，投入，产出、非导向三种导向，凸性前沿和自由处置壳（FDH)两种前沿，规模报酬包括CRS,VRS,NDRS,NIRS，GRS五种类型，模型选项包括超效率和非期望产出两项，如果线性规划出现无可行解，提供赋值为1、赋值为空，和运行FPA（适用径向距离）三阶段法求解三种处理方式。至于Malquist指数，提供相邻参比，全局参比、固定参比、序列参比四种比较常用的参比方式。至于DEA结果，Panda-DEA提供效率值，投影值和改进比例三项结果，Malquist指数则提供指数和FGLR(19 ...

含有非期望产出的ZSG-DEA模型

发表于2022-09-08|计量经济

今天介绍一种含有非期望产出的ZSG-DEA模型。该模型的公式如下：其中yn、en、un和Xk,n分别表示第n个地区的期望产出(GDP），能源投入、非期望产出（CO2)，和非能源投入。N为DMU个数，分别表示第i个地区的能源投入与CO2排放的效率水平，分别为能源投入和CO2排放效率值的权重，这里作者设置的权重各为0.5，也可以根据研究主题自行设置。这里的即是零和DEA效率。根据零和博弈DEA的思想，当一个地区的用能权和碳排放权增加时，其他地区必须减少相同数量的用能权和碳排放权，以保持总量不变。作者这里采用了比例法进行重新分配，具体的分配公式如下：这里的e'm和u'm就是根据效率值进行分配后，m地区分配到的用能权和碳排放权份额。在ZSG中，一次调整一般并不能达到零和DEA有效，这里作者参考林坦和宁俊飞提出的迭代法进行迭代求解，直到各个地区的ZSG效率值均达到1为止。由于文献作者并未贴出原始数据，这里仅写出了代码，经过测试，可以达到作者所描述的效果。参考文献：基于历史法和零和DEA方法的用能权与碳排放权初始分配研究，刘海英，王钰 ...

两阶段网络DEA模型及其计算

发表于2022-08-25|计量经济

今天推出的是两阶段网络DEA模型。在两阶段网络DEA模型中，第一阶段的产出，作为第二阶段的投入。不同于之前的研究将整体的生产过程和两个子过程视作独立的，Kao这篇文献在测量效率时，考虑了两个子过程之间的串联关系，并且整体效率是两个子过程效率的乘积，因此这种关系两阶段DEA方法计算得到的效率相对于从独立两阶段DEA方法计算的效率更有意义。两阶段网络DEA的规划式：则整体效率值Ek和第一阶段效率值Ek1、第二阶段效率值Ek2分别如下但是在乘数模型中，获得的最优解可能并不唯一，这使得不同DMU之间的效率比较可能会出现问题。作者提出的一个解决办法是，找到能够产生最大的Ek1的解，模型如下：然后根据Ek=Ek1*Ek2这一关系，计算Ek2的值。这里用python对这篇文献的模型进行了复现，结果如下：复现结果文献结果可以看到，结果大体保持一致。参考文献：《Efficiency decomposition in two-stage data envelopment analysis: An application to n ...

Panda-DEA，一款新的DEA模型软件

发表于2022-07-26|计量经济

数据包络分析 (DEA) 是一种数据驱动的非参数效率测度方法，并由美国著名运筹学家 A.Charnes、W.W.Cooper、E.Rhodes (1978) 首先提出。由于其不预设定具体函数形式和允许多种投入产出的优点，现已被学者们广泛用于评估决策单元的投入产出效率。经过数十年的发展，DEA模型及理论的发展十分迅速，国内外期刊，不断有人提出崭新的DEA模型，如零和收益（ZSG）DEA、网络DEA模型、含有非期望产出的SBM模型等等。大家在运用DEA模型的时候，碰到的一大难题就是如何求出DEA模型的结果，那一行行的约束公式，往往令人望而生畏。虽然市场上已经出现了为数众多的DEA模型软件，但是大多只能计算一些常见的DEA模型，对于一些前沿模型，则无能为力。有鉴于此，我们开发了一款新的DEA效率计算软件:Panda-DEA,除了会包含基础的DEA模型外，具有如下特点: 1、操作简单，无需对数据做过多处理； 2、结果以论文为导向，如零和收益ZSG-DEA模型，会直接进行多次迭代，并将迭代结果写入文件，用户可以直接放进论文； 3、以近两年国内外的前沿DEA理论为基础，不断增加新 ...