Panda_DEA增加至强有效前沿最近距离-MinDS模型
Panda_DEA1.3版本正式发布,主要有以下变化:
1、增加了两阶段网络DEA模型;
2、增加了两种零和博弈ZSG模型,并根据文献常用做法,自动迭代到各DMU效率值为1;
3、增加了至强有效前沿最近距离-MinDS模型,并为此支持外接Gurobi和GLPK两种求解器,显著提高求解速度。
4、界面美化。
目前它的界面是这样的:
是这样的:
好看多了
下面主要介绍MinDS模型:
MinDS 模型在SBM 模型的基础上增加了一组混合整数线性约束,使得被评价DMU
的参考标杆位于同一个超平面内,进而通过求解混合整数线性规划来获得MinDS
模型的效率值。同SBM 模型相比,MinDS 模型的优势在于能够使无效DMU
实现以较小的平均改进比例即可达到完全有效状态。
根据Aparicio(2007)的做法,求解MinDS模型的效率,分为两步,第一步,求解SBM模型:
第二步,根据第一步,得到效率值为1的DMU,组成新的参考集,求解如下模型,得到MinDS模型的效率值:
其中,Q(即软件中的M值)是一个比较大的正数,对于不同的求解器,M的值可能 ...
VSCode中使用armadillo+openblas的详细步骤
armadillo是C++中非常好用的一个线性代数运算库,有着和matlab非常相似的语法,可以非常方便的将matlab代码转移到C++中。
但是单纯的armadillo库,运算性能比较有限,如果加上开源的openblas,会极大提高矩阵运算性能。百度了下,基本上都是在VS2019中使用armadillo和openblas的教程,我大多数时候写的都是一些小项目,用VS未免有些杀鸡用牛刀的感觉,还是VSCode,好看又好用。百度了下,还没有看到相关的VSCode配置armadillo+openblas的教程,摸索了一下,总结经验如下:
第一步:openblas官网下载编译好的版本,网址:https://github.com/xianyi/OpenBLAS/releases,解压到任意盘,最好不要有中文路径,避免出错。
根据自己的情况,下载64位或32位版本。
第二步:下载armadillo,只需要其中的include文件夹即可,然后放在项目文件夹下,用vscode打开该项目文件夹。
armadillo网址:https://arma.sourceforge.net/downl ...
QLab增加耦合协调度模型
QLab新版本增加了耦合协调度模型,同时对界面做了一定程度的更新,模型被分为经济模型和评价模型两个类别。
耦合模型是从物理学中演变而来,它所体现的是两个系统之间通过彼此的相互作用互相影响,耦合度是对不同系统耦合程度的定量描述。
其中,耦合协调度C的计算公式如下:
协调发展度D的计算公式如下:
软件界面如下:
QLab界面
可以计算二元及以上子系统的协调耦合度,在计算协调发展度D的时候,提供平均权重和自定义权重两种方式供用户选择,操作还是一如既往的简单,只需准备好数据即可。
有需要购买软件,请联系微信canglang12002
往期推荐:
广义SBM模型的matlab代码
QLab1.4正式发布!增加全排列多边形图示指标法
大量数据时的Dagum基尼系数分解工具
Panda-DEA_1.0正式发布!
含有非期望产出的ZSG-DEA模型
两阶段网络DEA模型及其计算
Panda-DEA,一款新的DEA模型软件
DKM_1.3更新---CCM收敛交叉映射
DKM_1.2:两阶段嵌套泰尔指数工具
DKM_1.1--新增熵值法功能
数量 ...
三行R代码搞定山脊图绘图
有时候我们对比几组数据的分布情形,需要把几组数据的分布叠加在一起,这就用到山脊图了。
今天带来一个最简单的山脊图绘图教程。所需要的数据是这样:
原始数据
非常简单,一列是数据,一列是年份。然后我们导入包ggridges和ggplot2,并读取数据:
123library("ggplot2")library("ggridges")df <- read.csv('G:/test1.csv')
然后使用ggplot和geom_density_ridges这两个函数来绘图:
123df %>% ggplot(aes(x = Score, y = year,group=year)) + geom_density_ridges()
效果如下:
这里的数据,其实是2006年到2019年,这里的刻度是默认的形式,已经很美观,如果想自定义,可以这样做:
1234567dd<-df %>% ggplot(aes(x = Score, y = year,group=year) ...
VAR模型的matlab代码
var模型的matlab代码,摘自:https://sites.google.com/site/jnakajimaweb/var
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018 ...
广义SBM模型的matlab代码
今天推出的依然是DEA模型---广义SBM模型。
该模型在对有效决策单元做进一步排序时参考集是保持不变的,通过移动因子的变化,可以有效
预测有效决策单元的下一步变化。
该模型的规划式如下:
模型1
其中的δ参数为0时为规模报酬不变情况,为1时表示规模报酬可变情况,d为移动因子。
当决策单元(x,y)不属于T(d)时,模型1没有可行解,为了进一步计算决策单元效率值,提出改进模型,其规划式如下:
模型2
这里使用matlab实现了模型2。论文结果与计算结果对比如下:
结果对比
有需要的联系我微信canglang12002
参考文献:
[1]孙娜,那日萨,马占新.基于样本评价的广义SBM的效率度量方法[J].系统工程,2019,37(06):107-118.
[2]孙娜,那日萨,马占新.基于样本评价的广义SBM方法及其有效性[J].系统工程,2019,37(03):132-140.
Panda_DEA增加RAM-DEA和BAM-DEA模型
今天要更新的是DEA模型中的RAM和BAM模型,这两个模型已经加入到新版本的Panda_DEA中,可以很方便地计算其效率值。
RAM-DEA是1998年由Aida和Cooper等提出的一种非径向DEA模型,由于该模型构建对投入产出指标的设计考虑了指标之间的相互影响效应,并对这些效应进行了定性分析,因此得到了广泛的研究与应用。
相比于传统DEA及衍生模型,RAM-DEA模型的长处在于可以涵盖多类投入产出指标,目标函数的设计考虑到指标数量与数据极差对结果的影响,使得测算出的效率值不会因指标数量变化产生偏差。决策单元的投入产出指标数不再影响最优方案选择,也不需要对原始数据进行预处理。
基本的RAM-DEA模型规划式如下:
经济效率为:1-RAMp,效率值在0到1之间。
上式中,Rnx表示决策单元K中第n种投入要素的最大值与最小值之差,Rmy表示决策单元K中第m种期望产出的最大值与最小值之差。
BAM模型
由于RAM模型中的参数是由投入和产出的极差构成,会出现无效率值过小,因此导致不同的决策单元效率极为接近,难以有效区分的情形,因此Cooper
et
al( ...
QLab1.4正式发布!增加全排列多边形图示指标法
鉴于DKM之前的版本都是命令行版本,操作起来并不方便,因此特意加上了GUI界面,并更名为QLab。新版本对于常见的数据错误,如空间邻接矩阵不对称,某些行列全部为0等情况,会给出提示弹窗,方便用户操作。
QLab的界面如下:
用户可以自行选择数据文件,以及对应的保存目录,数据文件不需要使用特定的文件名,运行结果的文件名自动加上时间戳,多次运行,也不用关闭之前的结果文件。
下面是关于全排列多边形图示指标法的介绍:
全排列多边形图示指标法定义为:设共有n
个指标(标准化后的值),以这些指标的上限值为半径构成一个中心n
边形,各指标值的连线构成一个不规则中心n 边形,这个不规则中心n
边形的顶点是n 个指标的首尾相接的全排列,n 个指标总共可以构成(n-1)! /2
个不同的不规则中心n
边形,综合指数定义为所有这些不规则多边形面积的均值与中心多边形面积的比值。
指标值标准化采用双曲线标准化函数:
其中U为指标x的上限,取最大值,L为指标x的下限,取最小值,T为指标x的临界值,取平均值。
标准化及综合指数计算公式如下:
根据标准化后的数据,和综合指数,可以 ...
大量数据时的Dagum基尼系数分解工具
去年写过的Dagum基尼系数分解工具,本来已经足够使用,但是前天有一位用户,数据量有近15w行,我从未设想过会出现如此大的数据,程序足足运行了将近5个小时才跑出结果,然而用户还有很多类似的数据,不能总是如此。
于是在原先的工具基础上,做了优化,优化后的运行速度得到极大提升,同样的数据,在优化后,只用了不到30分钟就运行出结果,时间缩短到未优化前的1/10。
以下是结果对比:
未优化前
优化之后
需要的可以联系我微信,canglang12002
除了公众号的这些工具,大家有想做的模型,找不到代码,或者做起来比较繁琐,也欢迎与我们联系。
往期推荐:
Panda-DEA_1.0正式发布!
含有非期望产出的ZSG-DEA模型
两阶段网络DEA模型及其计算
Panda-DEA,一款新的DEA模型软件
DKM_1.3更新---CCM收敛交叉映射
DKM_1.2:两阶段嵌套泰尔指数工具
DKM_1.1--新增熵值法功能
数量经济学工具DKM_1.0
空间马尔科夫链工具
空间静态kernel核密度、空间动态kernel核密度工具更新
马尔科夫链之传统马尔可夫 ...
按收入来源分解基尼系数的工具
今天推出一个小工具,按收入来源分解基尼系数。
由于学界对基尼系数的计算没有统一,有很多方法可以计算基尼系数,但是大多比较复杂,在此基础上,1999年诺丁汉大学的姚树洁提出了一种新的计算方法,公式如下:
其中,n表示全省一共n个县城,Pk表示第k个县城的人口在全省人口总数中的份额,Wk为第k个县城收入在全省县级收入总额中的比重,Qk是第一个县累积到第k个县的收入比重之和。在按上述公式计算基尼系数的时候,应该按照各个县城财力大小由小到大排序。
姚树洁提出了按照收入来源分解基尼系数的方法,简单明了,计算方便,最大的优势在于对不均等分组同样适用。公式如下:
假设全省一共n个县,mk,pk分别为第k个县的人均收入和人口比重,把所有县城按照mk的升序排列。如果k个县城的总收入来源于f种收入,则基尼系数可以按照这些来源分解为F个部分。Wf为第f种收入在所有收入额中的占比,gf为第f种来源的人均值,g为全部收入的人均值,Cf表示f收入来源的集中率。Qfk是第f种收入从第1个县城累积到k个县城的合计数在全部收入中的占比,Wfk是第k个县的第f种收入在全部县f来源总和中的份额,mfk是第k ...