PDSI干旱指数R代码
帕默尔干旱指数通常指帕默尔干旱强度指数,即PDSI,是一种在气象、气候、农业、水文水资源等领域广泛应用的干旱指数,由美国气象学家韦恩·帕默尔(Wayne
Palmer)于1965年提出。
帕默尔干旱指数(PDSI)是一个基于水量供需关系的干旱指数,在当地水分供不应求时即为干旱,否则为湿润。水分供给量相对容易求得,通常可以降水量代替;而水分需求量的推算则较为复杂,因其涉及到受到气温、土壤性质、土地利用等因素影响的蒸散发及土壤水分变化等方面。对于这一问题,帕默尔提出了“当前情况下的气候适宜”(climatically
appropriate for existing
conditions,CAFEC)的概念,定义了“气候适宜降水量”来作为水分需求量,并以实际降水量与其差值来界定水分盈亏状况。PDSI不仅能考虑当前的水分供需状况,还能考虑前期干湿状况及其持续时间来对当前干旱状况的影响,物理意义明确,是一个能较为客观合理地定量描述干旱的干旱指数。
PDSI值通常介于-4到4之间,当其值大于0时则为湿润,反之为干旱,不同大小的值反映不同的干旱或湿润等级。
下面是计算PDSI干旱指数的 ...
corrplot包绘制相关系数图
R包corrplot提供了一个关于相关矩阵的可视化探索工具,支持自动变量重新排序,以帮助检测变量之间的隐藏模式。
corrplot
非常易于使用,并在可视化方法、图形布局、颜色、图例、文本标签等方面提供了丰富的绘图选项。它还提供
p 值和置信区间,以帮助用户确定相关性的统计显着性。
corrplot()有大约 50
个参数,但最常见的参数只有几个。在大多数场景中,我们只需要一行代码就可以得到一个相关矩阵图。
最常用的参数有method, type, order, diag等。
methodcorrplot 包中有七种可视化方法(参数), 分别是 circle, square,
ellipse, number, shade, color,
pie。默认颜色设置下,字形的颜色强度与相关系数成正比。
circle/square,圆形或正方形的面积表示相应相关系数的绝对值。
ellipse,椭圆的偏心率参数化地缩放到相关值。
number, 不同颜色的系数数字。
color,大小相同的正方形,颜色不同。
shade, 类似于color,
但负系数字形带有阴影。 ...
使用dea-toolbox进行数据包络分析
Data Envelopment Analysis Toolbox 是
MATLAB的一个开源包,该包涵盖了计算一些主要的DEA模型的函数。该软件包包括标准加性和径向输入和输出度量的代码,允许规模收益恒定和可变,以及与方向距离函数相关的最新发展,并在测量效率和生产力时包括期望和非期望的输出;即Malmquist和Malmquist-Luenberger指数。还包括执行统计分析的bootstrap。
这里通过一些常见的例子,说明如何使用该包。
1、下载与安装
网址:https://github.com/javierbarbero/DEAMATLAB
下载工具包以后,解压到某个目录,然后把该工具包添加到matlab的工作目录,就可以愉快地使用了。
2、代码如下:
123456789101112load 'deadataFLS' %加载工具包预设的数据文件%1、面向投入的CCR模型io = dea(X, Y, 'orient', 'oo'); %orient表示导向,io表示投入导向,oo为产出导向%X和Y分别为投入和 ...
数据包络分析(DEA)详解
一、基本介绍
1.1原理
数据包络分析有多种模型,主要为:CCR模型,BBC模型、交叉模型、A&P模型。纵观该方法的各种模型,每一模型的具体数学推理过程基本一致,所得的标准线性规划求解公式也比较相似,它们之间的差异主要体现在每个模型所适用的条件有所不同。在国外,此方法较早地运用于银行医院、城市等方面效率的评价。近些年来,该方法在我国社会经济的许多领域也取得了不少应用成果。由于方法对评价对象的要求相对比较宽松,应用其评价相同类型DMU的相对有效性的优势地位,是其他方法难以取代的。
1.2CCR模型
CCR模型是指对DMU通过“投入一定数量的生产要素,并产出一定数量的产品”的经济系统来判断各个单元的相对合理性和有效性。从投入资源的角度来看,在当前产出的水准下,比较投入资源的使用情况,以此作为效益评价的依据,这种模式称为“投入导向模式”。
定义决策单元j的效率评价指数为:
对上式可以适当的取权系数v和u,使得,对第个决策单元进行效率评价,一般来说越大表明能够用相对较少的输入而取得相对较多的输出。故只需求得的最大值,即可探究在这n个DUM中相对来说是不是最优的。
1.3B ...
含有非期望产出的SBM模型python代码
传统的径向DEA模型无法考虑“松弛变量”对效率值的影响,也没有考虑同时使期望产出增加,非期望产出减少的技术变化,以此度量的效率值是不准确或有偏的,为了解决这一问题,Tone(2001)提出了基于投入产出松弛变量的环境效率评价模型,简称SBM模型,在此基础上,他进一步提出了SBM的拓展模型,从而实现了非期望产出条件下对环境效率的评价,含有非期望产出的SBM模型规划式如下图所示:
含有非期望产出的SBM模型规划式
关于求解含有非期望产出的SBM模型的python代码如下:
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687from scipy.optimize import minimizeimport numpy as npimport pandas as pdimport scipy. ...
和讯网上市公司社会责任综合评分数据
和讯网发布的我国上市公司社会责任综合评分作为企业社会责任表现的度量。 该评分基于我国上市公司的社会责任报告和财务报告信息,
从股东责任、员工责任、供应商、客户和消费者权益责任、环境责任和公共责任五个方面,分别设立
13 个二级指标和 37 个三级指标,
对企业社会责任承担情况进行系统的评价,能够较为全面和客观地反映企业的社会责任表现,近年来在国内相关研究中已经得到了越来越多的应用。
数据截图如下:
目前数据的年份为2010-2021年,需要的加我微信,canglang12002,免费。
对抗型交叉评价DEA模型matlab代码
对抗型交叉评价DEA模型matlab代码,代码来自于彭育威老师的《利用MATLAB进行DEA交叉评价分析》一文,非常适合学习。
如果您想做仁慈型DEA,可与我联系。
1234567891011121314151617181920212223242526clearX=[30 60 55 40 70 ; 25 40 70 30 90; 130 150 120 70 180];%用户键入输入矩阵Y=[35 43 76 52 63;60 80 53 42 71];%用户键入输出矩阵;n=size(X',1); m=size(X,1); s=size(Y,1);%以下是第一轮线性规划;A=[-X',Y'];b=zeros(n,1);LB=zeros(m+s,1);UB=[];for i = 1:n Aeq=[X(:,i)' zeros(1,s)];beq=1; f=[zeros(1,m) -Y(:,i)']; w(:,i)=linprog(f,A,b,Aeq,beq,LB,UB);%解线性规划,得出DMUi的 ...
dagum基尼系数分解工具
dagum基尼系数分解工具
相比于传统的基尼系数而言,Dagum
基尼系数能够将其分解为地区内差距、地区间差距以及超变密度。
Dagum基尼系数的相关计算公式如下:
1、总体基尼系数:
dagum基尼系数分解工具
2.子群内部基尼系数
dagum基尼系数分解工具
3.子群之间基尼系数
dagum基尼系数分解工具
4.子群内差异对总体基尼系数贡献
5.子群间差异对总体基尼系数的贡献
dagum基尼系数分解工具
6.超变密度的贡献
dagum基尼系数分解工具
网上目前计算dagum基尼系数分解的方法,一般是matlab代码,该方法要求首先要把数据按子群划分为不同的列,同时要把列按照平均值从大到小的顺序依次排列,且每次只能计算一年的数据,有些则对分组有限制,只能分解固定子群数的数据,同时输出的数据并非excel,还需要二次整理,很不方便。有鉴于此,我编写了一个自动化的脚本,主要特点如下:
1、无须使用者安装任何R、matlab软件,完全无代码操作。
2.对子群数没有限制,2组及以上均 ...
《机构投资者抱团与股价崩盘风险》数据处理代码
主要参考文献为:《机构投资者抱团与股价崩盘风险》(吴晓晖,郭晓冬,乔政)。这篇文献发表在中国工业经济杂志上,但作者只提供了处理过的投资机构团体持股数据,具体处理的代码则并未展示。
这里根据这篇文献,依据如下步骤进行复原:
1、下载国泰安中机构团体持股比例数据,合并为一个文件,约475万条数据。
2、根据投资机构名称,筛选机构名称中含有“投资”“公司”字样的机构。
3、使用python,筛选出每年,任意两家投资机构持有某家公司股票大于5%的组合,输出到csv文件。
4、按年进行拆分,并加入权重列,保存为txt文件。
5、使用python,将数据根据louvain算法,得出社区团体。
6、将多年的社区团体合并为一个文件,一共两列,一列为投资机构id,一列为年份。
7、根据第6步的数据,筛选第一步中475万条数据中,某机构在某年,对某公司属于任意一投资团体的数据。
8、根据年份、股票代码进行汇总,得出最终数据,2003年到2020年,一共27424条数据。
数据截图:
获取代码,联系微信:canglang12002
三阶嵌套泰尔指数计算工具
三阶嵌套的泰尔指数在国内似乎是个冷门的方法,有朋友来问,查了下,只找到了一篇中文文献,英文文献也不很多。不过这个方法似乎在分解不同层级的泰尔指数时比较好用,因此写了这个小工具。
关于三阶嵌套泰尔指数的公式介绍,我直接贴在这里吧:
三阶嵌套泰尔指数计算工具
使用方法也很简单,把数据按照固定格式准备好,可以是一年,也可以是多年,不过都要有year这一列,然后放到指定位置,打开软件,稍等片刻即可,结果文件在D盘。
1、需要准备的数据格式如下图所示:
三阶嵌套泰尔指数计算工具
year为年份,A1,A2,A3,A4分别代表四个层级,GDP代表产值,或者收入等,people代表人数,数据可以换,列名不要换。数据名为data.xlsx,放在D盘根目录,结果文件也是在D盘根目录。
2、结果如下图所示:
三阶嵌套泰尔指数计算工具
第一列是总指数,后面分别是一级、二级、三级、四级泰尔指数,层级是从大到小,如果这四级分别对应区域、省份、地级市、县城,那么就分别代表了,地域间差异,地域内省间差异,省内市间差 ...


