使用ggplot2添加文本标签
这里演示如何使用geom_text()将文本添加为标记。它的工作原理与geom_point()几乎相同,但添加的是文本而不是圆圈。
label: 你想显示什么文本
nudge_x和nudge_y: 沿 X 和 Y 轴移动文本
check_overlap尽量避免文本重叠。请注意,一个名为的包ggrepel进一步扩展了这个概念
代码如下:
1234567891011121314#图1 基本图library(ggplot2) # Keep 30 first rows in the mtcars natively available datasetdata=head(mtcars, 30) # 1/ add text with geom_text, use nudge to nudge the textggplot(data, aes(x=wt, y=mpg)) + geom_point() + # Show dots geom_text( label=rownames(data), nudge_x = 0.25, nudge_y = 0.25, check_ ...
利用R语言绘制小提琴图加箱线图
小提琴图加箱线图的代码,如下:
123456789101112131415161718192021222324252627282930# Librarieslibrary(ggplot2)library(dplyr)library(hrbrthemes)library(viridis)# create a datasetdata <- data.frame( name=c( rep("A",500), rep("B",500), rep("B",500), rep("C",20), rep('D', 100) ), value=c( rnorm(500, 10, 5), rnorm(500, 13, 1), rnorm(500, 18, 1), rnorm(20, 25, 4), rnorm(100, 12, 1) ))# sample sizesample_size = data %>% group_by(name) %>% summarize(num=n()) ...
用ggally包绘制散点图矩阵
ggally包的ggpairs()功能GGally允许建立一个散点图矩阵。
每对数值变量的散点图绘制在图的左侧。Pearson 相关显示在右侧。可变分布在对角线上可用。
代码如下:
12345678910# 评估变量的分布和相关性library(GGally) # 创建原始数据data <- data.frame( var1 = 1:100 + rnorm(100,sd=20), v2 = 1:100 + rnorm(100,sd=27), v3 = rep(1, 100) + rnorm(100, sd = 1)) data$v4 = data$var1 ** 2 data$v5 = -(data$var1 ** 2) ggpairs(data, title="correlogram with ggpairs()")
效果图
用ggplot2作气泡图
气泡图是具有第三个维度的散点图,第三维度通过散点的大小来表示。画气泡图至少需要三个维度的数据,分别是x,y和表示气泡大小的维度。下面用一个例子来说明,其中,x是人均GDP,y是预期寿命,圆圈大小表示人口,代码如下:
1234567891011# 导入包library(ggplot2)library(dplyr)#gapminder提供了数据集library(gapminder)data <- gapminder %>% filter(year=="2007") %>% dplyr::select(-year)# 最基本的气泡图ggplot(data, aes(x=gdpPercap, y=lifeExp, size = pop)) + geom_point(alpha=0.7)
图1
控制圆的大小:scale_size()
我们需要在上一张图表上改进的第一件事是气泡大小。scale_size()允许使用range参数设置最小和最大圆圈的大小。请注意,您可以使用 自定义图例名称name。
注意:圆圈经常重叠。为避免图表顶部出 ...
深交所信息考评数据2005-2021
深交所年度信息考评分为A、B、C、D四个等级,考评范围重点关注信息披露质量,包括信披的真实性、准确性、完整性、及时性、公平性、合法合规性和有效性,以及自愿披露的规范情况、社会责任履行披露情况和信披事务管理情况。同时也关注上市公司投资者关系管理、监管处罚以及与交易所工作配合情况等。
这里公布的数据年份为2005年至2021年,数据截图如下:
获取数据,直接加我微信canglang12002即可。
PDSI干旱指数R代码
帕默尔干旱指数通常指帕默尔干旱强度指数,即PDSI,是一种在气象、气候、农业、水文水资源等领域广泛应用的干旱指数,由美国气象学家韦恩·帕默尔(Wayne Palmer)于1965年提出。
帕默尔干旱指数(PDSI)是一个基于水量供需关系的干旱指数,在当地水分供不应求时即为干旱,否则为湿润。水分供给量相对容易求得,通常可以降水量代替;而水分需求量的推算则较为复杂,因其涉及到受到气温、土壤性质、土地利用等因素影响的蒸散发及土壤水分变化等方面。对于这一问题,帕默尔提出了“当前情况下的气候适宜”(climatically appropriate for existing conditions,CAFEC)的概念,定义了“气候适宜降水量”来作为水分需求量,并以实际降水量与其差值来界定水分盈亏状况。PDSI不仅能考虑当前的水分供需状况,还能考虑前期干湿状况及其持续时间来对当前干旱状况的影响,物理意义明确,是一个能较为客观合理地定量描述干旱的干旱指数。
PDSI值通常介于-4到4之间,当其值大于0时则为湿润,反之为干旱,不同大小的值反映不同的干旱或湿润等级。
下面是计算PDSI干旱指数的R代码:
1 ...
corrplot包绘制相关系数图
R包corrplot提供了一个关于相关矩阵的可视化探索工具,支持自动变量重新排序,以帮助检测变量之间的隐藏模式。
corrplot 非常易于使用,并在可视化方法、图形布局、颜色、图例、文本标签等方面提供了丰富的绘图选项。它还提供 p 值和置信区间,以帮助用户确定相关性的统计显着性。
corrplot()有大约 50 个参数,但最常见的参数只有几个。在大多数场景中,我们只需要一行代码就可以得到一个相关矩阵图。
最常用的参数有method, type, order, diag等。
methodcorrplot 包中有七种可视化方法(参数), 分别是 circle, square, ellipse, number, shade, color, pie。默认颜色设置下,字形的颜色强度与相关系数成正比。
circle/square,圆形或正方形的面积表示相应相关系数的绝对值。
ellipse,椭圆的偏心率参数化地缩放到相关值。
number, 不同颜色的系数数字。
color,大小相同的正方形,颜色不同。
shade, 类似于color, 但负系数字形带有阴影。
pie,圆圈顺时针填 ...
使用dea-toolbox进行数据包络分析
Data Envelopment Analysis Toolbox 是 MATLAB的一个开源包,该包涵盖了计算一些主要的DEA模型的函数。该软件包包括标准加性和径向输入和输出度量的代码,允许规模收益恒定和可变,以及与方向距离函数相关的最新发展,并在测量效率和生产力时包括期望和非期望的输出;即Malmquist和Malmquist-Luenberger指数。还包括执行统计分析的bootstrap。
这里通过一些常见的例子,说明如何使用该包。
1、下载与安装
网址:https://github.com/javierbarbero/DEAMATLAB
下载工具包以后,解压到某个目录,然后把该工具包添加到matlab的工作目录,就可以愉快地使用了。
2、代码如下:
123456789101112load 'deadataFLS' %加载工具包预设的数据文件%1、面向投入的CCR模型io = dea(X, Y, 'orient', 'oo'); %orient表示导向,io表示投入导向,oo为产出导向%X和Y分别为投入和产出矩阵dea ...
数据包络分析(DEA)详解
一、基本介绍1.1原理数据包络分析有多种模型,主要为:CCR模型,BBC模型、交叉模型、A&P模型。纵观该方法的各种模型,每一模型的具体数学推理过程基本一致,所得的标准线性规划求解公式也比较相似,它们之间的差异主要体现在每个模型所适用的条件有所不同。在国外,此方法较早地运用于银行医院、城市等方面效率的评价。近些年来,该方法在我国社会经济的许多领域也取得了不少应用成果。由于方法对评价对象的要求相对比较宽松,应用其评价相同类型DMU的相对有效性的优势地位,是其他方法难以取代的。
1.2CCR模型CCR模型是指对DMU通过“投入一定数量的生产要素,并产出一定数量的产品”的经济系统来判断各个单元的相对合理性和有效性。从投入资源的角度来看,在当前产出的水准下,比较投入资源的使用情况,以此作为效益评价的依据,这种模式称为“投入导向模式”。
定义决策单元j的效率评价指数为:
对上式可以适当的取权系数v和u,使得,对第个决策单元进行效率评价,一般来说越大表明能够用相对较少的输入而取得相对较多的输出。故只需求得的最大值,即可探究在这n个DUM中相对来说是不是最优的。
1.3BCC模型BCC模型是 ...
含有非期望产出的SBM模型python代码
传统的径向DEA模型无法考虑“松弛变量”对效率值的影响,也没有考虑同时使期望产出增加,非期望产出减少的技术变化,以此度量的效率值是不准确或有偏的,为了解决这一问题,Tone(2001)提出了基于投入产出松弛变量的环境效率评价模型,简称SBM模型,在此基础上,他进一步提出了SBM的拓展模型,从而实现了非期望产出条件下对环境效率的评价,含有非期望产出的SBM模型规划式如下图所示:
含有非期望产出的SBM模型规划式
关于求解含有非期望产出的SBM模型的python代码如下:
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687from scipy.optimize import minimizeimport numpy as npimport pandas as pdimport scipy.opti ...