这次复现的是哪篇论文?

这次复现的论文是:

Zhu, W., Huang, Y., & Yu, Y. (2023). DEA model for partial centralization resource allocation among independent subset of DMUs. Computers & Industrial Engineering, 176, 109013.

作者分别是:

  • Weiwei Zhu
  • Yanjie Huang
  • Yu Yu

期刊是 Computers & Industrial Engineering,属于运筹优化、管理科学、工业工程方向比较常见的期刊。

这篇文章的关键词也很直接:

  • Partial centralization
  • Incentives
  • Data envelopment analysis

简单说,它讨论的不是传统那种“只算效率值”的 DEA,而是:

在分组管理、局部集中治理的情形下,如何把 DEA 效率评价和资源再配置结合起来,做一个兼顾效率与公平的激励型资源配置模型。

这个切口其实很适合拿来做论文复现和代码产品化,因为它既有 DEA 评价,也有优化配置,还有实际案例数据,不是只有一堆理论公式。


一、为什么这篇论文值得做复现

做 DEA、效率评价和资源配置研究时,经常会遇到这样一种情况:

  • 论文里的模型看起来不算复杂;
  • 公式也写了,案例也给了;
  • 甚至表格结果都列出来了;
  • 但真正进入复现阶段后,才发现数据、约束和结果之间并不容易完全对应。

对于论文复现来说,通常最关键的是三个问题:

  1. 原始数据到底给没给全?
  2. 论文里的效率值能不能真正算出来?
  3. 资源配置表里的那组结果,究竟是不是唯一解?

这次复现的,是一篇关于 DEA 局部集中资源配置模型 的论文。我将文中的两个算例重新整理为结构化数据,并基于 Julia + JuMP + HiGHS 完成了模型求解与结果核对。

先给出简要结论:

论文中的 DEA 效率结果可以高精度复现;资源配置结果可以较高程度逼近,但并不能仅凭文中公开信息唯一还原到论文表格中的那一组配置方案。

也就是说,这篇论文具有较好的复现基础,但资源配置部分仍存在“多解下如何选定论文展示结果”的信息缺口。


二、这篇论文讲的到底是什么模型?

如果用一句话概括:

它研究的是:在分组情形下,如何基于 DEA 效率评价结果,对组内某类可协调资源进行重新配置,从而提升各 DMU 的整体表现。

这个模型不是只做传统 DEA 打分,而是在 DEA 评价基础上进一步讨论:

  • 哪些 DMU 效率偏低;
  • 在组内总资源不变的条件下,某类资源怎么重新分配;
  • 资源调整后,各 DMU 的产出能提升多少;
  • 调整后效率能改善到什么程度。

从论文案例来看,它包含两层核心内容:

1)先做 DEA 效率测算

论文先计算两类效率结果:

  • 子集参考集效率
  • 广义参考集效率

本质上就是在不同参考集设定下,对 DMU 做 CCR 型输入导向效率评价。

2)再做组内资源配置优化

在效率评价之后,模型进一步对组内资源进行调整,典型约束包括:

  • 组内某类协调资源总量保持不变;
  • 单个 DMU 的投入、产出调整有上下界;
  • 调整后的投入产出组合需要满足 DEA 可行前沿约束;
  • 通过目标函数实现“整体改进”。

这类模型的吸引力在于:

它不只是告诉你“谁效率高、谁效率低”,而是进一步回答“资源应该怎么调,才能让整体更优”。

这比单纯做一张效率评价表,价值要高得多。


三、这篇论文有没有完整的原始数据?

这点是很多人最在意的。

我的判断是:

论文案例数据基本是完整可提取的,可以支持复现。

这次我已经把论文中的两个案例表格重新整理成了 Excel:

  • paper_data.xlsx

其中包含:

  • 案例原始投入产出数据;
  • 论文给出的效率结果;
  • 论文给出的资源调整结果。

也就是说,从“把数据补齐并开始建模”这个角度看,这篇论文是具备复现基础的。

这和很多只给部分统计量、不给完整案例表的论文不一样。对于想做代码复现的人来说,这已经很友好了。


四、复现结果怎么样?先说最关键的结论

我把模型分成两部分来验证:

第一部分:效率值复现

这一部分结果非常好。

我把论文两个案例的效率值全部重算了一遍,生成了:

  • efficiency_comparison.csv

结果显示:

无论是子集参考集效率,还是广义参考集效率,几乎都和论文逐项一致。

误差基本都在:

  • 1e-5 到 1e-4

这个量级本质上就是四舍五入误差。

换句话说:

论文的基础 DEA 效率测算部分,是可以高精度复现的。

这一点非常重要,因为它说明:

  • 数据没大问题;
  • 效率模型理解没跑偏;
  • 代码实现路径是对的。

第二部分:资源配置结果复现

这一部分就比效率值复杂得多。

一开始,直接按论文公开模型求解,虽然能得到一组合理结果,但和论文表2/表5并不能完全一致。

后来我又专门加了一个 二阶段 tie-breaker

  • 第一阶段:先保证主目标值最优;
  • 第二阶段:在不破坏主目标最优的前提下,最小化与论文表格分配量之间的偏差。

改完以后,结果明显更贴近论文。

生成的对比文件包括:

  • allocation_comparison_example1.csv
  • allocation_comparison_example2.csv
  • allocation_objectives.csv

五、论文到底复现到了什么程度?

这个问题不能一句“能”或者“不能”带过,必须分层次说。

1)效率评价部分:可以认为是成功复现

这部分基本没悬念。

论文表中的效率值,已经可以用代码高精度还原。

如果你的目标是:

  • 理解论文 DEA 评价逻辑;
  • 获取案例数据;
  • 重算效率值;
  • 验证参考集设定;

那么这篇论文已经足够复现。

2)资源配置表部分:可以高度逼近,但未必唯一锁定论文那一组解

这是这篇论文真正有意思的地方。

从现在的复现结果看:

  • 案例1 的资源调整量已经基本和论文逐项贴近;
  • 案例2 经过二阶段逼近后,绝大多数变量也已经非常接近论文;
  • 但少数 DMU 的“优化后效率”仍和论文存在差异。

这意味着什么?

很可能意味着:

论文公开的目标函数和约束,足以生成同类最优解,但不足以唯一决定论文表中展示的那一组具体分配方案。

换句话说,论文大概率还隐含了某种“次级选择规则”,例如:

  • 偏好某些 DMU 尽量少调整;
  • 偏好协调资源变动更平滑;
  • 偏好某类变量优先保持不变;
  • 或者表中结果经过人工整理、四舍五入甚至后处理。

这不是代码没跑出来,而是论文没有把“怎么从多重最优解里挑出表中那一组解”写完整。


六、这次复现的意义是什么

这次复现的价值,不在于单纯把公式写成代码,而在于厘清了论文在数据、模型和结果三个层面的可落实程度。

1)可以判断论文是否具备继续研究的基础

对研究者来说,关注一篇论文,往往不是为了简单阅读,而是为了进一步:

  • 写自己的论文;
  • 做课题;
  • 做案例分析;
  • 做程序实现;
  • 做模型扩展。

如果一篇论文基础数据不完整、结果也难以核对,那么后续扩展的成本通常会比较高。

而这次复现已经证明:

这篇论文整体上具有较好的复用价值。

它不是只适合阅读而难以实现的类型。

2)可以在复现基础上继续做模型扩展

目前已经整理出的内容包括:

  • 案例原始数据;
  • 论文结果表;
  • Julia 复现代码;
  • 效率对比结果;
  • 资源配置对比结果;
  • 二阶段逼近版本代码与结果。

如果后续需要继续做:

  • 模型改进;
  • 公平性规则扩展;
  • 多阶段优化;
  • 灵敏度分析;
  • 政策含义解释;

那么就不必再从头整理数据和案例结构。

3)可以形成较完整的“论文复现 + 代码说明”材料

对于实际使用者而言,真正需要的通常不是泛泛的方法介绍,而是:

能够运行的代码、结构清晰的数据,以及可以核对的结果。

这也是这次复现工作的核心价值所在。


七、目前这套复现材料可以提供什么

如果需要进一步使用或整理交付材料,目前已经可以提供以下内容:

1)论文数据整理版

  • 提取后的 Excel 数据文件;
  • 两个案例原始投入产出表;
  • 论文效率值与资源配置结果表。

2)基础复现代码版

  • DEA 效率测算代码;
  • 组内资源配置优化代码;
  • 自动输出对比结果 CSV。

3)结果逼近增强版

  • 在主目标不变前提下加入二阶段 tie-breaker;
  • 尽量逼近论文表2/表5中的具体配置方案;
  • 便于分析“论文结果为何不是唯一解”。

这不是停留在结果截图层面的复现,而是一套可以继续核对、修改和扩展的代码框架。


八、适合哪些使用场景

这套材料更适合以下几类需求:

1)论文复现与方法学习

适合希望系统理解该文模型结构、约束设计和结果特征的读者。

2)课程作业、课题研究与案例分析

如果需要在现有论文基础上继续形成自己的案例结果,这套材料可以减少前期整理工作量。

3)模型扩展与程序开发

如果后续希望继续加入新的约束、目标或公平性规则,也可以直接在现有代码上修改。


九、结论

综合来看,这篇论文的复现结论可以概括为:

论文研究的是 DEA 框架下的局部集中资源配置问题;案例数据基本完整,能够支撑复现;效率值可以高精度对齐;资源配置结果可以较高程度逼近,但论文并未完整公开决定表格中那组具体配置结果的全部附加规则。

因此,它是一篇适合做方法学习、代码复现和后续扩展的论文,但在资源配置结果的唯一性解释上,仍需要研究者进行进一步判断和补充。

如果你需要:

  • 这篇论文的整理版数据
  • Julia / JuMP 复现代码
  • 结果对比文件
  • 更贴近论文表格的二阶段增强版代码
  • 或者要继续改成你自己的 DEA 资源配置模型,

可以直接联系我。

如果有需要,请联系微信 canglang12002