经济学教科书经常假设制造商具有同质性效率是指产出与投入之比,用抽象的生产函数来描述其生产过程,并隐含地假设对于所有制造商来说,在给予相同数量的投入的情况下,他们将获得相同的产出。 这与我们的生活经验不符。 例如,如果两个孩子摩擦粘土,给定相同大小的泥球,则粘土球的大小会不同; 如果两个师傅打棉花,则各给十公斤棉花。 常见的是甲师傅生产八公斤被子,乙师傅生产被子。 1磅。
产出与投入之比为生产率(),实际产出与理想产出之比为效率()。 当然,不同厂家的效率也不一样。 研究制造商效率确实有必要,但在主流经济学中找不到答案。 需要一些“非主流”工具。 本文介绍的方法是随机前沿模型(Model,SFM),或者说随机前沿分析(SFA)。 。
如果你敢称其为模型,那你必须有一个数学公式,如下: y=Xbeta+\ =vu
式中,y代表制造商的输出,扰动项。 是一个复合扰动项,由两部分组成。 第一部分v是常见的左右对称随机扰动项,y=Xbeta+v是我们常用的线性回归模型; 第二部分 u 是不对称的,不小于 0 随机扰动项。
模型中的Xbeta+v称为制造商的生产前沿。 所谓生产前沿描述的是在给定投入下能够产生的最大产出水平,即理想产出。 显然,生产前沿包含随机项v,故称为随机前沿。 制造商的实际产量为y,实际产量与理想产量的差距为u,对应的效率为frac{y}{Xbeta+v}。
u的经济意义是制造商的管理无效率、技术无效率、经济无效率等,是指制造商本身可以控制的各种因素。 u越大,说明厂商的无效率越大,或者用人的话来说:效率越低。 当u=0时,制造商的实际产量为理想产量,此时效率值达到峰值,为1。v描述了制造商无法控制的各种因素,如运气、天气、机器效率、等等。这些因素影响着制造商的生产前沿。 v 的另一个重要组成部分是制造商输出 y 的测量误差。
关于随机前沿模型更深入的介绍,可以参考本文第二篇参考资料,或者查看原文。
随机前沿模型估计方法
假设 v 服从均值为 0、标准差 的正态分布,记为 vsim N(0, ^2),u 服从均值 0、标准差 的半正态分布,并在 0 处截断正态分布,记为 usim N^+(0, ^2),u 和 v 相互独立。 采用最大似然估计法来估计模型的待估计参数。
由于使用公式编辑器编写大型数学公式非常耗时,因此本文将使用5手写写出大部分推导过程,然后以截图的形式插入到文本中。
随机前沿模型对数似然函数的推导过程
由上图可知,随机前沿模型的对数似然函数可表示为: ln{L}= -Nlnsigma-frac{1}{2sigma^2}sum_{i =1} ^N^2+sum_{i=1}^NPhi(-frac{\}{sigma})\
相应地,对数似然函数的一阶导数可以写为:
frac{ ln{L}}{ sigma^2}=-frac{N}{2sigma^2}+frac{1}{2sigma^4}sum_{i= 1}^N^2+frac{}{2sigma^3}sum_{i=1}^Nfrac{phi_i}{Phi_i}=0\ frac{ ln {L}}{ }=-frac{1}{sigma}sum_{i=1}^Nfrac{phi_i}{Phi_i}=0\ frac{\ln {L}}{\beta}=frac{1}{sigma^2}sum_{i=1}^Nx_i+frac{}{sigma}sum_{i=1}^ Nfrac{phi_i}{Phi_i}x_i=0
肉眼可见,这三个一阶导数是复杂的非线性方程,无法给出参数的解析解。 一种常见的方法是使用集总最大似然估计( )进行估计。
将第二个方程代入第一个方程,则第一个方程最后一项为0,则sigma^2的最大似然估计量为hat{sigma}^2=frac{1}{N }sum_{i=1}^N^2=frac{1}{N}sum_{i=1}^N(y_i-x_i'beta)^2。 换句话说,如果我们能够得到参数β的估计量,我们就可以直接利用这个公式给出σ^2的估计量。
beta' 乘以第三个方程,加上 乘以第二个方程,得到frac{1}{sigma^2}sum_{i=1}^N\beta'x_i+frac{ }{sigma} sum_{i=1}^Nfrac{phi_i}{Phi_i}y_i=0\
将此表达式与一阶导数中的第三个方程结合起来,如果已知 sigma^2,则可以给出 和 β 的估计量。
实际估算过程如下:
使用普通最小二乘估计法给出 β 的估计量; 根据 β 的估计量计算 sigma^2 的估计量; 将 sigma^2 估计量代入联立方程组,得到 和 beta 估计量; 可以根据新的 β 估计器计算新的 sigma^2 估计器。 如果参数估计量变化不大,则估计过程结束; 如果估计量的变化超过设定的容差,则重复2~4.随机前沿模型的R语言代码实现
大多数计量经济模型都可以在R语言中找到相应的实现代码。 本文利用该包对随机前沿模型做了具体的估计。 由于找不到原文中的数据集,所以采用2003年中国各省份的GDP、劳动力投入、资本投资数据进行论证。 具体数据如下:
演示数据集
rm(list=ls())
## 载入必要的R语言包
library(frontier)
## 读取原始数据
rawdata <- read.csv("rawdata.csv")
## 估计模型
result <- sfa(gdp~lab+cappri, data=rawdata)
## 查看回归结果
print(summary(result))
回归结果如下所示:
简单随机前沿模型估计结果
注意上图中估计参数中的gamma为^2/sigma^2,代表非对称扰动项的方差占复合扰动项方差的比例。 造成这种差异的原因很简单,就是后续估计方法的估计策略的改进。
文献综述
该文件名为 and of。 该文献首创了随机前沿模型,并给出了最大似然法的估计策略。 但它没有提供制造商效率的测量方法,仅适用于横截面数据。 这些缺陷之中效率是指产出与投入之比,这也正是后来的文献试图弥补的。 这三位伟人为后来的很多学者创造了“饭碗”,很多人站在他们的肩膀上发表文章。
文章中的=/。 当^2to0时,表示^2toinfty或^2to0。 此时,对称随机扰动项在复合扰动项中“占主导地位”,非对称随机扰动项所占份额较小。 ,相信这些进入回归的厂家效率值都比较高。 相反,如果 ^2toinfty ,则说明制造商存在一定的技术低效率。
R语言包的使用
在阅读经典文学作品时,我常常感到困惑。 我费了好长时间才推导估算过程,但实际的估算代码只需要一行。 我的努力不值得。 如果你只是用经典模型来研究问题,那么只需要学习一点简单的代码就足够了。 问题是,如果你想扩展模型,或者尝试实现更前沿的计量经济模型估计策略,那么简单的代码是不够的。
现在我们就利用R语言包来简单实现上面提到的估计策略。 读者可以参考该包的帮助文档来了解如何使用该包。 我们的目标是加深对最大似然估计方法的理解,更好地学习R语言。
下面给出的代码是一种粗暴的估计方法,没有经过任何优化,但是编写简单,省时省力,并且在需要估计的参数不多的情况下运行速度非常快。 这是培养自信的良好起点。 未来的专栏可能会考虑使用一些优化算法。
## 清空当前工作空间
rm(list=ls())
## 载入需要的R语言包
library(maxLik)
## 读取原始数据
rawdata <- read.csv("rawdata.csv")
## 写出对数极大似然函数
logLikFun <- function(param){
const <- param[1] # 常数项
parlab <- param[2] # 劳动投入对应参数
parcap <- param[3] # 资本投入对应参数
parlambda <- param[4] # lambda
parsigmaSq <- param[5] # sigma square
epsilon <- rawdata$gdp - const - parlab * rawdata$lab - parcap * rawdata$cappri
sum(-0.5 * log(parsigmaSq) - 0.5/parsigmaSq*epsilon^2 +
pnorm(-epsilon*parlambda/sqrt(parsigmaSq), log.p = TRUE))
}
## 使用最小二乘估计法获取极大似然估计初始值
ols <- lm(gdp~lab+cappri, data=rawdata)
initCoff <- coef(ols)
## 暴力估计
mle <- maxLik(logLik = logLikFun,
start = c(
const = initCoff["(Intercept)"],
parlab = initCoff["lab"],
parcap = initCoff["cappri"],
parlambda = 0.5,
parsigmaSq = sum(residuals(ols)^2)/(31-3)
))
## 打印回归结果
print(summary(mle))
对应的估计结果见下图
估计结果与之前的结果非常相似。 注意这里的估计结果给出的参数是代替之前的gamma。
参考文献:《高级宏观经济学》(第四版)/(美国)Romer; 吴华斌、龚冠译. 上海:上海财经大学出版社,2014。第 8 页。效率和生产率分析导论/ 等。 王忠钰译. 第二版。 北京:中国人民大学出版社,2008年。第3页。