900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > logit回归模型的参数估计过程_计量模型——面板向量自回归模型(PVAR模型)操作全过程...

logit回归模型的参数估计过程_计量模型——面板向量自回归模型(PVAR模型)操作全过程...

时间:2024-05-23 23:53:08

相关推荐

logit回归模型的参数估计过程_计量模型——面板向量自回归模型(PVAR模型)操作全过程...

这几个月在写论文,论文中用到了面板数据,并且需要做面板向量自回归模型,同时我又是个stata小白&计量小白(有学计量这门课,只是我太菜了)。在做PVAR模型的时候就是百度(主要时经管之家)还有知乎、公众号(如计量经济服务中心)然后研究这个模型怎么做,我用的是stata16中文版的。

首先,做这个要有个PVAR的包,当时找这个包找了好几天,一个是国外love学者的PVAR

包(PVAR这个程序最初是由Inessa Love编写的),另一是国内的连玉君老师的PVAR2包。两个都可以,我时不太会用love的那个,然后用连老师的那个包感觉挺好用的。

导入方式:把上面的第三个pvar放进STATA的如下位置ado——base——p文件夹下面,然后就可以用了

PAVR模型一共是要做以下几个步骤:

1、平稳性检验

2、协整

3、滞后阶数的选择

4、PVAR模型系数估计

5、格兰杰因果检验

6、脉冲响应分析

7、方差分解(这一部分我省略了)

PVAR模型前的准备:

第一步:导入数据

import excel C:UserscuteOneDriveexcelnewsta.xlsx,sheet("Sheet1")firstrow ///导入数据

stata软件是区分大小写的,所以在输入路径时,文件名中的大小写一定要注意区分,但是D盘和d盘是一样的。firstrow表示将表格中的第一行数据规定为变量名。

注意数据的格式:行是变量名,最重要的一点:数据一定要整理成面板的情况再导入!而不是下面这种或者是其他的

第二步:调整数据格式

在PVAR模型中,我们导入的数据前两列要分别是个体变量(如地区、国家)和时间变量(如年度、季度、月度)。但是大多时候,我们直接导入进来的数据中,这两列数据的格式不正确的,在stata中无法识别,之后的统计分析中也会出现诸多问题,所以我们要先调整数据格式。正常情况下,个体变量的数据类型应该是long,时间变量的数据类型应该是float,如下图所示,我们可以在查看数据界面右下角的Properties窗口中看到。

encode city, gen(id) 其中city是原来的个体变量名,id是新生成的变量名。这是对个体变量进行数据类型更改为long

gen month=mofd(time) /// month是新生成的时间变量名,time是原来数据的时间变量名。这是对时间变量的数据类型进行更改。

然后注意调整数据的位置,然后记得删除原来的数据

第三步:将数据变成面板数据(也就是让系统识别数据成为面板数据)

xtset id month///对面板数据中的个体变量和时间变量进行设定,告诉stata该数据为面板数据。

进行完面板数据的导入后可以做一些描述性统计(虽然没有什么用,但是论文好像都都得有这个步骤)

xtdes // 显示面板数据的结

xtsum 变量名1 变量名2 变量名3 // 显示面板数据的统计特征

第四步:平稳性检验

经常使用LLC和IPS方法,但是如果两种检验结果出现冲突,再运用其他方法进行检验。

LLC检验方法可以有以下三种选择:

xtunitroot llc 变量名 , trend demean lags(bic 12) // 对变量IP进行面板单位根LLC检验,这里假设变量IP既包含线性时间趋势项又包含个体固定效应项,是条件最苛刻的一种检验

xtunitroot llc 变量名, demean lags(bic 12) // 这里假设变量IP仅含个体固定效应项

xtunitroot llc 变量名, noconstant demean lags(bic 12) // none 的情形,即假设变量IP既不包含线性时间趋势项,也不包含个体固定效应项,是条件最宽松的一种检验

IPS检验有以下两种选择:

xtunitroot ips 变量名, trend demean lags(bic 8) // 对变量IP进行面板单位根IPS检验,这里假设变量IP既包含线性时间趋势项又包含个体固定效应项,是条件最苛刻的一种检验

xtunitroot ips 变量名, demean lags(bic 8) // 这里假设变量IP仅含个体固定效应项

原假设是面板数据含有单位根(面板数据不平稳),备择假设是面板数据平稳。结果中P值越小越好

tip:如果你的面板数据是有时间序列数据,就是某一个变量是时间序列数据,需要用时间序列数据的检验方法,时间序列数据就不用面板数据的检验方法,而是用时间序列的方法,如ADF单位根检验

//单独对时间序列数据(变量M2)平稳性检验

import excel C:UserscuteOneDriveexcelnewstaM2.xlsx,sheet("Sheet1")firstrow ///导入数据,我这里是只有光秃秃的一列数据,没有时间

gen t=tm(m1)+_n-1 ///设置数据的开始时间

tsset t, monthly ///告诉系统这是一个时间序列数据

dfgls M2 //根据SBC和AIC原则进行选择最优的滞后阶数

dfuller M2, lag(10) //单位根检验

第五步:协整检验

在上面的平稳性检验一般原始变量是不会平稳的,一般都是要做个一阶差分或者是二阶差分才会平稳(一般二阶就差不多了)。如果各变量不同差分都是平稳的,那么可以直接进行格兰杰因果检验、确定最优滞后阶数等程序,但是如果全部或部分变量不平稳,这个时候我们就需要进行面板协整分析,来考察变量间是否存在长期均衡关系。

当所有变量都是一阶差分后平稳或者是其他阶数的平稳,也就是同阶单整。此时要做协整检验。我们要保证所有的变量序列在同一差分阶数上都是平稳的,不然会伪回归。常用的协整检验方法包括三种:Kao、Pedroni和Johansen,如果变量总个数少于或等于六个,三种方法都可以使用,如果变量总个数多于六个,Pedroni检验方法将不再适用。这里一定要用原始数据!

xtcointtest kao 原始变量名 原始变量名 原始变量名 ///这是kao检验

第六步:确定PVAR模型的滞后阶数

pvar2 变量名1 变量名2 变量名3,lag(5) soc ///我是用的连老师的pvar2的包做的,所以命令里面是pvar2

第七步:格兰杰因果检验

格兰杰检验时一种用于分析各经济变量之间因果关系的检验方法。格兰杰检验定义如下:有两个经济变量 X、Y,在包 含了 X、Y 两个变量的过去信息的条件下对 Y 的 预测效果一定会优于仅在变量 Y 的过去信息条件下对 Y 所做出的预测效果,则我们可以认为变 量 X 是变量 Y 的 Granger 原因

pvar2 变量名1 变量名2 变量名3 ,lag(number) granger //格兰杰因果检验,其中滞后阶数根据上面的原则选择,比如上面那个图的结果告诉我是五阶最优,所以这里的number就可以改成5

然后这里的话,stata用的这个命令好像是因为是pvar模型里面的因果检验,所以用的是卡方统计量;var模型里面也有个因果检验,命令是vargranger,也是使用的卡方检验统计量。大部分还是用的F统计量。如果说你不用这个命令做因果检验,你也可以用下面两种办法做因果检验。

这是第二种:

这是第三种

第八步:进行GMM系数估计同时进行脉冲响应

pvar2 变量名1 变量名2 变量名3,lag(5) irf(10) // 这是对pvar模型进行系数的估计,lag()里面的数字是上面根据soc命令选出来的,irf()里面的数字是脉冲响应的期数。

最后一步:进行方差分解

pvar2 变量名1 变量名2 变量名3 ,lag(5) decomp(30) //decomp()里面的数字指的是方差分解的期数

(其实还有一步是模型的稳定性检验,只是我没做这步骤,我看大部分的论文也没做)

距离我接触这个模型到写这篇文章有一个半月的时间了,写出来感觉还是挺容易的(理论方面懂得不是很多),就几个命令的事情,但是我记得当时跑这几行代码总是报错,一报错就百度,经常都是在经管论坛得到解答。写下这个文章希望能够对你有些帮助吧!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。