本条经验将会详细介绍在stata中生成各类虚拟变量的方式,推荐收藏
工具/原料
电脑
stata
双类别虚拟变量
1、双类别虚拟变量,顾明思议就是将变量分成两类进行虚拟变量的生成。如性别等等。我们还是打开我们的老朋友auto.dtasysuse autogen d=(length>200)聪明的大家一看就知道,这样就可以生成一个双分类虚拟变量,也就是>200的是一个小于等于200的是一个。图片是原始数据和生成的虚拟变量的截图

多类别单分类虚拟变量生成
1、什么是多类别虚拟变量?就是把一个变量的每一个数都分成一类类,我们在生成分类变量时也就是做这一种最容易出现问题。通常需要分类的变量时,季度变量还有不同的厂商,等等。

3、使用tab make,gen(m)即可生成按照make不同生成虚拟变量

单变量多分类虚拟变量生成
1、什么意思呢?就是对单一变量进行划分,将多个不同的数据划分成一类。这其实是非常常用的掌握了对大家都很有好处。其实,生成虚拟变量,如果你是个愣头青,你直接看着数据挨个输入就好。但是,还是希望大家都能灵活掌握stata的技巧,快人一大步。观察下面的数据表,是笔者我自己下载的数据,这个是一个时间的数据。这种数据是非常非常常用的,你从数据库下载的季度数据都是这个格式的数据。有时候你会遇到这样的问题。如果我想按季节分类怎么办呢?

3、tab group,gen(season)
