1.Stata 基本的数据类型
Stata 有两种数据类型。一种是数值类型,另外一种是文字类型。数值类型的格式有 int float long double,不同的格式能够存储不同大小的数据容量。数值类型可以进行加减乘除的运算。文字变量用 str strL 来表示,其中 strL 用来表示容量比较大的字符变量。
sysuse auto,clearcompressvariable mpg was int now bytevariable rep78 was int now bytevariable trunk was int now bytevariable turn was int now bytevariable make was str18 now str17(370 bytes saved)
2.Stata中的时间变量
clear allset obs 10gen date = _nformat date %tdCY-N-D //年月日的数据格式
format 表示格式格式的调整。%td 表示时间 date, 除此之外,还有 月份、星期、季度、半年等形式。具体情形help文件看更加详细的说明。

3.Stata中的数据导入
我们通常需要将数据导入到Sata中,根据导入文件的不同有以下一些比较常用的命令。
3.1导入Excel 文件
*数据的导入cd "E:\stata15\ado\personal\learning"import excel using aa.xlsx,firstrow //将第一行作为变量名称储存
这样就能将 excel 格式的数据导入到Stata 中,在option选项中添加 firstrow 表示将excel 中的第一行设置为 stata 中的变量形式。
还有其他的说明,在 Stata Manual中有说明。

3.2导入 csv 数据
import delimited using bb.csv,encoding("utf-8")
如果没有encoding("utf-8") 就会出现中文的乱码现象,在导入数据的时候需要及时导入。
3.滞后期与差分
gen obs 10gen date = _nformat date %tdCY-N-Dgen value = _n^2tsset dategen lvalue = l.value //滞后期gen dvalue = d.value // 差分期--------------------------------------+| date value lvalue dvalue ||--------------------------------------|1. | 1960-01-02 1 . . |2. | 1960-01-03 4 1 3 |3. | 1960-01-04 9 4 5 |4. | 1960-01-05 16 9 7 |5. | 1960-01-06 25 16 9 |+--------------------------------------+
4.循环 foreach 和 forvalue
4.1 foreach 循环

这个是foreach 循环的基本使用方法。
举一个例子进行说明:
foreach x of numlist 1/3 5 6/10{di `x'}1235678910
同时也可以对变量进行循环:
foreach i of varlist _all{di `i'}AMC Concord40992232.51129301861213.57999990
将每一个变量的第一个值打印出来。
4.2 forvalues 的用法
参看 stata manual 上的相关说明如下:

forvalues i = 1/5{di `x'}12345
循环的难点在于和宏结合起来使用处理数据,首先需要将单个使用学会,然后在处理数据中慢慢积累。
6.其他命令
stata 中还有其他的命令需要记忆来处理数据。
cond

具体的情况可以看相关的介绍说明
inlist

inrange

文章转载自牛谈琴,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




