1、横截面数据是指在某一时点收集的不同对象的数据,比如2014年全国32个省份GDP增长率与固定资产投资额构成的一组数据;时间序列数据是指对同一对象在不同时间连续观察所取得的数据,比如2005年-2015年广东省GDP增长率与固定资产投资额构成的一组数据;面板数据,是截面数据与时间序列综合起来的一种数据资源,比如2005年-2015年全国32个省份GDP增长率与固定资产投资额构成的一组数据。
类别变量是指一种变量可分为若干类,比如性别分男女、不同国家分国别等;有序变量也成定序型变量,比如按学历划分,年纪分为老中青等;定比变量指X1/X2,比如说甲的收入是乙的两倍。
3、描述性统计可以简单地判断数据的分布情况,做好这一步可以选择下一步的分析方法。假设性别变量为sex,年龄变量为age,受教育年限为edu,则命令如下:
tab age edu
tab sex edu