本书基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的方式讲解。本节介绍数据准备。
1、 理解数据
1) 字段与记录
Ⅰ字段是事物或现象的某种特征。
Ⅱ记录是事物或现象某种特征的具体表现。
2) 数据类型:数字、文字、日期、货币、时间等
Ⅰ字符型数据:不具有计算能力的文字数据类型。包括中文字符、英文字符、数字字符(非数值型)等字符。
Ⅱ数值型数据:直接使用自然数或度量单位进行计量的数值数据。
3) 数据表
Ⅰ一张数据表的制作,可以侧面反映出制作者的数据沉淀及应用水平。
Ⅱ设计的要求:
A. 数据表由标题行和数据部分组成。
B. 第一行是表的列标题(字段名),列标题不能重复
C. 第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列
D. 数据表中不能有合并单元格存在
E. 数据表与其他数据之间应该留出至少一个空白行和一个空白列
F. 数据表需要以一维的形式存储,但是在实际操作中接触的数据往往是以二维表格的形式存在的,此时应将二维表转化为一维表的形式存储数据。(转化需要用到数据透视功能)
2、 数据来源:导入外部数据和自己录入数据
1) 导入数据
导入的外部数据最常见的来源:文本和网站数据来源
2) 问卷录入要求
Ⅰ数值题:只需输入实际填写的数值。
Ⅱ单选题:编码时只需定义一个变量,给该题留一列进行数据的录入。
Ⅲ多选题:二分法和多重分类法
A. 二分法:把每个相应选项定义为一个变量
B. 多重分类法:事先定义录入的数值
Ⅳ排序题:需要对选项重复性进行排序。
Ⅴ开放性文字题