全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
9599 9
2014-04-19
什么是统计学?
统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。

统计学的产生和发展?
划分成3个阶段:
一、古典统计学时期(17世纪中-18世纪中)
1、德国的国势学派(又称记述学派)
    代表人物:海尔曼·康令、阿亨华尔
2、政治算术学派
    代表人物:威廉·配弟、约翰·格朗特
二、近代统计学时期(18世纪末-19世纪末)
1、数理统计学派
代表人物:凯特勒(被称为“近代统计学之父”)
2、社会统计学派
代表人物:克尼斯、恩格尔、梅尔
三、现代统计学时期(20世纪初至今)
戈赛特提出了小样本t统计量;
费希尔提出了F统计量、最大似然估计、方差分析等方法;
奈曼和皮尔逊提出了置信区间和假设检验。
统计学的主流以描述统计学转为推断统计学。

统计学的分类?
一、描述统计和推断统计
描述统计是收集数据,然后用图形、表格和概括性的数字对数据进行描述的统计方法。
推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。(统计学的核心)
二、理论统计和应用统计
理论统计:指统计学的数学原理,概率论为统计推断的数学基础
应用统计:应用统计方法去解决实际问题

数据来源:
直接来源:科学试验(主要用来取得自然科学数据)
                 统计调查(主要用来取得社会经济数据):统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败
间接来源:出版物
统计调查的组织方式:
                                普查:对全部单位进行调查(1. 为特定目的专门组织的非经常性全面调查2. 通常是一次性或周期性的3. 一般需要规定统一的标准时点4. 数据的规范化程度较高5. 应用范围比较狭窄)
                                重点调查:只调查重点单位(单位数不多但其标志量占标志总量比较大的单位)
                                典型调查:对典型单位进行调查,典型单位的选择并不一定按规模
                                抽样调查(P8):按随机原则选择调查单位,各单位被选中的机会相同。抽样调查是从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。具有经济性、时效性强、适应面广等特点。

非抽样误差(可避免)/抽样误差(不可避免):
抽样误差:由于抽样的随机性所带来的误差;所有样本可能的结果与总体真值之间的平均性差异;影响抽样误差大小的因素:样本量的大小、总体的变异性
非抽样误差:相对于抽样误差而言,除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异,存在于所有的调查之中(有抽样框误差、回答误差、无回答误差、调查员误差等)

总体(人们研究的所有基本单位):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素,分为有限总体和无限总体。有限总体的范围能够明确确定,且元素的数目是有限的。无限总体所包括的元素是无限的,不可数的。
样本(总体的一部分单位):从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量。
参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值,所关心的参数主要有总体均值(m)、标准差(s)、总体比例(p)等。总体参数通常用希腊字母表示。
统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。所关心的样本统计量有样本均值(`x)、样本标准差(s)、样本比例(p)等。样本统计量通常用小写英文字母来表示。
变量可以分为:变量的具体表现称为变量值,即数据
分类变量:说明事物类别的名称
顺序变量:说明事物有序类别的名称
数值型变量:说明事物数字特征的名称
离散变量:取有限个值
连续变量:可以取无穷多个值

统计数据的分类?
1、按计量尺度:分类数据:只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述。
                             顺序数据:只能归于某一有序类别的非数字型数据,对事物类别顺序的测度,数据表现为类别,用文字来表述
                             数值型数据:按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度
2、按收集方法:观测数据:通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据
                             实验数据:在实验中控制实验对象而收集到的数据
3、按时间状况:截面数据:在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况
                             时间序列数据:在不同时间上收集到的数据,描述现象随时间变化的情况

众数、中位数、均值的特点和应用
众数:
  • 不受极端值影响
  • 具有不惟一性
  • 在数据量较多时才有意义,数据量较少时,不宜使用众数
  • 主要适合作为分类数据的集中趋势测度值
中位数
  • 不受极端值影响
  • 数据分布偏斜程度较大时应用
  • 主要适合作为顺序数据的集中趋势测度值
均值
  • 易受极端值影响
  • 数据对称分布或接近对称分布时应用
  • 是对数值型数据计算的,实际中应用最广泛的集中趋势测度值


常用的抽样方法:

简单随机抽样:从总体中抽取n个单位作为样本时,要使得每一个总体单位都有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样,也称为纯随机抽样。它是抽样调查中应用最多的方法之一,也是最基本的抽样方法之一。
分层抽样(数据中有明显差异):在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数量的单位组成一个样本,这样的抽样方式称为分层抽样,也称为分类抽样。
系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至取到n个单位形成一个样本。这样的抽样方式称为系统抽样,也称为等距抽样或机械抽样。
整群抽样(数据中无明显差异):调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。

参数估计的基本原理:参数估计的方法有点估计和区间估计两种。
置信区间:在区间估计中,由样本统计量所构成的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。
如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率称为置信水平,或称为置信系数。

假设检验:利用样本信息判断假设是否成立的过程。先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的过程,依据小概率原理。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-4-19 15:18:14
xiexiele
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-19 19:24:16
胖胖小龟宝 发表于 2014-4-19 14:20
什么是统计学?
统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。 ...
总体归纳的还是挺好的,能细化或者从一个方面详细讲讲更好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-19 21:57:27
胖胖小龟宝 发表于 2014-4-19 14:20
什么是统计学?
统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。 ...
写的不错
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-20 11:04:00
要注意统计学的方法论的本质。通常要求全面完整系统的认识客体,但统计学给人们一种另类的认识方法----统计推断方法。统计学教我们以部分推断全体,个别推断一般,即用所谓的片面推断全面,观察部分树木推断整个森林。这才是统计学的本质和生命。统计学处于亚哲学的崇高地位。学习统计学除了统计方法,养成这种统计思想也是非常重要的。有了统计思想的教学,同学们的学习动能会大不一样。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-20 11:37:26
非常感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群