目 录摘要...........................................................................................1
引言...........................................................................................2
第一章 统计
1.1 统计分类............................................................................2
1.2 统计学的发展史及其分类................................................2
1.3 统计专业毕业生的流向 ...................................................3
第二章 大数据
2.1 大数据的特点及其产生背景............................................3
2.2 数据挖掘的基本放法........................................................4
2.3 金融数据挖掘....................................................................5
2.4 大数据时代对生活、工作的影响....................................5
结论...........................................................................................6
参考文献...................................................................................6
摘要
经过一学期的学习和阅读《金融数据挖掘》之后我对统计学和数据有了一定的了解,也收获了很多以前没有学习到的知识。我认识到统计学数据有着不可密分的关系,统计数据只是一个基础,挖掘分析数据才是重点。
引言
进入21世纪,中国金融业对信息化工作前所未有重视,众观金融机构都建立起自己的数据平台,形成金融机构网络和垂直业务体系,物联网云计算等社会媒体的飞速发展迎来了大数据时代。由于数据有量大,类型多,价值密度低等特点,所以运用到了统计,统计是指对某一现象有关的信息收集,整理和解释。
关键字:统计 数据
1.1统计分类
统计分为ZF统计和非ZF统计。统计局又分为地方统计局和调查局,统计局和调查局是协作关系,调查队名义上是直属系统,主要以日常调查为主,统计局是地方ZF部门,负责常规统计。非ZF统计又分为民事统计不以盈利为主,例如商业统计、信息技术统计部。
1.2统计学的发展史及其分类
the science of collecting analyzing presenting interpreting data,从英文中可以简单看出同统计学主要是收集,分析,表达,解释为主,搜集数据为基础,重点是分析数据,解释为最后结果。
统计学的发展史
1、萌芽期:也称为“城邦政情”,始于古希腊的亚里斯多德撰写,内容包括历史,行政,科学,艺术,人口,资源和财富等社会和经济情况比较,最后被政治算数代替。
2、近代期:政治算数的特点是统计方法与数学计算与推理放法开始结合。
3、现代期:统计与数学的结合逐渐形成了推断统计学。
1.3统计学的发展趋势及毕业生就业流向
发展趋势:1、依赖和吸收的数学方法越来越多
2、向其他领域学科渗透,以统计学基础的各类边缘学科逐渐形成。
3、随着计算机的发展,统计学体现出的功效,日益增强。
毕业生流向:ZF部门例如统计局,金融部门例如银行保险公司等,市场调查或研究,互联网公司比如数据分析师。
第二章 大数据
2.1大数据特点及产生背景
大数据特点
1) 海量性:即数据量大,因为生活中处处存在着数据,并且这些数据每天都在变化,大规模增大,IDC最近的报告预测,到2050年全球将扩大到50倍。
2) 多样性:数据多样性的增加因为新型多种数据,比如社交传媒,互联网搜索,数据传感器等造成的,由于传感器可以安装在火车,飞机手机等,所以传感器也增加了数据多样性。
3) 高速性:高速指的数据被创建和移动的速度。在高速的网络时代,手机发达的时代,人们每天通过网络产生大量,不同的数据。
4) 易变性:大数据会呈现多变的形式和类型。较多大数据呈现不规则特性,现在我们面临的挑战足以大量数据中挖掘其价值。
2.2数据挖掘基本方法
由于信息在各种行业的不可或缺性,从中获取挖掘出其有用的内容变成当今研究热点。
数据挖掘方法:一、分类
a) 决策树分类方法:以样本为基础的归纳学习法,类似于流程图的树结构。
b) 贝叶斯分类方法:它是利用统计学的贝叶斯定理,来预测概率,它跟随机变量的条件概率以及边缘概率分布有关。
二、分析数据
n 回归分析:是一种变量关系式表示数据的一种方法,分为线性回归、一元线性回归很像我们初中学习的一元一次方程,y=ax+b,再者是多元线性回归,多个变量组成的一个关系式,直接表明一个自变量如何影响一个因变量。非线性回归
n 聚类分析:形成数据簇,并满足一个簇内的数据尽量相似,不同簇的数据尽量不相同的两个条件。
2.3金融数据挖掘
因为不确定性是金融市场的本质,所以我们需要通过挖掘金融数据来掌握金融方面的动态及信息,为刻画金融市场的规律和趋势提供了有效的分析工具
金融数据的特点:多样性 关系复杂 动态性
数据挖掘首先将数据预处理,了解数据变化、将数据规约也就是在保证数据完整的基础上将数据进行简单处理,然后建立数据库,最后测试数据库,得出结论。
2.4大数据时代对生活、工作的影响
在大数据的影响下,许多商业、企业都能通过数据分析,掌握顾客的喜好变化,定期给顾客推送一些相关产品,使这些客户形成长期的忠诚度;大数据在医疗体系中也有影响,医疗团队通过分析大量用户的搜索记录就能预测到流感趋势,我认为大数据等我帮助医生可以根据病人过去的病史预测到遗传病率。
结论
总的来说,数据是统计的基础,没有数据统计就没有了用武之地,但是,数据如果不用统计分析方法进行也只是一堆无用的数字而已,所以统计学和大数据是相辅相成的,大数据时代的到来也大大增加了统计学专业的就业率。
参考文献(1)许伟、梁循,杨小平《金融数据挖掘》