全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2333 7
2010-06-09
这是我们领导发给我的
    第一层,定期对已有数据的整理、分析及汇报。这是数据分析的最初应用。旨在通过频数等描述统计,用直观的报表或图形来“微言大义”的反应问题。如本月的女用户是增加用户中的比例,是总体用户的比例,这个比例达到一定情况下,说明了什么问题等等,这样通过已有数据来直观说明问题。不难理解,这样的数据处理方式与其是说数据分析,不如说是在做数据汇报。其目的性很明显,同时操作难度也不大,虽然简单,但是可以作为企业定量衡量绩效的重要方式。因为流程的可复制与程序化,大抵上可以采用一些软件来提高效率,当然,自行编写程序也是很好的选择之一。

  第二层,基于目的性的分析研究。企业生存的核心是账面上的数字,但往往谈论的是产品和服务应该怎样被客户所接受这样的问题。因此,将企业所关注与讨论的问题定量化,模型化,而后去主动的搜索信息,基于模型整理、分析之后,揭示这些企业关心的问题。如服务的同质性、可替代性、主观问题如满意度的客观解释等。这些数据用描述统计所得到的结果往往是有偏、不一致的。需要通过数理统计的处理,应用适用的模型去测度。最终,告诉决策者,我们的产品与服务中诸如可替代性、满意度等问题的答案是什么。这一层面上,相较于第一层的“数据整理与汇报”而言,最大的改变是去测度,而非简单通过频数来描述。

  第三层,无明确目的的问题解决性分析。前述的方式,无论是分析汇报数据的描述统计,还是基于对某一关心问题的测度研究,都是基于在决策层认为信息不足以决策之时,为了补足信息而做出的研究。而无明显目的的问题,则是决策层希望解决问题,但却不能确认究竟是哪些数据在影响问题,如何分析数据才能找到答案的情况下,用一个整体、且又模糊的目的来指导数据分析。比如,如何才能增加用户、如何将非积极用户转化为积极用户、怎样使得用户认可商业模式等等。要解决这类问题,首先要做的就是量化问题,将不明确的问题,用可以测度的变量来支撑。例如网站粘性不高问题的解决,可以转化为:定义积极用户、定义非积极用户的、此二者的差异、二者差异之于其他网络服务是否具有同样的差异等等可以通过第二层的数据分析测度的变量,用这些变量来支撑网站粘性不高问题,如何解决这样一个很难直接测度的问题。显而易见,找到可以测度的支撑变量,并且用这些变量支撑,是有足够可信度来发现问题的。这其中应用到的与其说是统计分析工具,不如说是统计思想。

  对于数据分析,没有任意一种工具与模型是可以通用的,因此每个问题都要通过统计思想与经验去甄别、选择合适的分析工具。更为重要的是,统计工具没有时髦与否,只有适用之分。要利用统计思想去探求事物的本源,而不是形而上的统计工具应用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-6-9 17:08:46
1 google下就有这些文字的出处
2 分析风格也许会带着很浓重的企业风格,或者说是Team或是Boss的风格,这段文字的风格是如此的熟悉与切合。
3 按此定义的这三层没有上下高低境界之分。看问题的思想并不仅限于统计思想那么狭隘。业务知识和经验往往更胜一筹。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-9 17:31:29
在统计分析阶段,有三层含义:
1.hissight;
2.insight;
3.forsight;

可以对应楼主说的三个方面。

在数据挖掘阶段,有三个不同:
1.超大数据;
2.超多维度;
3.realtime;

在遇到超大数据和超大维度时,整个数据结构和数据处理方式可能会发生根本性的变化,这就好比一个人如果离目的地如果只有5公里,你可以走着去,超过100公里,你只能骑自行车,如果要去美国,那只能做飞机。这也是哲学上所说的从量变到质变的过程。你可以想象当你在Google上搜索一个字的时候,Google公司的那些能人是如何在不到1秒的时间内提供给你几千万个搜索结果。

但是不管哪个阶段,你脱离不了变量。在那些书斋里的教授看来,变量都是冷冰冰的;但是在企业里面,变量是活生生的,你必须知道每一个变量的业务含义。所以,你肯定不能闭着眼睛去运行proc genmod.....^_^.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-9 21:24:16
1。方法实施。更多时候分析的偏向技术的效率。
2。方法与业务。持有业务意义的数据往往更有深度。
3。些许有点走火入魔的担心,最后为数据服务,而不是通过数据为己服务,例如相关与因果。对于变化的事物,有限的是能量化的维度,无限的就如Chaos,对待方式于是就存在着两种极端,太被相信和完全不信。有一天而当被所有决策者认为持有数据的我等可行率是100%或者0%的时候,我等是否还能对其“谏言”:看,数据表明并不是这样的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-10 17:23:24
为什么lz的论坛币是负的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-10 17:30:29
errorzhu 发表于 2010-6-10 17:23
为什么lz的论坛币是负的
人品不好吧......
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群