经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
数据分析杂谈 微博
楼主
jjtjzj
1987
1
收藏
2010-12-31
http://blog.sina.com.cn/s/blog_7172d97e0100oxqa.html#post
有人的地方就有江湖,有江湖的地方就需要数据分析
(2010-12-31 11:49:18)
转载
标签:
数据分析
围脖
微博
analytics
数据表
web
it
分类:
数据分析杂谈
有人的地方就有江湖,有江湖的地方就需要数据分析。
此话不假。前半句大家都熟,后半句需要给大家解析解析。目前社交网站热门吧?最热门的当属
facebook
了。
facebook
就是一个大江湖。各种内容,各种照片,各家广告,琳琅满目。其他的就不瞎扯了,主要探讨其中涉及到的
analytics possibility
。其实目前西方分析界已经开始大量研究此类江湖中的数据,进行整理后发布各项社会指数
/
品牌指数等等,具体涉及商业机密,投条详谈哈。
微博
/
围脖世界也是一个大江湖。顺便扯一下,根据本人近日考证,围脖最早的起源在中国。酒香不怕巷子深,是我们熟知的谚语了。虽然巷子很深,可是店主早就想出办法招揽客户了:发微博嘛。没有互联网,没有电脑的时代,围脖照样深入人心。下面的图片就是世界上最早的微博,公元前就存在了。言简意赅,穿透力强,还有观众围观及口口相传,不是围脖主要的特性吗?
今天想到从业多年对数据分析项目的几个难点,有感而发,和行内的兄弟姐妹,大兵小将们探讨探讨。
1.
行业理解
行业知识非常重要,这一点本人深有体会。就拿做过的一个邮局的
project
来说,客户想要知道为什么公司每年都要投入大笔资金购买新的
containers
,而公司业务量并没有显著增加。这就需要熟悉邮政行业的内部运作流程,各种型号的
containers
在大型中转站和地方邮局之间怎样运转,邮局内部的数据录入是按照双向记录还是单项记录,在这种情况下缺少行业知识会让你面对海量数据却无从下手。
2.
数据表
(data table)
理解
面对有很多数据表的分析项目时候,真的是喜忧参半,高兴的是不用担心做出“无米之炊”,让你头大的是数百个相互关联复杂的数据表你该选用哪个,更让人抓狂的是要从表与表之间数个链接中选择正确的一个,特别是涉及到
Left join
和
Right join
的时候要格外谨慎。
3.
变量理解
这就需要多和公司内部人员沟通了,每个公司内部都有自己的记录规则和命名习惯,只是单纯的看数据是观察不出来的,而且当变量很多的时候很少有时间逐个解读。另外就是,要多挖掘数据的潜在变量,可能一张表有数百个变量但可以用来分析的只有一两个,这两个变量很可能被漏掉,这时呢,就要发扬“宁可错看一千,不可漏掉一个”的精神。
4.
分析目的理解
当你接到一个
project
的时候,分析目的也就是转化成我们分析术语后的客户需求,对项目的整个流程都非常重要,它是整个分析的大方向和最重要的衡量标准。本人曾做过一家报纸的项目,该公司推出
“bi-media”
的服务,客户了解他
Paper+Web
的用户的上网特征,这时就要剔除
Visitors
对上网数据的影响,把历史数据
(offline data)
和上网数据
(online data)
结合起来综合分析,找出各个用户群的上网特征,比如一些新注册的用户上网主要看新闻而老用户更倾向于参加论坛讨论,用电子邮箱的人比没有的人上网更频繁,男性用户对
Sports
更有兴趣等等,分析的方方面面都要围绕这分析目的展开和深入。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
wangcui850112
2011-1-8 13:42:51
您好!我是一个行业外却想进的一个人呵呵。很高兴认识你。因为想对以后的面试做些准备,所以想先练习一些案例。我看到《数据挖掘实践中》客户特征分析和划分。不知道在商业实践中是否真的那样做就可以。不知道是不是自己想的太复杂了。我想找到一个扩展的思路,举个简单的例子,proc means在很多书中都有,如果要用到实践中面对很多变量就可能涉及到macro 还有ods等技术。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
收干货:数据分析新手入门必备资源大全
中国企业应用数据分析大概情况和未来趋势(上)
运用先进数据分析手段,不断提升我国仿制药研发水平
大家都来学数据分析
为数据分析瘦身法
商业分析-数据分析与决策第五版
一个成功的数据分析团队:角色与职责
R语言实用数据分析和可视化技术
数据分析科学概述
如何从会计转行到数据分析
栏目导航
数据分析与数据挖掘
经管高考
休闲灌水
爱问频道
宏观经济学
数据分析与数据科学
热门文章
CDA 数据分析师:统计制图实战指南 —— 让 ...
【24重磅,自用整理!】2000-2024上市公司投资 ...
视频媒体:AI漫剧爆发在即,重视产业链机遇
范撒普《实现财务自由的安全策略》
新宏观丨对刘元春关于新凯恩斯主义六点共识 ...
量子科技行业深度报告:量子革命:量子科技 ...
俄语–英语双语图解词典
先进空中交通2025年
export slowdown and increasing land supp ...
“十四五”能源发展成就报告
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群