全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析师(CDA)专版
4121 11
2016-03-10

大数据时代:通过什么软件去收集、分析和可视化数据


提问:


在大数据时代,一般都是通过什么方法收集、分析和可视化数据的?


作为非平台运营商有没有办法收集到数据呢?假设说新浪微博每天有一亿条更新的微博,那么这些数据是不是只有新浪才能收集,第三方是没法收集的呢?


如果收集到了数据,一般是通过什么分析软件来分析呢?然后最后可视化输出又是通过什么软件呢?


(87).jpg



解答:


数据是平台运营商的重要资产,可能提供API接口允许第三方有限度地使用,但是显然是为了增强自身的业务,与此目的抵触的行为都会受到约束。


收集数据主要是通过计算机和网络。凡是经过计算机处理的数据都很容易收集,比如浏览器里的搜索、点击、网上购物、……其他数据(比如气温、海水盐度、地震波)可以通过传感器转化成数字信号输入计算机。收集到的数据一般要先经过整理,常用的软件:Tableau和Impure是功能比较全面的,Refine和Wrangler是比较纯粹的数据整理工具,Weka用于数据挖掘。


Hadoop是一个能够对大量数据进行分布式处理的软件框架。用于统计分析的R语言有个扩展R + Hadoop,可以在Hadoop集群上运行R代码。更具体的自己搜索吧。


可视化输出的工具很多。建议参考wikipedia的“数据可视化”条目。


Tableau、Impure都有可视化功能。R语言也可以绘图。


还有很多可以用来在网页上实现可视化输出的框架或者控件。


(51).jpg



大致基于四种技术:Flash(Flex)或者JS(HTML5)或者Java或者ASP.NET(Silverlight)

•Flash的有Degrafa、BirdEye、Axiis、Open Flash Chart

•JS的有Ajax.org、Sencha Ext JS、Filament、jQchart、Flot、Sparklines、gRaphael、TufteGraph、Exhibit、PlotKit、ExplorerCanvas、MilkChart、Google Chart API、Protovis

•Java的有Choosel、google-visualization-java、GWT Chronoscope、JFreeChart

•ASP.NET的有Telerik Charts、Visifire、Dundas Chart


目前我比较喜欢d3(Data-Driven Documents),图形种类丰富,有交互能力,你可以去d3js.org看看,有很多种图形的demo。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-3-10 16:15:06
真的是受用又受教了,太棒了楼主!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-10 21:00:32
分析得不错,很有用处。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-11 09:30:32
很有启发
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-28 18:21:19
像手机这样的智能设备不仅是人们时刻不离的随身物,更是生产数据的来源。如今,大数据已成为企业中与资产、能源同等重要的战略资源。如何从海量数据中挖掘有价值的洞见、更准确地预见未来,成为企业营销管理工作的重中之重。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-28 18:44:45
大部分的互联网金融企业目前体量尚小(唯一的例外是阿里),用户规模和交易额都不大,缺乏大数据基础,亦无力承担大数据的基础设施和处理成本,更重要的是并没有大数据的迫切需求。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群