请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
kaizhang 发表于 2010-10-13 17:51 我处理过80G的数据。我是用SAS软件把数据切割成小的CSV文件,然后利用SQL语言进程处理。
sabin 发表于 2014-1-9 00:03 总体处理还是抽样?这个还真得商榷一番。能不抽样自然都不愿意抽样,问题是现在的数据是越来越大了,举例来 ...
爱萌 发表于 2015-1-28 10:02 看来,你在实践中已经尝试过,我也有这种经历,目前我看到了Twitter,google的一些分享后,基本倾向于做抽 ...
sabin 发表于 2015-3-24 09:30 我自己目前都是用抽样在作,搞定了就发布出来做应用。模型只是揭示一种规律,本身也只是营销上的一个环节 ...
爱萌 发表于 2015-3-24 12:55 这个说法很有意思,从模型转到整个业务流程上,聚焦在业务价值
sabin 发表于 2015-3-25 00:20 嗯,始终是要解决实际业务问题的,模型本身也是反映这些问题并用数据粘合了问题与答案,这是所有数据分析 ...
marloneusa 发表于 2009-6-30 02:46 我也向学习学习。我们经常碰到GB以上的数据,化的时间很长才能处理机条简单的句子。如果是百万级的变量 ...