关于频数分析的问题,请高手指点一二:
手里有一张Excel的表,数据量比较大,2万多行,列数不重要,如下:
anything1 主叫号码 anything2
-------------------------------------------------
XXXX 139xxxxx XXXX
XXXX 138xxxxx XXXX
...
...
--------------------------------------------------
在主叫号码一列,同一数据(同一手机用户)可能多次出现,但是anything1字段及anything2字段的数据不一样。
现在需要把出现次数比较多的用户数据(整行)提取出来,生成另一张Excel表(同样3个字段)。
关于实现的方法:
1,JMP
本人习惯偷懒,做频度分析喜欢用JMP的Parate图功能,直观,好用,但是这次由于数据量太大,做Parate图时
必须不停地加长X轴才能看清楚,很不方便(每天都要做)。可否利用JSL写一个脚本,只保留出现次数超过某个
设定门限的记录(用户)?
2,Excel
如果能用Excel本身实现,哪位指点一下?我毫无头绪,见笑!
3,SAS或者SPSS?
同上。
还望各位不吝赐教,多谢!