昨天突然有一个想法,想统计一下英文文章中哪些单词是最常用的单词,而在26个英文字母中,哪些字母又是出现频率最好的,哪些是出现频率最低的。有了这个想法,就决定付诸实施,询问了一些高手,提供了一些建议和方法。然后我就随便下载了一个非常著名txt英文小说:简爱。小说见附件。因为小说中格式不太规则,所以在导入数据和处理时遇到了点难处,不过经过不断调试程序,最终所有问题都解决了,也借此为大家分享一下不规则数据导入的一些方法。
本程序适合学习了SAS一段时间,稍微有一定基础的朋友阅读学习。程序中包含了大量的base sas的数据处理技巧,字符函数的使用,sas读取raw data的技巧,sql查询的技巧,宏的编写等等。如果你是一个学习了sas一段时间,而想通过实战来更加清楚地掌握一些base sas的数据处理方法,强烈建议你学习一下本贴中的内容。不夸张地说:弄懂了本代码中的所有知识,你的水平基本可以达到sas advance水平。
如果你是高手,也希望你能把程序下载下来,利用自己的技能对代码优化,进而给大家分享学习。如果你是菜鸟,也没关系,花个十天半个月看程序,查资料,相信你立即可以从菜鸟变成一个高手。