<p>呵呵,生气了。</p><p>我又回去仔细看了下前面的帖子。</p><p>一开始:</p><p><strong>“因此,我希望大家能给我多提供一点信息,帮助我们了解哪些院系的教学有特色,这样我们就可以定向进行招聘,提高效率。</strong></p><p><strong> 分享不仅可以给自己一个崭新的机会,同时,也为你的同学创造机会!否则受我的经验所限,就只能在我了解的范围内进行招聘,对其他院校的同学,似乎显得有些不公平”</strong></p><p>态度相当诚恳,而且看出来工作比较认真,这在年轻人里是比较少见的。</p><p><strong>“我觉得应届生还是谦虚一点好,谈能力还不是时候。</strong></p><p><strong>数据挖掘绝对不是了解几个数据挖掘算法就可以的。数据库/ETL/数据仓库/数据准备/变量选择/模型开发/部署和监控/业务规则,尤其是行业经验和异常处理,都是数据挖掘的必备条件,另外还要能有效跟非专业用户沟通,和IT沟通,和高管沟通,请问有几位同学具备这样的条件。”</strong></p><p>说的也很中肯,而且反映了实情。</p><p>所以我才提出我的一些看法,希望给你些参考,因为很多东西都是以前招人的时候犯过的错误。浪费了不少时间和资源。</p><p>分歧出现在这里</p><p><strong>“SAS在挖掘项目中根本不起决定性作用,但是掌握SAS的话上手比较快,不用我再花半年时间培养大家做SAS程序员。另外,SAS的重要性体现在数据清洗阶段,而不是建模阶段。”</strong></p><p>还有<strong>“可以跟我谈潜力,但不要开口就跟我谈能力”</strong>这种高高在上的口气我是比较反感。</p><p>但是,为了说明sas的作用,我在随后给出了证据来支持。其中一份是SAS Global Forum 2008(原SUGI),作者我想国人大概有些经验的都认识,起码听过他。如果说老美在这方面比中国先走,有些优势,我想没人会反对吧。商务智能在中国的发展,实际情况我想是有目共睹的,什么水平大家心里都有数。但是,你这时候却显得不怎么“谦虚”了:</p><p><strong>“hehe,实在忍不住看了楼上的PPT,发现这里真的是校园版的SAS论坛.SAS STAT/ETS提供多种回归过程, NLMIX只是其中一种,还有什么PDLREG, LSREG,MODEL,不一一列举,说实话,这些复杂的回归过程目前在企业的实际应用情况来看,根本就用不着.</strong></p><p><strong>大家别不信,SAS自己的挖掘工具 Enterprise Miner就收录两类回归过程,在其Regression节点,就是线性回归和Logistic回归,其余预测性模型也就是Nerual Network, Decision Tree,艰深晦涩的理论SAS自己都不推, 更不是目前企业应用的主流.</strong></p><p><strong>理论研究追求的是体系完整,象联列方程组一样试图用一个模型解决很多的问题.这是因为理论研究可获得的变量信息太少,为了不浪费协方差结构里信息,因此大多数理论面对的是信息缺乏的问题.但就企业实际应用而言,企业不需要复杂的模型,一个复杂的问题化为若干相对简单的问题,然后在用一个相对简单的模型去解决一个相对简单的问题.因为企业的数据库里有太多的变量可以用,要解决的是信息泛滥的问题.</strong></p><p><strong>看来国内的教学真的是太学院派了,离商业应用的差距真是太远了.<br/>”</strong> </p><p>本来这只不过是为了证明sas不仅仅在data cleaning方面有优势,还有建模也很厉害,可是在国内却有这样的误区,真不知道是因为什么。</p><p>还有,既然楼主的态度好,又为人谦虚,可是为什么又“<strong>发现这里真的是校园版的SAS论坛</strong>”“<strong>看来国内的教学真的是太学院派了,离商业应用的差距真是太远了” </strong>这表明这可能是自身真正的想法。还有ppt最后是有署名作者和公司的,所以我很奇怪怎么会有这样的言辞出来。而且我完全有理由怀疑你是没看,还是没看懂。因此我想说你菜还真是没冤枉你。其实搞过些sas,数据挖掘,或者有统计背景的英语能看懂的话已经很明白我的意思了。而且到这时候我还是在交流。你前后不符的言行着实另我很不舒服,前面是很好很谦虚,后面却很傲很无理(这也是为了这坛子里的各位教授和学生,说实话,不少人水平相当的可以!)。另外你如此贬低一个高级分析师(真正有能力的人),我得出的结论大家用脚丫子都能想出来,就股票而言,如果一个上市公司/银行的主要分析师的能力有问题的话,极有可能这个公司的业绩不会太好,这个是常识。不算过分的话。</p><p>可是,这时候你居然跟我端起架子来<strong>“kuhasu,就依你目前的水平和态度,白给我干我都不招。”</strong>可能前提假设成我是学生,处于招聘用人的被动地位,没有任何优势了。<strong>“如果做不到,或者琢磨不清楚,就少一些狂妄,多一份谦虚吧,少在我面前谈水平。”十分另人生气的腔调。</strong>看样子是想让我闭嘴。所以我报下身份难道是无理吗“客观地讲,我的职级比你高,报酬所得的话你应该比不了。:)不要以为在这里的都是学生。”至于你谈论项目的语气和措辞,“<strong>你要真想了解数据挖掘,去研究下Enterprise Miner吧,如果觉得你的SAS水平够牛,你也可以试试如何用Hash实现表链接,如何SAS代码实现Intergroup Grouping。如果你想了解模型,你可以去琢磨下如何把收入、年龄、职业、性别、手机号码、email地址这些不同性质,不同量纲的变量放到模型里去做二元logistic回归。如果做不到,或者琢磨不清楚,就少一些狂妄,多一份谦虚吧,少在我面前谈水平。还有就是如果你觉得SAS的BI产品够牛,你可以去了解了解汇丰、花旗、BOA,四大行,还有上规模的中小银行,电信,证券,看看他们是怎么用SAS的,怎么管理ETL的。如果你还觉得不服,你去了解下目前国内外银行监管炙手可热的BASEL 2项目,可以说是集数据分析和挖掘之大成,在所有的项目招标中,SAS中标的有几家。”</strong>看出来似乎你真的没太多经验.......至于这句<strong>“SAS是棵好树,但千万不要以为一颗大树就可以撑起一片天。而各位热爱SAS的朋友,也不要以为SAS是块宝就抱着不放,不小心就成了井底之蛙”,</strong>把所有人都一棒子打死,连我都没说过SAS百分百好,真是奇怪你好好看我的回复了没有?</p><p>还有,哪怕是sas base programming培训,也会都讲过EM其实就是base程序的一个GUI实现。所以实际上所有的EM功能都能用base实现是公认的事实。</p><p>其实根本就没有偏离SAS讨论的本质,你难道让所有后来看你帖子的人都认为sas只会数据清洗吗?亦或是建模只占一小部分(是指需要的时间还是重要性呢)?这样误导别人那还不如一开始就没人知道的好。</p><p>可能你的确会对“专业水平将会影响大家对我的团队的信心,从而影响我工作的完成。”比较担心,但是实际上我一直是本着交流的目的和思想。只不过你缺乏些耐心。那个report如果你仔细看了,看明白了,就不难明白我的意思。可是你却抛出那么一段话......所以你以后的工作怎么样,那是你的问题。而且这里的讨论仅仅是交流,跟其他的没有关系。有的时候并不是两个人,是代表两类人两种思想。论坛讨论的好处就是这样,没什么不好意思的,不用把个人看的太重。要是在网络你都不能心情愉快的交流发表自己的看法,那不是太郁闷了。而我并没有在招聘区你的帖子进行回复,相信你是可以了解我的意思了。</p><p>至于,你提的问题,第一个第三个没什么好说的。第二个,IGN的模拟问题</p><p> 2.公布你用SAS base代码实现Enterprise Miner里的Interactive Grouping的算法和功能(我认为这点SAS Base实现起来很困难,如果要考虑灵活高效的话)-----------你说的一点儿都没错,因为以前有授权模块的使用问题,所以对ING模拟过。但是我是说EM的功能base都能做到,可没说一定灵活高效(可视化)---对于习惯于可视化操作的分析师来说,base很难达到这样,真正模拟的好的话那直接用那个node不就可以了。但是如果是用快速高效的话,base编出来的肯定是别的比不了。而且因为市场定位的关系。EM的认可度高些,但也有算法等缺陷,所以很多还是要base来实现。</p><p>你的激将法对我没什么用,我没心情做义工:)</p><p>要是几年前,我估计我肯定会大段代码和演示往上贴

</p><p>最后,祝你身体健康、工作顺利!</p><p>另外对毕业生要说的是:他们那里还不错,毕业生一定要踏踏实实的先积累经验。</p>
