张俊妮博士现任北京大学光华管理学院统计学副教授。
她1998年毕业于中国科学技术大学,获计算机软件学士学位;
2002年毕业于美国哈佛大学,获统计学博士学位。
她的研究领域为因果推断、贝叶斯分析、蒙特卡洛方法、数据挖掘以及统计在经济、金融、营销中的应用。
曾在国际主要学术期刊Journal of the American Statistical Association, Journal of Educational and Behavioral Statistics,
Statistica Sinica, Computational Statistics and Data Analysis,
Journal of Chemical Physics,
管理世界, 经济学季刊等国内外刊物上发表文章。
并有中文专著《数据挖掘与应用》。
她曾参与国家自然科学基金项目“品牌个性维度及其测量量表研究”,
负责过北京大学光华管理学院与中国信达资产管理公司合作的“金融不良资产定价”课题研究项目和北京天健兴业资产评估公司“统计估值模型”的项目研究,
主持国家自然科学基金项目“使用倾向分和主分层进行因果推断”,
并且担任过担任美国国立卫生学院(NIH)国际研究合作基金项目“生活质量研究中的因果推断”的中方负责人。
在2010年“计量方法在经济中的应用”国际大会上,她是组委会成员之一。
她于2004-2009年担任Computation Statistics编委(Associate Editor)。
她至今仍担任北京哈佛校友会理事,是美国统计学会和全球华人统计学会成员。
教授课程
1. 概率论与数理统计(英) (本科课程)
2. 数据挖掘与应用(研究生课程)
3. 商务数据分析(中、英)(MBA课程)
问答汇总:
Q1:坛友linzhongta:
张老师,
您好!我是学习计量经济学的一个学生,发现处理数据和计量的软件很多,如果我想朝着数据发掘方向发展,想请问您为了较为有前途的软件是哪一个?R软件吗?A1:
如果数据量不是很大,各种统计软件都可以用于数据挖掘。如果数据量偏大,SAS和commercialized R应该能处理。再大就需要考虑并行编程了。在学习阶段,软件不是最关键的问题,学习数据挖掘的框架和方法才是更重要的。
Q2:坛友lqyzth:
张老师:
您好!我们目前做的调研很多,但是都不能够很好的处理!我们也学习了SPSS,R等一些软件,这些功能很强大,我们不能够很好的把这些软件和实际需求结合起来,反而我们还是习惯性的用EXCEL去处理数据,也没有用到VBA等二次开发,希望老师给我们指导指导:如何更好的用SPSS等专业数据分析处理软件解决数据分析、计量等实际问题?
A2:
一般常用的统计方法在各个统计软件中都有,关键还不是在于使用软件,而是学习统计方法,会解释统计结果,会建立预测模型等。
Q3:坛友zhangibt:
张老师您好, 不知道您的研究领域与 区制转移(regime swiching)有没有什么交叉? 区制转移的研究未来是否广阔?
A3:
regime switching我了解一些,但不是很多。在时间序列中,它应该是指不同阶段的数据来自不同的模型,那么还需要发现change point在哪里。它是众多统计模型中的一种。
Q4:坛友FlyUFalcon:
高频交易最近是个热门词汇。请问蒙特卡洛分析高频数据有没有需要改进的地方? 局限性又在哪里?谢谢
A4:
高频数据是近年来的研究热点,有很多针对高频数据建立的统计模型。蒙特卡洛方法是从指定概率分布中抽样的一系列统计模拟方法,包括MCMC(马科夫链蒙特卡洛)、SMC(序贯蒙特卡洛)等。针对不同的统计模型,蒙特卡洛方法的具体步骤也不同。总会有更新的统计模型和更有效的蒙特卡洛方法。
我不知道你指的是不是某些行业经常使用多元正态分布来进行蒙特卡洛模拟,如果是这样,还是有局限性的,因为高频数据很可能不满足多元正态分布。
Q5:坛友cwang82:
Prof. Zhang,
Data mining has been widely used in financial industry, especially in some quant-based funds, to identify trends of price movement; Monte Carlo simulation is also widely used in financial derivative pricing.
How about Bayesian analysis? In which areas of financial industry the Bayesian analysis is used and how it is used?
Thank you.
A5:
贝叶斯学派是统计的两大学派之一(另一个是频率学派),金融中有各种各样的贝叶斯统计分析,在asset pricing、volatility modeling等领域都可以用到贝叶斯方法。比如Eric Jacquier and Nicholas Polson就写了一篇Bayesian Methods in Finance的论文。比如M. West and J. Harrison的书《Bayesian Forecasting and Dynamic Models》中的建模预测方法也可用于金融时间序列。
Q6:坛友儒子扬威Leo:
求教张老师:
作为一个商科的学生,对统计感兴趣(以后肯定是数据说话、大数据时代),也能较好掌握spss(和excel)的使用
请问您认为作为一个商学院的,希望把统计做为一项较为重要的技能的学生,您认为还需要学些什么呢?
(比如我可能更希望通过数据去指导我的营销策划,通过数据来预测消费行为)
A6:
我觉得你主要需要学习与营销结合的统计方法,知道怎么解释统计结果,建立预测模型,等等。营销领域有很多统计的应用,也有相关的书籍,如光华管理学院涂平老师写的《营销研究方法与应用》,更深的有Peter Rossi等人著的Bayesian Statistics and Marketing。
Q7:坛友caixiaqing:
张老师,您好,关于数据挖掘,我想请教您,在具体的分析过程中,如何来处理各个相关影响因子。在课本上,讲的都比较理论一些,可是在实际中,各种因素错综复杂,相互纠缠,这必然面临一个因素次要的选择问题,请问老师您对这方面有什么经验可以向我们传授?
A7:
模型和变量选择是统计中间一个传统的并且不断更新的领域。各种统计模型中都可能牵涉到这个问题。实际中常用的是使用一些统计信息准则AIC、BIC等来从一些备选模型(比如加入不同自变量的线性回归模型)中进行选择。
Q8:坛友hbhjhf:
如今big data 炒的很火,无论政界、商界、学界还是公众,都高度关注。
张教授兼具计算机与统计背景,必然对此领域有深入认识。
请教:大数据时代,统计学面临何种机遇与挑战,传统统计方法(基于样本推断总体)在大数据处理技术(将处理的巨量数据视为总体)面前,真如波兰骑兵团遭遇德国坦克师一样无力吗?
哈佛统计系作为北美统计研究重镇,那边的教授们怎么看此类问题?
A8:
大数据时代当然不意味着统计学科的崩溃,反而给统计学的理论和应用的发展带来了极大的机遇。出现了新的数据类型(如社交网络等),数据分析提出新的要求(例如高维变量的问题),就需要新的统计方法。实际数据中总体不停地变,就需要模型能及时反映这一点。你说的这个问题虽然在大数据时代是个很明显的问题,但以前统计学家也不是没有碰到过,比如做online learning的时候,数据的分布可能就会随时变化。我倒没有专门和哈佛的教授讨论过这些,但大家都知道现在是统计发展的黄金时代。
Q9:坛友yeting2000:
张老师:
您好!感谢您百忙之中抽出宝贵时间为我们解答问题,我的问题是:例如一家以销售为主的公司,它在于客户的交流和市场的探寻过程,肯定会通过前期的交流收集到各种数据。但是许多一线销售人员包括基层的管理者却不会针对收集到的数据进行分析,无法从纷繁复杂的各种数据中找到自己想要的和本质的东西。我想请问您一下,在数据分析中,作为这样一些基层的群体,应该通过什么样的流程和操作,准确的把握和分析好数据呢?谢谢
A9:
我想这些数据分析人员还是需要对数据挖掘框架和方法有一个比较详细的了解,再结合具体业务分析数据。可以参考拙作《数据挖掘与应用》。
Q10:坛友NoHL:
教授您好,看到您的研究领域有:因果推断 和 数据挖掘
那么请问如下问题:在进行大数据挖掘的时候,经常会遇到关联性问题,比如两个时间序列之间的关联系数,通常使用的有Pearson系数和Spearman系数,他们反映两个时间序列之件的线性或非线性的关联程度,但是并不明显表达出因果性——即究竟哪个时间序列是自变量那个是因变量,尤其在多时间序列之间,理论上任意两个都存在关联系数,但是涉及到因果性也会变得更加“模糊”。故请教您在大数据挖掘中,如何对关联性较强的数据进行因果判断,尤其是多时间序列之间的相互因果?
另外关于蒙特卡罗算法也有一个问题:
在金融时间序列中,金融数据的分布是呈现出一些不太寻常的分布特点的,例如对于一些资产或者证券的log-return进行的分析就不难发现存在着一些有趣的分布规律。在构造金融时间序列的时候,也常会用到一些需要模拟数据的情况出现,那么请问您,现在蒙特卡罗算法如何解决金融数据模拟当中的一些“极端”情况,例如不规则分布,尤其是尖峰、长尾、厚尾,如果保证生成的数据具有和真实金融数据一样的统计特性,蒙特卡罗目前在金融数据模拟尤其是模拟数据生成中,相比于其他方法或操作,例如分形法、序列重排等,具有哪些优势?
A10:
我所研究的一类基于potential outcome的因果推断方法是假设已经知道原因(例如参加就业培训等),而用统计方法分析这个原因是否产生了可衡量的效果(例如提高就业率)。在因果推断领域常用的另一类方法是Graphical model,它用条件独立性质来描述因果关系并用图形的方式进行表述,再从数据中学习相应的图形。经济计量中还有Granger Causality等概念。但我觉得这些方法实际上都试图发现在某些程度上更像因果关系的相关关系,而不能断定是因果关系。对于时间序列的因果分析,抱歉我不太清楚。
蒙特卡洛方法是从指定概率分布中抽样的一系列统计模拟方法,包括MCMC(马科夫链蒙特卡洛)、SMC(序贯蒙特卡洛)等。针对不同的统计模型,蒙特卡洛方法的具体步骤也不同。在金融数据模拟中,我想还是从数据中先拟合一个合适的统计模型,再从模型中进行模拟,数据会更像实际数据一些。抱歉对于分形法和序列重排方法我不太清楚。
Q11:坛友wuhui1018:
张老师:您好!我个人最近对MCMC比较感兴趣。而里面主要两种算法。EM算法与GIBSS。大概就只知道这么多,因为只是想直接应用,不想专门去读一些MCMC大部头的书。所以很想请教张老师有没有一些比较适合快速了解MCMC这两种算法的比较详细的讲义或者学术论文。或者您给推荐一些资料,在此非常感谢!
A11:
我想你可以阅读一下Jun Liu教授写的《Monte Carlo Strategies in Scientific Computing》中相应的章节。英文书籍后边都有索引,你可以根据索引找到相应的页。
Q12:坛友xuruilong100:
张老师你好, 因为工作的原因, 经常接触到"时间序列预测". 在做时间序列预测的时候遇到一个"哲学问题", 面对一组数据我想知道预测能力的极限在哪里, 我使用的模型的预测能力距离这个极限有多远, 如何衡量. 给定一组数据, 有没有办法不依赖事先设定的模型, 直接通过数据区分哪些是可预测部分, 哪些不是?
A12:
通常统计上的做法是将实际数据(t=1,...,T)分为两部分,前一部分(如t=1,...,S)用来建立模型,后面的数据(如t=S+1,...,T)用来检测模型预测的准确性。
Q13:坛友justplay16:
张老师您好!我是物理类的博士,明年毕业,打算以后转行做金融相关的数据挖掘和统计分析方面的工作,但现在金融基础很薄弱,软件方面只学了SAS的一些编程技巧,感觉这方面相关的资料太多无从学起,也不知道是否可以将自己的理工科背景转化为优势竞争力,您能否能结合这些情况给我提供一些学习和职业规划方面建议?谢谢!
A13:
我想你可以去读一个金融或统计的研究生项目,很多物理专业的人都走过这条路。
Q14:坛友solor1211:
请问一下张教授,想系统地学习蒙特卡洛模拟,能否给点建议,提供一些学习的方法和书籍,谢谢!
其他同学如有建议也请多多指教!谢谢
A14:
你可以阅读一下Jun Liu教授写的《Monte Carlo Strategies in Scientific Computing》。重要是多实践,也就是自己编程进行模拟。
Q15:坛友whiteice:
数据挖掘中使用了由过去的数据来推动未来的行为,你认为这种思想好不好?如何提高预测精度?
A15:
数据挖掘中假设使用历史数据建立的模型能够预测未来,这种思想有它的优点,能够以一种规范的方法学习大量历史数据中的规律,支持决策,而人如果面临一堆材料或数据,很可能顾此而失彼。当然这种思想也有它的弱点(天下没有免费的午餐),当发生重大变化的时候,人可能立刻察觉而数据可能需要一段时间才能反映出来。
提高预测精度的一个关键点是要有质量高又与所分析问题密切相关的数据。在建模的过程中,也可以通过比较各种模型提高预测精度。数据挖掘中,通常把数据分为训练数据、验证数据和测试数据,使用训练数据建立各种模型,使用验证数据比较各种模型并选择预测精度比较好的模型,再使用测试数据评估所选模型的预测效果。
Q16:坛友邪恶的左眼:
张教授你好,我最近在写有关黄金期货的论文,我想问一下,在将日数据处理为周数据的时候,该是选择用加权平均算法好还是选择挑选特定时间的数据好呢?另:希望教授能给一些处理数据的建议,如黄金期货的数据哪里找的全,黄金期货的数据处理时改如何考虑时差问题
A16:
哪种方法好可能还得看数据本身的变异程度、数据分析的目标。对于黄金期货我不太了解,抱歉没法给什么具体建议。
Q17:坛友asd0109:
张老师您好,
中国政策环境下,很多国外的模型和数据终端很难发挥实际效用。请问你对国外科研的规律性在中国难以得到创新,有何看法?
另个问题有关数据挖掘,中国很多数据都不公开发布,如何使模型、预测等,更具可行性?请问您有什么好的经验么?谢谢!
A17:
统计模型是需要根据实际数据建立的。国外的模型基于国外的数据建立,当然可能不适合中国的情况。收集并共享关于中国的质量高的数据,是提高统计模型应用效果的关键。这需要各方的切实努力。
Q18:坛友zhuyun11223:
张老师您好,我是统计学的本科生,今年9月开始统计学硕士学习。我最近对数据挖掘和机器学习这方面比较感兴趣,各种算法都有看一些,但具体实现时遇到一些问题。sas,r,python这三种软件我都尝试了一些,目前比较倾向于python,但感觉国内用python的比较少,想问下您这三种语言那个更有发展潜力一些。麻烦您了,期待您的回复。
A18:
SAS和R都是常用的统计软件,实现了很多统计方法,如果你的目标就是做统计分析,这两种语言很好。Python我听说过,没有用过,应该也是不错的语言,学计算机的人会使用,但不是专门的统计软件,估计实现的统计方法有限,但也许最常用的一些方法已经实现了,不太清楚。
Q19:坛友党力:
张老师您好:
我是一名经济学研究生。对于金融经济学也一直很感兴趣。计算机对于金融工程发展也起到很大的推动作用。模拟也变得很重要,好像宏观经济学方面也要求很高?不知道老师有没有原理性,或者比较基础的教材推荐?还有自己经常在matlab和sas以及stata计量软件之间徘徊,不知道老师觉得如果做金融方面计量那个更加有优势?多谢老师!
A19:
金融经济学方面不太清楚。matlab、SAS、stata等统计软件应该都可以用。软件不是关键,重要的是对于方法的掌握,对分析结果的解释,等等。再自己挑选一个合适的软件。
Q20:坛友fridayshow:
我想问的是,蒙特卡洛在exotic金融衍生品定价,风险管理特别是压力测试上都应用越来越广泛。金融监管机构也有越来越多的要求。但是监管和金融机构会有这样的矛盾,如果要做得更或者更好的估计到那些black swan时间,就需要更多次数的模拟,生成更多次path。但是这样就会用更多资源花更多时间。这其中有什么比较好的efficiency加强的方法么?国内监管部门对这方面有什么要求?对monte carlo的参数假设有什么样的规定呢?
A20:
蒙特卡洛方法是从指定概率分布中抽样的一系列统计模拟方法,包括MCMC(马科夫链蒙特卡洛)、SMC(序贯蒙特卡洛)等。针对不同的统计模型,蒙特卡洛方法的具体步骤也不同。这还是要看具体问题,抱歉我对这个领域的具体问题不太清楚。
Q21:坛友xueyinchina:
老师您好,我现在是统计学专业的研究生,目前为止还未学习数据挖掘方面的知识,但是很想朝这方面发展,请问该如何入门呢?数据挖掘需要很强的数学和计算机功底吗?谢谢!
A21:
有好的统计和计算机背景,再能结合具体问题,就很好了。可以参考拙作《数据挖掘与应用》。
Q22:坛友chnxgd:
张老师好,根据历史数据统计的结果,在后续数据陆续补充后;
问题1:是把后续数据和前面数据合在一道统计好?还是前面归前面统计后面归后面统计?
问题2:分开统计,如何判定后续数据在前面数据的统计结果范围内?或者已经远远偏离前面结果?(抽样方法一致的)
A22:
应该需要看后续数据和前面的数据是否有很大的差异。简单的方法,你可以使用t检验等对比前面的数据和后续数据;复杂一点,你可以使用前面的数据建立一个模型对后面数据进行预测,如果超出95%的预测区间,可能后续数据就偏离大。如果差异不大,应该可以放在一起统计。
Q23:坛友Rayn007:
张教授您好! 我没学过数据挖掘,我想问问商务数据分析如何进行?你能推荐一个较实用的数据挖掘软件吗?如何将数据挖掘软件应用到经济、金融、营销等领域?谢谢
A23:
还是学习一下数据挖掘的框架和方法,再结合各个领域具体的商务数据进行分析比较好。SAS中有数据挖掘组件Enterprise Miner是以所见即所得的方式设计的,我觉得还比较好。但如果了解地深一点,还是自己编程比较好。可以参考拙作《数据挖掘与应用》。
Q24:坛友airways1:
张老师,
到底是要先学程式,还是先学理论?同时进行好像两边都好乱。又如前几位先进所问的,matlab 实不实用呢A24:
还是先学理论,再用软件实践比较好。软件只是一个工具,不是问题的关键。matlab等软件都可以选用。
Q25:坛友0o戏子:
张老师您好,我对将数据挖掘用于欺诈甄别这个方向比较感兴趣,希望能请您推荐一些这个方面的书籍或者资料,还有就是关于FALCON系统和FAIS系统的一些相关资料,谢谢!
A25:
你提的具体问题我不太清楚。欺诈甄别是数据挖掘的一个应用,你可以先学习数据挖掘的框架和方法,再结合这个具体问题。
Q26:坛友上官云天:
张教授,
你好, 数据挖掘目前是AI领域的一大研究热点, 它也是一个新兴的边沿学科,汇集了来自机器学 习、数据库、模式识别、统计学、人工智能、管理信 息系统等多个学科的研究成果,吸引了各方面的 专家学者投身此领域的研究和开发工作,而且被 许多工商界人比较看重! 是这样的吗,我对数据挖掘与应用这一新乡学科的理解和认识有很多不懂,既然是边缘学科, 是不是没有很大的前途?
至于数据分析,我感觉更应该是和会计学和统计学的联合,只是,通过数据整理的方法来发现公司生产和经营活动的异常情况罢了、、、个人认为和或为决策者提供理论支持和现阶段的经济生活发展概况!是不是这样,
老师在这两方面的研究领域是不是新兴的学科 ?而且 个人认为就是一种边缘,交叉学科!
可能是我们的水平还差得很远吧!
请老师指导!!!!
A26:
数据挖掘是一个很杂的领域,确实其中有各个方向的研究和应用,而且需要结合具体问题case by case地分析。统计学在里面是一个很主要的组成部分。在分析与会计财务相关的数据时,会计学当然有用;在分析基因数据中,会计学就未必有用了。
Q27:坛友legionnaire:
蒙特卡罗方法是项目管理中风险管理的重要工具,但在项目管理的实践中却用的非常少。张教授能否介绍一下蒙特卡罗方法在国外项目管理中的应用,以及能否介绍几本比较新的书籍?谢谢。
A27:
蒙特卡洛方法是从指定概率分布中抽样的一系列统计模拟方法,包括MCMC(马科夫链蒙特卡洛)、SMC(序贯蒙特卡洛)等。针对不同的统计模型,蒙特卡洛方法的具体步骤也不同。这还是要看具体问题,抱歉我对这个领域的具体问题不太清楚。
Q28:坛友SJYbluesky:
请问:蒙特卡洛模拟如何在贝叶斯分析中应用?还有在Metropolis抽样中,如何确定转移概率矩阵,接受概率α(x,y)?谢谢!
A28:
蒙特卡洛方法是从指定概率分布中抽样的一系列统计模拟方法,包括MCMC(马科夫链蒙特卡洛)、SMC(序贯蒙特卡洛)等。针对不同的统计模型,蒙特卡洛方法的具体步骤也不同。在贝叶斯分析中,MCMC算法是最主要的方法,正是MCMC算法的发展推动了贝叶斯分析的迅速发展和应用。关于Metropolis Hastings算法的具体问题,你可以参看Jun Liu教授写的《Monte Carlo Strategies in Scientific Computing》中相应的章节。英文书籍后边都有索引,你可以根据索引找到相应的页。
Q29:坛友vistro:
老师,您好。有个问题真心想请教您。现在的计量软件众多,R软件,eviews,winrats ,stata 等等,我明白哪一个学好都很厉害,但是就您所接触的领域,更倾向于哪一个呢?或者在易用性和扩展性上,您更推荐哪一个呢? 谢谢您了!
A29:
软件不是关键,重要的是对于方法的掌握,对分析结果的解释,等等。再自己挑选一个合适的软件。
Q30:坛友tangaibing:
我是一名理工专业的学生,记得我们在大学做实验时,实验记过与相应的数据结论不相对应,所以我们只有对数据进行篡改,或者叫修正,文科知识的调查与理论的差距更大,你在做研究时是否做数据修正?你对马克思政治经济学数理化有何看法?现在国内很多一流经济学院正在忙于此事,你认为这有必要?简单的思想转化为抽象的经济理论合适吗?
A30:
我们在研究中不修改数据,除非数据缺失记录有误。如果数据记录无误,也有可能是异常值,这是就要根据具体问题看如何处理异常值了。
Q31:坛友vincenhe:
张老师您好,学生也对数据挖掘与MCMC十分有兴趣。
1. 很多数据挖掘的方法,由于它算法本身隐藏性,很多应用类的文章(特别是非统计类的期刊应用新的数据挖掘方法那种)都会说这些方法是非参数的,也不需要分布的假设,例如对称之类的,甚至很多认为很怪异的分布也可以应用。但仔细看了算法后,发现很多软件在这些模型的实现时很多时候是最优化MSE的,直觉上认为这些模型也需要满足一定的假设。
问题却来了,这些模型算法本身的隐含性令我们不太清楚它具体需要什么假设,有些更是模型本身不需要,但在某些软件算法的实现上为了计算量方便,选了一些近似(几乎都是如此),所以也加上了更多的假设。而这些模型本身没有什么诊断的工具去验证这些假设。
而一般大家普遍用testing set做MSE来计量,而大多这些模型又比简单的MSE更小,但却不清楚他们的假设是否成立。
请问老师有何看法呢?
2. 最近在做一些时间序列方面的数据,很多数据挖掘的模型boosting啊,random forest啊以前都觉得很准确,却不知道时候能用在时间序列里,毕竟时间序列本身自相关,而这些模型在时间序列方面的研究也不多。请问老师有什么好的推荐,用什么数据挖掘的模型对时间序列比较好呢?好让我有点方向。
3. MCMC可以相对自由地构造我们自己需要的函数的估计,这个很好。
但在PC上做时还是效率不高,听说现在有些新的方向可以提高MCMC的效率,例如PMCMC等的,还有设么的,请老师做做相关的介绍。
谢谢老师
A31:
1、非参数的方法对分布的假设相比于参数模型来说更少,但参数估计的收敛速度更慢,在实际应用中非参数方法的估计/预测效果未必比参数模型好。“简单的MSE”,你是指没有模型而用数据均值估计所有数据点所得到的MSE吗?通常情况下,有模型都会更好一些。除了用testing set之外,还可使用cross validation等方法。
2、时间序列方面的数据我分析得比较少,我觉得ARIMA模型对很多时间序列的分析就不错,贝叶斯时间序列模型中dynamic linear model(M. West and J. Harrison的书《Bayesian Forecasting and Dynamic Models》)很好。
3、研究者们不停地在尝试改进MCMC算法的效率。Jun Liu教授写的《Monte Carlo Strategies in Scientific Computing》中就有很多可以改进效率的方法。近年来Variational Bayes另辟路径,不使用MCMC,而使用近似的方法对贝叶斯模型进行推断,时间上花费更少,但估计有偏。
Q32:坛友eting2000:
张老师:
您好!感谢您百忙之中抽出宝贵时间为我们解答问题,我的问题是:在企业中做各种数据的收集,比如各种调研、访谈材料的编码统计,在操作过程中用什么样的软件比较方便呢?现在我们还是用传统的EXCEL做简单的分析,稍微复杂一点的就是用SPSS,请问还有什么样好的软件可以在企业中使用吗?谢谢!
A32:
SAS、R、matlab、SPSS等都可以。如果做简单的分析,minitab是个比较容易掌握的软件。
Q33:坛友liuchao449:
能不能推荐一本高级概率论的书籍?
A33:
Rick Durrett <Probability: Theory and Examples>。