推荐一个Susan Athey的关于机器学习的视频
Susan Athey是斯坦福大学机器学习和经济学的大牛人,得过克拉克奖(这个奖预示她有可能得诺贝尔奖)。演讲的主要内容是她对机器学习在现实中的应用,尤其是对ZF服务方面的影响。但最让我感兴趣的是她提到机器学习与歧视的关系 (见一个econ talk的访谈:http://www.econtalk.org/archives/2016/10/cathy_oneil_on_1.html)。例如,我们如果用机器学习的方法来筛选求职面试的人员,是否会造成歧视(例如性别歧视)。她给了一个有趣的回答。如果我们看斯坦福大学的经济学教授,女教授的平均水平或许比男教授高,因为能克服歧视而成功的女人是女强人,也因为老而不发文章的教授中女教授很少。但我想更重要的是,如果是通过一个程序来筛选候选人,那么我们是可以明确控制性别比例的。这无非就是在最有化的过程中加一个约束。进一步讲,我们可以尝试新的样本和训练数据。例如,假设现有的训练数据中没有女性。我们可以逐步加入女性面试人员,并观察她们的工作表现,从而更改程序。只要我们意识到训练样本的局限性,和程序的局限性,这个问题是可以解决的。对机械学习而言,真正难的是预测结构变化之后的结果。假设你只有因特网发明之前的数据,你能否预测因特网发明之后,政策变量之间的关系。我想这是很难的。Athey有这方面的论文,是通过结构性模型来做的。应该值得一读。
另一个让我很感兴趣的是她提到一个模型的可解释性和预测能力之间的关心。例如KNN或者是SVM可以帮助你通过几个因素选择最有利可图的股票,但是不能告诉你这些因素是如何影响股市价格的。Athey目前的工作中想把可解释性和预测能力结合起来。我听过她一个讲座是用树模型来做因果推理。在政策应用中,可解释性很重要。例如,一个人申请假释,机器学习可以给出是否应该给他假释的判断,但囚犯有权问为什么他的假释请求被拒绝。这个时候最佳的预测就不是唯一的考虑了。Athey的意思是我们可以牺牲少量的预测性来换取可解释性。或者可以先选出预测性最好的模型,然后选出预测性相近,但可解释性很好的模型。这方面,树模型确实有直观性的优势。
我刚刚发了一个视频地址,但是我自己点击了下,链接不是很好用。还是请自行搜索演讲标题如下:
Artificial Intelligence: The Economic and Policy Implications - Keynote by Susan Athey