全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
826 0
2020-12-04
在数据科学课程中增加计划评估
我们尝试做XYZ。有什么不同吗?”
无论您是处于营利性世界还是非营利性世界,这都是许多人试图回答的非常基本的问题。  
您可能正在一家银行工作,试图找出最能吸引客户的优惠;在一家在线零售商处,找出哪个广告展示获得的点击次数最多;在教育部,您可能正在尝试测试小班授课的效果。市ZF办公室试图查看新的自行车道计划是否真的更安全,在一家在线媒体提供商(Netflix,Youtube,Spotify等)上,试图找到提出建议的最佳算法,一家制药公司正在进行一项临床试验,以比较与竞争对手相比,他们的药物疗效如何,一家制药公司希望了解其新发布的药物是否对现实世界产生了重大影响……
所有这些示例都有一些共同点。  
无论是新算法,不同的广告展示,新的自行车道,较小的班级规模还是测试新的药物治疗方法,都进行了更改。这些都是程序的示例。  
希望确定此更改是否对感兴趣??的结果产生了影响,即该结果是销售量增加,道路安全,受过良好教育的学生还是治愈了更多的患者。这些都是计划评估的例子,其目的不仅是要找出感兴趣的结果是否发生了变化,而且要说出该计划造成了差异。作为此计划评估的一部分,我们想知道变化的方向(它使情况变得更好还是更坏?,变化的幅度,在某些情况下,变化是否具有统计学意义。  
经济学家和评估专家(具有监测和评估学位的人)研究了许多进行计划评估的技术,包括随机实验以及准实验方法,例如倾向评分法,仪器变量,中断时间序列,回归不连续性,Heckman's 2-Stage模型...
大多数数据科学家都可以像没有明天一样进行A / B测试。它是数据科学家工具包的标准部分。成功完成后,A / B测试将创建一个随机分配,以使两组A和B平均而言在所有可观察和不可观察特征上非常相似。然后,程序评估仅包含检查随机化的质量(是的,很多人都跳过了这一步,但是不应跳过),然后将A组与B组的结果进行比较。这就像临床试验的方式一样是为药物设计和实施的。
但是,如果随机化失败了怎么办?如果组别不同怎么办?如果同时进行其他实验会影响分配该怎么办?
如果无法随机化怎么办?
在这种情况下,计划评估工具箱对于确定计划是否对感兴趣??的结果产生了影响至关重要,无论是更高的点击率,增加的销售,更安全的道路,更有效的药物还是更好的教育。  
数据科学家所需的技能已经包括了很长的清单。知道我们不能将无限数量的必需技能添加到“数据科学家工具箱”中,您如何看待计划评估的基础课程?计划评估方面的一些培训对完善数据科学家培训是否有帮助?
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群