建立COVID-19漏洞指数
由于COVID-19如今占据了我们的大多数思想,因此似乎有必要强调AI / ML在哪些方面做出了贡献,使我们离开家园并重新开始工作。在过去的几周中,我发现只有三处提及。
肺部CT扫描的图像分析
阿里巴巴集团的研究与创新机构DAMO学院使用CT扫描对患有呼吸窘迫的住院患者的肺部进行了图像分析,以将疾病分类为COVID-19或其他类型的流感(通常是流感引起的肺炎)。最终的准确性为96%。
不幸的是,这些候选人已经处于疾病的晚期,而且CT扫描价格昂贵,而且并非所有人都能使用。在AI / ML规模上,这是一场胜利,但没有一个可能会加快解决我们更大的社会和医疗问题的速度。
在测试之前预测最容易受到攻击的
COVID-19太新了,以至于根本没有太多实际数据需要分析。我们认为,从轶事数据中看到的是,某些人口子集的严重性是其他人的6倍至10倍。一周前,我们认为这只是老年人,但最近我们得知,一些千禧一代的风险也很高。考虑到测试套件的短缺以及某些早期套件的误报率会导致从查看测试数据中得出偏差的样本,因此建模问题非常重要。
但是有一个亮点。在过去的一周中,两个不同的小组声称已开发出相当简单的预测模型,可以在测试个人需要住院治疗的可能性之前确定。
3月19日,《华尔街日报》刊登了一篇有关 Persivia Inc.(马萨诸塞州马尔伯勒市的软件公司)的简短文章,推出了AI / ML模型,该模型可以预测哪些患者在接受测试之前可能患有COVID-19。该模型已集成到Persivia的现有医疗平台CareSpace中。
它使用来自患者健康记录的结构化和非结构化NLP数据来识别最有可能患有COVID-19的患者,即使在入院筛查过程中以及测试之前没有某些明显症状时也是如此。没有透露有关模型本身的其他细节。
所有这些使论文于3月16日上载到arXiv.org变得更加有趣:“ 建立COVID-19漏洞指数 ”,因为作者详细地揭示了它们的功能和模型构建方法。作者都是ClosedLoop.ai的所有成员,后者与Persivia一样,为医院和其他提供商提供了基于AI的医疗保健平台。
两组都基于这样的假设:对于COVID-19和其他疾病源(例如流感),确定住院的高风险人群和潜在的呼吸系统并发症可能相似。武汉的经验“ 表明死亡的风险随着年龄的增长而增加,而患有糖尿病,疾病,血液凝结问题或表现出败血症迹象的人的死亡风险也更高 ”。
尽管不再将年龄视为唯一的识别因素,但某些潜在疾病(如心脏病或以上所列疾病)的病史却高度相关,可以使用CCSR标准代码在受试者的医疗记录中看到。不幸的是,对先前的疾病或入院进行简单检查并不能很好地预测病情。
“超过55%的Medicare受益人符合CDC列出的至少一项风险标准。患有相同慢性病的人没有相同的风险,简单的规则可能无法捕捉到脆弱等复杂因素,从而使人们更容易受到严重感染。”
ClosedLoop作者缺乏用于识别COVID-19患者的大规模数据,因此使用了一组替代目标,这些目标是针对“ 呼吸道感染(例如肺炎,流感)引起的严重并发症的近期风险 ”而选择的。具体而言,从临床分类软件优化(CCSR)分类系统中选择了4种诊断:
RSP002-肺炎(由结核病引起的除外)
RSP003-流感
RSP005-急性支气管炎
RSP006-其他指定的上呼吸道感染”
从这里开始,建模过程是一个非常简单的过程,用于获取匿名医疗数据库,从而产生了大约190万名受试者的培训和测试集。他们定义了559个功能,其中约37个被证明具有特别的预测性。
然而,使ClosedLoop努力与众不同的是,尽管他们最终使用XGBoost构建了高精度模型,但他们还希望提供一种模型,供那些无需使用复杂的AI / ML平台或知识的人使用。
为了实现该目标,他们构建了一个简单的线性回归模型,该模型具有大大简化的输入功能,任何有权使用Excel的用户都可以直接实现。树模型和回归模型都是github上的开源代码,以及最初考虑的所有559个功能的列表。两者的结果在准确性方面都非常有用。
型号ROC AUC
逻辑回归。731
XGBoost诊断历史+年龄。810
由于回归模型易于解释,因此这里有25个打分功能。
我们希望在接下来的几周内有更多的示例,其中AI / ML可以帮助解决这种特殊情况。同时,要安全,洗手并保持社交距离。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!