全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1646 41
2022-04-26
英文标题:
《Binary Classification Tests, Imperfect Standards, and Ambiguous
  Information》
---
作者:
Gabriel Ziegler
---
最新提交年份:
2021
---
英文摘要:
  New binary classification tests are often evaluated relative to a pre-established test. For example, rapid Antigen tests for the detection of SARS-CoV-2 are assessed relative to more established PCR tests. In this paper, I argue that the new test can be described as producing ambiguous information when the pre-established is imperfect. This allows for a phenomenon called dilation -- an extreme form of non-informativeness. As an example, I present hypothetical test data satisfying the WHO\'s minimum quality requirement for rapid Antigen tests which leads to dilation. The ambiguity in the information arises from a missing data problem due to imperfection of the established test: the joint distribution of true infection and test results is not observed. Using results from Copula theory, I construct the (usually non-singleton) set of all these possible joint distributions, which allows me to assess the new test\'s informativeness. This analysis leads to a simple sufficient condition to make sure that a new test is not a dilation. I illustrate my approach with applications to data from three COVID-19 related tests. Two rapid Antigen tests satisfy my sufficient condition easily and are therefore informative. However, less accurate procedures, like chest CT scans, may exhibit dilation.
---
中文摘要:
新的二元分类测试通常相对于预先建立的测试进行评估。例如,用于检测SARS-CoV-2的快速抗原试验是相对于更成熟的PCR试验进行评估的。在本文中,我认为新的测试可以被描述为当预先建立的测试不完美时产生模糊信息。这就产生了一种叫做膨胀的现象——一种非信息性的极端形式。作为一个例子,我给出了满足世卫组织快速抗原检测最低质量要求的假设检测数据,这将导致扩张。信息的模糊性源于由于已建立的测试不完善而导致的数据缺失问题:未观察到真实感染和测试结果的联合分布。利用Copula理论的结果,我构造了所有这些可能的联合分布的集合(通常是非单态的),这允许我评估新测试的信息性。该分析得出了一个简单的充分条件,以确保新测试不是一个膨胀。我用三个2019冠状病毒疾病相关测试的数据来说明我的方法。两种快速抗原检测很容易满足我的充分条件,因此信息丰富。然而,不太准确的程序,如胸部CT扫描,可能会出现扩张。
---
分类信息:

一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-4-26 15:10:47
二元分类测试、不完善的标准和不明确的信息*Gabriel Ziegler+2021年1月21日摘要新的二元分类测试通常相对于预先确定的测试进行评估。例如,用于检测SARS-CoV-2的快速抗原试验相对于更成熟的PCR试验进行评估。在本文中,我认为新的测试可以被描述为在预先建立的测试不完善时产生模糊信息。这就产生了一种称为膨胀的现象——一种非信息性的极端形式。作为一个例子,我给出了满足WHO对快速抗原检测的最低质量要求的假设检测数据,因为ich会导致扩张。由于现有检测的不完善,信息中的歧义源于数据缺失问题:未观察到真实感染和检测结果的联合分布。利用Copula理论的结果,我构建了所有这些可能的联合分布的集合(通常是非单态的),这使我能够评估新测试的信息性。这种分析导致了一个简单有效的条件,以确保一个新的测试不是一个膨胀。我用三项新冠肺炎相关测试的数据来说明我的方法。两种快速抗原检测很容易满足我的要求,因此信息丰富。然而,不太准确的程序,如胸部CT扫描,可能会出现扩张。关键词:二元检验、歧义、信息、扩张、SARS-CoV-2、2019冠状病毒疾病*感谢Dan Sacks、Charles Manski和J¨org Stoye的文学指点。我感谢菲利波布拉多维奇的宝贵评论。克里斯托弗·斯塔彭赫斯特提供了出色的研究协助。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 15:10:54
所有的错误都是我的。+爱丁堡大学经济学院;英国爱丁堡Buccleuch Place 31号,EH89JT;ziegler@ed.ac.uk.1引言评估新诊断测试的一个重要方面是评估其准确性。直觉上,一个合理的二元测试应该有与潜在健康状况高度相关的测试结果。在其他情况下,检测结果可能呈阳性,只有被检测者确实感染或患病。然而,确定一个人是否真的被感染往往代价高昂,甚至是不可能的。因此,相对于已建立的测试,分析新的测试。当且仅当患者确实被感染时,当检测结果呈阳性时,已建立的检测才是完美的。医学文献将这些完美的测试称为“黄金标准”(Watson等人,2020年)。在这些情况下,新测试结果和潜在真实健康状况的联合分布与两项测试结果的联合分布相同。因此,这种观察到的联合分布可以用来评估新测试的准确性。然而,在实践中,并不存在完美的参考测试。在这种情况下,研究人员需要两种测试的健康状况和结果的联合分布。这种整体联合分布是不可观察的(或者只有在研究人员获取数据的成本很高的情况下才可能)。这种缺失数据的问题导致了两个截然不同的问题:(i)基本健康状况的边际分布缺失;(ii)新测试的soutcome与健康状况之间的相关性缺失。这些问题中的后一个会导致新测试提供的信息模棱两可。这些问题中的第一个是关于潜在健康状况的缺失数据,这是众所周知的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 15:11:00
最近,Manski和Molinari(2021年)使用部分识别文献中已知的方法,提供了人群中感染者的患病率范围。测量患病率不同于通常的推断问题,因为受试人群可能无法代表整个人群。这里有选择性地观察数据,这与Manski(1989)提出的选择问题相对应。此外,Manski(2020)阐述了在2019冠状病毒疾病抗体检测的背景下,如何在保持完美参考检测假设的情况下,将此问题延伸至评估新检测的准确性。在下文中,我不会区分感染和生病。根据问题的不同,可能需要考虑新测试源代码的联合分布和潜在的真实健康状况。例如,分析小节2.2只要求这种二元联合分布。如第2.3节所述,需要三变量分布来评估进行这两项测试的信息量。在导言中,我使用了“相关性”这个词,这是一个松散而非正式的词。Toye(2020年)和Sacks等人(2020年)也使用了类似的方法。2导言第二个关于相关性的缺失数据的问题在性质上是不同的,当有一个完美的参考时可以避免。即使人们假设对患病率的了解,潜在的多个“相关结构”也与观察到的数据一致。这种多重性的原因在概率论研究的copulas中是众所周知的。患病率知识提供了健康状况的边际分布,而观察到的测试数据提供了(无变量)边际分布。一般来说,这些边际分布存在多个(三变量)联合分布。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 15:11:06
由于这种多样性,不可能对新测试进行简单、明确的解释。在不了解患病率的情况下,之前发现的问题会继续存在,因此会加剧总体多样性。然而,正如后面更详细地讨论的那样,含糊不清的信息只来源于缺少的相关数据,因此无论研究人员是否了解患病率,都会发生。在本文中,我提供了一个理论框架,将Manski和Molinari(2021年)和Stoye(2020年)关于选择性测试的见解与由于不完善的参考测试而产生的缺失相关数据结合起来。在这个框架内,可以解决两种测试的信息性问题。首先,命题1表明,已建立的测试的阴性预测值通常不是由一个数字给出的,但它总是有用的。这种多样性的出现仅仅是因为问题(i)。然后,我只对测试人群分析了新测试的信息量。对受试人群的关注简化了代数,并进一步消除了关于患病率的模糊性(参见问题(i)),因此,我可以研究新分离测试(仅问题(ii))中模糊信息的本质。最后,我研究了如果存在影响,对信息性的影响。研究考试的信息性在概率论、统计学、经济学和哲学中有着悠久的传统。Blackwell(1951、1953)为(现在称为Blackwell)实验引入了“更多信息”的概念。经验检验是从世界各国到信号分布的映射。在当前设置中,实验是一个函数,它将分布的检测结果与每个可能的健康状况相关联,即感染和健康状况。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 15:11:12
在这种情况下,信息的价值取决于贝叶斯决策者愿意为实验支付多少费用。因为everyA测试的阴性预测值是在获得阴性测试结果的条件下健康的概率。另一个重要的信息量指标是阳性预测值,即在阳性检测结果的条件下被感染的概率。我将自始至终假设,所建立的模型具有与SARS-CoV-2检测一致的完美预测值。de Oliveira(2018)提供了一种更有效的治疗方法。Blackwell的理论表明,对于每一个Bayesian决策者来说,实验比没有信息的实验更能提供信息。理想情况下,诊断测试应满足Blackwell对实验的定义,以确保其始终具有信息性。然而,这通常只适用于我的框架中已建立的测试。新的测试未能成为Blackwell实验,因为它没有将每个状态映射到测试结果的唯一分布。相反,由于联合分布的多样性,在特定健康条件下,测试结果上存在一组分布。因此,Blackwell的信息性概念不适用于新测试。此外,信息的价值需要调整,因为aBayesian分析不容易应用于概率集。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群