二元分类测试、不完善的标准和模棱两可的

2022-4-26 15:10:47

二元分类测试、不完善的标准和不明确的信息*Gabriel Ziegler+2021年1月21日摘要新的二元分类测试通常相对于预先确定的测试进行评估。例如，用于检测SARS-CoV-2的快速抗原试验相对于更成熟的PCR试验进行评估。在本文中，我认为新的测试可以被描述为在预先建立的测试不完善时产生模糊信息。这就产生了一种称为膨胀的现象——一种非信息性的极端形式。作为一个例子，我给出了满足WHO对快速抗原检测的最低质量要求的假设检测数据，因为ich会导致扩张。由于现有检测的不完善，信息中的歧义源于数据缺失问题：未观察到真实感染和检测结果的联合分布。利用Copula理论的结果，我构建了所有这些可能的联合分布的集合（通常是非单态的），这使我能够评估新测试的信息性。这种分析导致了一个简单有效的条件，以确保一个新的测试不是一个膨胀。我用三项新冠肺炎相关测试的数据来说明我的方法。两种快速抗原检测很容易满足我的要求，因此信息丰富。然而，不太准确的程序，如胸部CT扫描，可能会出现扩张。关键词：二元检验、歧义、信息、扩张、SARS-CoV-2、2019冠状病毒疾病*感谢Dan Sacks、Charles Manski和J¨org Stoye的文学指点。我感谢菲利波布拉多维奇的宝贵评论。克里斯托弗·斯塔彭赫斯特提供了出色的研究协助。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-4-26 15:10:54

所有的错误都是我的。+爱丁堡大学经济学院；英国爱丁堡Buccleuch Place 31号，EH89JT；ziegler@ed.ac.uk.1引言评估新诊断测试的一个重要方面是评估其准确性。直觉上，一个合理的二元测试应该有与潜在健康状况高度相关的测试结果。在其他情况下，检测结果可能呈阳性，只有被检测者确实感染或患病。然而，确定一个人是否真的被感染往往代价高昂，甚至是不可能的。因此，相对于已建立的测试，分析新的测试。当且仅当患者确实被感染时，当检测结果呈阳性时，已建立的检测才是完美的。医学文献将这些完美的测试称为“黄金标准”（Watson等人，2020年）。在这些情况下，新测试结果和潜在真实健康状况的联合分布与两项测试结果的联合分布相同。因此，这种观察到的联合分布可以用来评估新测试的准确性。然而，在实践中，并不存在完美的参考测试。在这种情况下，研究人员需要两种测试的健康状况和结果的联合分布。这种整体联合分布是不可观察的（或者只有在研究人员获取数据的成本很高的情况下才可能）。这种缺失数据的问题导致了两个截然不同的问题：（i）基本健康状况的边际分布缺失；（ii）新测试的soutcome与健康状况之间的相关性缺失。这些问题中的后一个会导致新测试提供的信息模棱两可。这些问题中的第一个是关于潜在健康状况的缺失数据，这是众所周知的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:11:00

最近，Manski和Molinari（2021年）使用部分识别文献中已知的方法，提供了人群中感染者的患病率范围。测量患病率不同于通常的推断问题，因为受试人群可能无法代表整个人群。这里有选择性地观察数据，这与Manski（1989）提出的选择问题相对应。此外，Manski（2020）阐述了在2019冠状病毒疾病抗体检测的背景下，如何在保持完美参考检测假设的情况下，将此问题延伸至评估新检测的准确性。在下文中，我不会区分感染和生病。根据问题的不同，可能需要考虑新测试源代码的联合分布和潜在的真实健康状况。例如，分析小节2.2只要求这种二元联合分布。如第2.3节所述，需要三变量分布来评估进行这两项测试的信息量。在导言中，我使用了“相关性”这个词，这是一个松散而非正式的词。Toye（2020年）和Sacks等人（2020年）也使用了类似的方法。2导言第二个关于相关性的缺失数据的问题在性质上是不同的，当有一个完美的参考时可以避免。即使人们假设对患病率的了解，潜在的多个“相关结构”也与观察到的数据一致。这种多重性的原因在概率论研究的copulas中是众所周知的。患病率知识提供了健康状况的边际分布，而观察到的测试数据提供了（无变量）边际分布。一般来说，这些边际分布存在多个（三变量）联合分布。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:11:06

由于这种多样性，不可能对新测试进行简单、明确的解释。在不了解患病率的情况下，之前发现的问题会继续存在，因此会加剧总体多样性。然而，正如后面更详细地讨论的那样，含糊不清的信息只来源于缺少的相关数据，因此无论研究人员是否了解患病率，都会发生。在本文中，我提供了一个理论框架，将Manski和Molinari（2021年）和Stoye（2020年）关于选择性测试的见解与由于不完善的参考测试而产生的缺失相关数据结合起来。在这个框架内，可以解决两种测试的信息性问题。首先，命题1表明，已建立的测试的阴性预测值通常不是由一个数字给出的，但它总是有用的。这种多样性的出现仅仅是因为问题（i）。然后，我只对测试人群分析了新测试的信息量。对受试人群的关注简化了代数，并进一步消除了关于患病率的模糊性（参见问题（i）），因此，我可以研究新分离测试（仅问题（ii））中模糊信息的本质。最后，我研究了如果存在影响，对信息性的影响。研究考试的信息性在概率论、统计学、经济学和哲学中有着悠久的传统。Blackwell（1951、1953）为（现在称为Blackwell）实验引入了“更多信息”的概念。经验检验是从世界各国到信号分布的映射。在当前设置中，实验是一个函数，它将分布的检测结果与每个可能的健康状况相关联，即感染和健康状况。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:11:12

在这种情况下，信息的价值取决于贝叶斯决策者愿意为实验支付多少费用。因为everyA测试的阴性预测值是在获得阴性测试结果的条件下健康的概率。另一个重要的信息量指标是阳性预测值，即在阳性检测结果的条件下被感染的概率。我将自始至终假设，所建立的模型具有与SARS-CoV-2检测一致的完美预测值。de Oliveira（2018）提供了一种更有效的治疗方法。Blackwell的理论表明，对于每一个Bayesian决策者来说，实验比没有信息的实验更能提供信息。理想情况下，诊断测试应满足Blackwell对实验的定义，以确保其始终具有信息性。然而，这通常只适用于我的框架中已建立的测试。新的测试未能成为Blackwell实验，因为它没有将每个状态映射到测试结果的唯一分布。相反，由于联合分布的多样性，在特定健康条件下，测试结果上存在一组分布。因此，Blackwell的信息性概念不适用于新测试。此外，信息的价值需要调整，因为aBayesian分析不容易应用于概率集。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

2022-4-26 15:11:19

这种情况通常被称为“模糊”情况，文献已经确定了贝叶斯决策在模糊领域的若干扩展。在某种情况下，我没有为特定的决策标准定义信息的价值，而是采用了一个非常弱的信息性概念：诊断性睾丸信息性当且仅当它不是扩张时。Seidenfeld和Wasserman（1993）在概率集合的情况下引入了膨胀的表示法。在当前上下文中，如果无论得到什么测试结果，以该信息为条件的一组概率包含原始概率集，就会发生膨胀。图1展示了一个膨胀的例子。这里，表示检测前感染可能性的概率集（bla ck集合）位于检测结果后的两个集合内（蓝色表示阳性结果，红色表示阴性结果后的集合）。因此，从某种意义上说，无论测试结果如何，决策者在测试后的表现都比测试前差。因此，Seidenfeld和Wasserman将扩张称为“违反直觉的现象”，Gul a和Pesendorfer（2018）将其称为“所有新闻都是坏消息”。我的框架允许充分描述何时需要进行新的诊断测试（参见表达式（3））。由于对测试信息性的定义较弱，任何合理的测试都应满足这一标准。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:11:25

表征提供了一种方法来验证新测试是否具有信息性。如果上面提到的映射是一个常数函数，那么实验是没有信息的？Blackwell更强调他的“信息量更大”的概念，要求每个贝叶斯决策者在信息量更大的实验中都有更高的信息价值。从形式上讲，新的测试可以看作是一个对应的或设定值的d函数。Machina和Sinisc alchi（2014）提供了关于该主题的最新概述。4简介试验前P（已感染）试验后P（已感染）阳性试验结果阴性试验结果图1：诊断试验如表1：扩张试验Da t az\\y y=0 y=1 Sumz=0 39.5%11.5%51%z=1 1 1.2%47.8%49%Sum 40.7%59.3%y=1表示阳性PCR试验结果（即已建立的试验）。z=1表示抗原检测呈阳性。WHO（2020年）建议对rapidAntigen试验的最低准确度标准。通常情况下，PCR测试是用于评估t-heseAntigen测试的既定测试（Esbin等人，2020年）。表1说明了假设的测试数据，满足世卫组织的最低要求。然而，正如分析将揭示的那样，这项测试实际上是一种扩张，因此没有提供信息。对于最低要求的精度标准，膨胀特性提供了一个易于验证的有效条件，以避免膨胀。这项新测试（在受尊敬的人群中）对新测试呈阳性的人群进行了介绍≤新试验的最小灵敏度×已建立试验的灵敏度。对于消息灵通的读者，世卫组织建议敏感性至少为80%，特异性至少为97%。这些措施将在稍后正式引入和定义。该声明取决于已建立的PCR检测的准确性。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-4-26 15:11:31

只有当PCR在文献未提及的较低范围内具有敏感性时，才会发生扩张。除了膨胀的理论应用，文献中还没有太多的经验证据。最近，经济学家开始通过实验研究膨胀和模糊信息。Shishkin和Ortoleva（2020）进行了唯一一项实验，重点研究决策者对膨胀的反应，以及如何将行为与信息的价值联系起来。据我所知，诊断试验（或更具体的SARS-CoV-2试验）可能出现的扩张是“在现场”首次观察到的这种现象当然，研究诊断测试的研究人员很清楚这里讨论的一般问题。导致未观察到的患病率的选择问题被称为验证偏差，而由不完善的参考测试导致的未观察到的相关性所引起的问题被描述为不完善的金标准偏差。（Zhou等人，2014年，第10-11章）本文不是第一次记录这些问题中的任何一个导致未识别模型；而本文的新颖之处在于方法。诊断测试研究试图通过引入额外假设来避免未识别的模型，然后解决相对于基线假设产生的偏差。建议的方法包括简单地插补缺失数据或考虑更复杂的校正方法。此外，这两个问题往往是分开解决的。相比之下，我的框架需要最少的假设，同时解决这两个问题。2主要分析我考虑以下情况。x=1表示一个人被感染，x=0表示该人健康。最初，有二元测试可用，其中y=1表示阳性测试结果，y=0表示阴性结果。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-4-26 15:11:37

最后，介绍了一种新的检测方法，它可以是阳性（z=1）或阴性（z=0）。设P（x，y，z）表示考虑中的人口分布，P:=P（x=1）表示患病率。然而，人口分布是无法直接观察到的。当然，几乎总是这样，因为研究人员通常只观察人口分布中的样本。这就导致了通常的引用问题。自始至终，我将完全从推理中抽象出来。取而代之的是，这些数据是为那些在newManski（2018年）报告中提到扩张可能在不同的医学背景下发生的人提供的，但没有进一步解决这个问题。Reitsma等人（2009年）为应用研究人员提供了一个流程图，以帮助他们解决在确定诊断测试准确性时出现的几个问题。这两个问题分别存在于流程图的两个不同分支中。6.主要分析测试。因此，表示t=1和t=0的受试者，否则。然后，数据由P（y，z | t=1）给出，我假设P（t=1）>0.15,16此外，由于已建立的测试是众所周知的，关于该测试的灵敏度和特异性的精确信息也可用。以下假设确保了这两个指标都得到了很好的定义。假设1（非平凡患病率）。人口满意度∈ (0, 1).根据该假设，初始测试的敏感性和特异性分别定义为：P（y=1 | x=1）=P（x=1，y=1）P=：σ，（1）P（y=0 | x=0）=P（x=0，y=0）1- p、（2）正如inManski（2020）所讨论的，f对于决策敏感性和特殊性不是相关措施。相关指标为阳性预测值（PPV）和阴性预测值（NPV）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:11:43

对于已建立的测试，如果普适性和P（y=1）已知，则可以通过贝叶斯规则从特定性和敏感性获得这些测量值：PPVy:=P（x=1 | y=1）=pP（y=1 | x=1）=pP（y=1）σNPVy:=P（x=0 | y=0）=1- pP（y=0）P（y=0 | x=0）。由于受试者通常不能代表整个人群，即使对于已建立的测试，这两个指标也没有点识别（Manski和Molinari，2021；Manski，2020；Stoye，2020），为了简化分析并符合SARS-CoV-2测试的应用，我还考虑了以下三个基线假设。假设2（已建立的测试没有假阳性）。人口满意度（x=0，y=1）=0。此外，（未）被测试的以下逻辑含义成立：（i）t=0==>z=0和（ii）z=1==> t=1。请注意，即使未经测试，y=1也是可能的，因为参与工具只涉及新的测试。等效地，数据由新试验相对于已建立试验的灵敏度和特异性以及关于有多少已建立或新试验具有阳性结果的附加信息给出。例如，为了得到有意义的结果，可能会对疑似感染者进行过度采样。假设2意味着已建立的测试达到了1的最大规格和PPVyof。此外，我将假设测试的恶名与曼斯基和莫利纳里（2021）一样，这意味着在接受测试的条件下，被感染的概率比不接受测试的概率更大。假设3（测试单调性）。人口满意度P（x=1 | t=1）≥P（x=1 | t=0）。最后，我假设已建立的测试的敏感性确实取决于潜在的健康状态x，但不取决于该人是否在测试池t=1。假设4（健康支持）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:11:49

人口满意度P（y=1 | x=1，t=1）=P（y=1 | x=1）=σ。为了减少下面繁琐冗长的符号，我将使用这个简化的符号：γ：=P（y=1 | t=1）。已确定的t试验ζ的试验产率：=P（z=1 | t=1）。试验产量f或新试验τ：=P（t=1）。数据代表性的度量。为了避免不重要的情况，假设γ，ζ，τ>0。注意，τ与inManski和Molinari（2021）或Stoye（2020）的解释略有不同。这里，τ=1表示dat a P（y，z | t=1）完全代表了总体人口。特别是，这样的参数值意味着没有对受感染的参与者进行过采样。特别是，即使参与池很小（通常情况下），这并不意味着τ应该接近零。用这种表示法，我们得到了P（z=1）=τζ，因为只有当受试者接受检测时，新检测才呈阳性。此外，假设2与假设4相结合，这是因为P（x=0，y=0）=P（x=0，y=0）+P（x=0，y=1）=P（x=0）=1- pand P（x=1，y=1）=P（x=1，y=1）+P（x=0，y=1）=P（y=1）。如果自愿加入测试池，这可能不是真的。然而，为了确定新测试的准确性，这种假设似乎经常适用。见脚注17。回想一下，新测试获得了测试池。例如，如果为测试池执行既定测试的医务人员不小心，可能会违反这一假设。在这种情况下，已建立的测试可能对测试池更敏感。参见脚注17，了解为什么这样的假设可能有问题。一个小的参与池可能会恶化统计推断问题：假设参与池完全具有代表性，但很小。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:11:57

在这种情况下，τ=1，但推断通常依赖于某种中心极限定理，这在这种情况下并不合适。然而，回想一下，我已经远离了上面提到的推理问题。8.2.1已建立的试验给出了P（x=1 | t=1）=γ/σ。然后，总概率定律和假设3给出了p的尖锐边界∈ [τγ/σ,γ/σ] =:χ, χ因为：=P（x=1）=P（x=1 | t=1）|{z}=γστ+P（x=1 | t=0）|{z}∈[0，γσ]根据假设3（1）- τ).反过来，敏感性σ和假设2:P（y=1）=Pσ暗示了已建立测试总体阳性率的界限∈ [τγ, γ].因为我们考虑了p的非平凡情况∈ （0,1），数据与保持的假设的一致性要求建立的测试对besu效率高的敏感性，即γ<σ≤ 1.反过来，假设意味着P（y=1）∈ （0,1）。2.1已建立的试验假设2暗示了已建立的试验（PPVy=1）的完美阳性预测值。然而，负面预测值仅部分确定，命题1提供了明确的界限。提议1。在假设1–假设4下，建立ed检验的负预测值急剧有界，如下所示：∈σσ - γ1 - γ,σσ - τγ1 - τγ.证据固定α=P（y=1）∈ [τγ，γ]和定义患病率作为αbyPα（x=1）=α/σ的函数。n nPvy（α）=1- Pα（x=1）1- αP（y=0 | x=0）|{z}=1，假设2=σσ- α1 - α自σ- α ≤ 1.- α代表所有α∈ [τγ，γ]，NP Vy（·）正在减少。因此，NPVy∈[NPVy（γ），NPVy（τγ）]。有了它，就可以分析已建立的测试的信息可靠性。表2总结了观察既定测试结果前后的患病率，这是定义信息性的相关指标（见图1）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:12:03

从形式上讲，已建立的测试是一种扩张，如果每一种可能的普遍性∈ [χ，χ]是P（x=1 | y=1）=ppv的一个可能值，P（x=1 | y=n集的一个界称为sharp，如果该界本身是该集的一个成员。0）=1- NPVy。显然，由于坚持假设，阳性测试结果提供了完美的知识。因此，建立的测试不能是一种扩张。另一方面，否定结果降低了否定结果的普遍条件的上下限，因为τγ≤ γ < σ.此外，任何测试结果的间隔宽度都缩小了两个测试结果的流行条件的可能值集。从这个意义上说，建立的测试不仅是信息性的（即，不是扩展），而且在测试结果为阴性后，还严格缩小了可能的普遍值集的大小。表2：测试前已确定的测试P（x=1 |·）下限上限区间宽度τγσγσγσ（1）的信息性- τ）阳性结果（y=1）10阴性结果（y=0）τγσ1-σ1-τγγσ1-σ1-γγσ1-τ1-τγ1-σ1-γ备注：第二行对应于Ppv，第三行由1给出- NPVy。众所周知，为了应用贝叶斯规则获得NPV，需要了解患病率。由于在大多数应用中，患病率是未知的，一种常见的做法是假设一个给定的患病率水平。例如，美国食品和药物管理局（FDA，2020b）假设PPV和NPV的患病率为5%。如果将这样一个假设（p=χ）加到保持的假设中，那么p（y=1）=χσ，进而p（y=1 | t=0）=χσ-γτ1-τ.这一附加假设允许准确确定已建立测试的NPVas1-χ1-因此P（x=1 | y=0）=χ1-σ1-χσ.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:12:10

因此，这一附加假设不仅排除了关于患病率的模糊性，而且还表明，已建立的测试本身并没有提供模糊的美国信息。在非负性试验结果（参见表2）或NPV（参见命题1）后，在非平凡的患病率区间内反映出的明显模糊性，只是患病率模糊性的一种表现，但并非由于试验本身。当然，这一点必须成立，因为总体生育能力定律在点上成立。检测结果呈阳性是显而易见的。对于负面结果，请注意宽度严格增加当且仅当1- σ > (1 - γ)(1 - τγ），相当于τ（1+γ）>σγ+1≥ 2.导致矛盾。或者，我们可以放弃P（t=1）=τ是精确已知的假设。在这种情况下（并且允许P（y=1 | t=0）∈ [0，γ]与一般情况一样）假定的患病率界限τ。计算表明τ∈h0，χσγi。由于下限始终为τmin=0，我们认为这种情况不太有趣。从技术上讲，已建立的测试是一个Labackwell（1951）的实验，其中灵敏度和特异性可以被视为将（健康）状态映射到信号分布的函数（即测试结果）。正如引言中提到的，这意味着在这些假设条件下，已建立的测试的信息值（弱）为正。10.2.2新的测试2。2.新测试接下来，分析新测试的信息量。首先，我将仅基于测试人群讨论信息性。对于这一亚群体，患病率由χ=γ/σ给出，因此关于患病率的模糊性被减弱。第2.4小节将分析扩展到新测试对总体人口的信息性。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:12:16

对于测试人群，相关的测量值是正预测值（PPV）和负预测值（NPV），但现在它们也取决于被测试：PPVz:=P（x=1 | z=1，t=1）=P（x=1，z=1 | t=1）P（z=1 | t=1）=P（x=1，z=1 | t=1）ζNPVz:=P（x=0 | z=0，t=1）=P（x=0，z=0，t=1）- ζ.为了获得这些度量，需要分布P（x，z | t=1）。对于固定τ，使用Joe（1997）的结果，该结果提供了与数据P（x，y | t=1）兼容的所有可能联合分布P（x，y，z）（参见附录a）。在这种结构中设置τ=1，可以得到可能的分布P（x，y，z | t=1）。最后，P（x，z | t=1）是由边缘化引起的。为了简化代数表达式，有必要区分表3中定义的四种情况。通过确定已建立测试的灵敏度σ，测试数据P（x，y | t=1）立即揭示了测试所属的情况。图2显示了后面考虑的三个试验（StQ、BiN、CT）和三个假设试验（包括表1中的扩张试验）的结果。当σ→ 1，那么除了信息性案例（I）之外的所有案例都不再相关。对于SARS-CoV-2检测抗原测试，世卫组织建议最低规格接近一个。图2中（顶部钻机ht）边界的测试满足该标准。因此，对于大多数应用，要么是证实性的（如果σ<1），要么是信息性的（如果σ<1）≈ 1）将会是更高的。与已建立的测试相比，新测试的PPV可能小于1，并且通常只识别集合。集合识别的原因是没有直接观察到P（x，z | t=1）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:12:22

如上所述，存在与数据一致的多重分布P（x，z | t=1），每个分布导致潜在的不同PPV。命题2为PPV值建立了清晰的识别集。CT、Uni和Anti不满足世卫组织97%最低规格的最低要求。表3：与两个测试有关的案例案例案例名称参数限制（C）P（y=0，z=0 | t=1）≥ max{χ（1）- σ), 1 - χ} 资料性（一）1-χ>P（y=0，z=0 | t=1）≥ χ(1 - σ）非信息性（U）χ（1）- σ） P（y=0，z=0 | t=1）≥ 1.- χ（X）min{χ（1）- σ), 1 - χ} >P（y=0，z=0 | t=1）召回χ=γ/σ是患病率的上限，γ=P（y=1 | t=1）是确定的检验结果。γP（y=0，z=0 | t=1）σ1- σStQDilBiNCTUniAnti（I）（C）（X）（U）图2：用σ=0.75说明我们的情况：Uni是一个对应于均匀分布P（y，z | t=1）=1/4的测试。Anti总是产生与已建立测试P（y=1，z=0 | t=1）=P（y=0，z=1 | t=1）=1/2相反的结果。StQ、BiN和CT是第3章后面研究的真实测试。Dil是表1给出的膨胀试验。提案2（PPV）。在假设1、假设2和假设4中，新测试的阳性预测值为isPPVz∈[P（y=1 | z=1，t=1），1]在（C）情况下，hP（y=1 | z=1，t=1），P（y=1 | z=1，t=1）+χ1-σζiin情况（I）h1-1.-χζ，1在（U）h1情况下-1.-χζ，P（y=1 | z=1，t=1）+χ1-σζiin案例（X）。12 2.2新的测试证明。t=1的条件与τ=1的条件相同。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:12:29

因此，从表20和表21中，我们分别得到：P（x=1，z=1 | t=1）：=P（y=1，z=1 | t=1）+max0，P（y=0，z=1 | t=1）- (1 - χ） |{z}=χ-γ-P（y=0，z=0 | t=1）P（x=1，z=1 | t=1）：=P（y=1，z=1 | t=1）+min{χ，1- P（y=0，z=0 | t=1）}- γ=min{χ，1- P（y=0，z=0 | t=1）}- P（y=1，z=0 | t=1）=minχ - P（y=1，z=0 | t=1）|{z}=χ-γ+P（y=1，z=1 | t=1），ζ.现在，请注意- γ = χ(1 - σ）除以ζ得到PPV。为了避免部分确定的预测值，新测试的这些测量通常被报告为参考测试是完美的。在这种情况下，仅数据P（y，z）就提供了一个独特的预测值：推论1（完美黄金标准-PPV）。假设假设1、假设2和假设4成立。如果σ=1，即已建立的测试具有完美的灵敏度，那么Pvz=P（y=1 | z=1，t=1）。证据如果σ=1，那么χ=γ=P（y=1 | t=1）。因此，相关案例为（I）。因此，下界是P（y=1 | z=1，t=1），上界是isP（y=1 | z=1，t=1）+γζ1- σ∑|{z}=0。我们之前看到，已建立的测试总是达到一个最大PPV，因此，如果它提供了一个积极的结果，会提供大量信息。新测试的阳性结果信息量有多大？为了回答这个问题，请注意，由于我们的条件是接受测试，因此之前不存在不确定性，因为测试poo l的值由χ给出。即使没有这种先前的模糊性，测试结果也存在模糊性。例如，在确认案例（C）中，PPVzis 1的可能值的区间宽度- P（y=1 | z=1，t=1），在应用中通常很小但不为零。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-4-26 15:12:36

因此，至少在检测结果呈阳性后，从新检测中获得的信息对我们来说是模糊的。在这里和下面，我将使用Pto表示下界分布，P表示上界。从技术上讲，一个可能在案例（C）或（U）的边界上，但通过C连续性，结果边界不会改变。这一观察结果本身就意味着这项测试不是一项实验。与推导PPV类似，可以推导出新测试的灵敏度。与第2.1节中讨论的既定测试相比，新测试的模糊性允许出现扩张。在当前设置中，如果χ=P（x=1 | t=1）包含在两个集合的相交处，则会发生膨胀，每个测试结果的P（x=1 | y=i，t=1）可能值∈ {0, 1} . 在阳性测试结果之后，P（x=1 | y=1，t=1）的一组可能值是否可能包含在χ=P（x=1 | t=1）中？推论2提供了完整的特征化。随后将讨论阴性测试结果后的相应情况。推论2（界限增加-PPV）。假设1、假设2和假设4成立。新测试的PPV可能值包含χ=P（x=1 | t=1），如果只有σ时才包含d≤ 闵γ(1 - ζ） P（y=1，z=0 | t=1），γζP（y=1，z=1 | t=1）,其中，第一个入口对应于上限的增加，第二个条件确保下限的减少。证据对于上限，请注意，只有当且仅当发生（I）或（X）情况（即1）时，才能出现严格的下降-χ>P（y=0，z=0 | t=1）和P（y=1 | z=1，t=1）+χ1-σζ< χ. 第一个等于σ>γ1-P（y=0，z=0 | t=1）和第二个σ>1-ζP（z=0 | y=1，t=1）=γP（y=1 | z=0，t=1）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:12:45

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:12:53

因此，从表20和表21中，我们分别得到：P（x=0，z=0 | t=1）=max{0，1- χ - P（y=0，z=1 | t=1）}=max0, γ -χ|{z}=-χ(1-σ） +P（y=0，z=0 | t=1）P（x=0，z=0 | t=1）=min{1- χ、 P（y=0，z=0 | t=1）}。除以P（z=0 | t=1）=1- ζ表示净现值。从命题3来看，不具信息性（U）和矛盾性（X）的情况似乎有问题。在这两种情况下，下限均为零，且区间宽度也较大。这是另一个迹象，表明任何合理的测试都不应出现在这两种情况中。然而，即使在其他情况下，如PPV，NPV通常也只是设定的。因此，阴性测试结果也会产生模糊信息。通过完美的参考测试可以避免这种歧义。推论3验证了如果参考测试是完美的，那么Pro位置3将简化为许多应用中使用的表达式，并且可以直接从数据P（y，z）计算得出。推论3（完美黄金标准——净现值）。假设假设1、假设2和假设4成立。如果σ=1，即建立的测试具有完美的灵敏度，则NPVz=P（y=0 | z=0，t=1）。证据如果σ=1，那么γ1-ζ1-σσ=0，在循环1的证明中，相关的情况是（I）。如果没有完美的参考测试，新测试的负面结果会导致歧义。与阳性检测结果的情况类似，这种模糊性降低了扩张的发生。利用命题3，推论4给出了当P（x=1 | z=0，t=1）=1的一组可能值的特征- NPVZ包含先验信息P（x=1 | t=1）=χ。推论4（界限增加-NPV）。假设假设1、假设2和假设4成立。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:13:00

P（x=1 | z=0，t=1）的一组可能值包括先验信息χ=P（x=1 | t=1），当且仅当σ≤ 闵γζP（y=1，z=1 | t=1），γ（1- ζ） P（y=1，z=0 | t=1）,其中，第一个入口对应于上限的增加，第二个条件确保下限的减少。证据对于上限（共1个）- NPVz）只有在（C）和（I）情况下，即P（y=0，z=0 | t=1）才会出现严格的下降≥χ(1 - σ) . 在这些情况下，减少相当于（1- ζ) - [P（y=0，z=0 | t=1）- χ(1 - σ)] < χ(1 - ζ）或1- ζ +χ(ζ - σ） <P（y=0，z=0 | t=1）=1- ζ - P（y=1，z=0 | t=1）。重新排列给出，σ>ζP（z=1 | y=1，t=1）=γζP（y=1，z=1 | t=1）。正如在第二卷的证明中，在（C）或（I）情况下存在的条件是由这个条件隐含的。对于下限，如果χ（1- ζ) ≥(1 - ζ) - min{1- χ、 P（y=0，z=0 | t=1）}=max{χ- ζ、 P（y=1，z=0 | t=1）}。首先，χ- ζ ≤ χ(1 - ζ）始终保持为χ≤ 1.第二，重新排列P（y=1，z=0 | t=1）≤ (1 - ζ） γσ提供了条件。推论2和推论4结合起来，提供了新测试是扩张时的精确特征。事实上，由于条件相同，当且仅当σ≤ 闵γζP（y=1，z=1 | t=1），γ（1- ζ） P（y=1，z=0 | t=1）. （3） 16.2.2新测试在评估新测试的准确性时，重要的是确保数据符合表达式（3）。然而，从极端意义上说，这项测试缺乏信息。在典型应用中，数据通常满足P（y=1，z=0 | t=1）≤ γ(1 - ζ).在这些情况下，只有当σ≤γζP（y=1，z=1 | t=1）。WHO（2020年）仅使用数据P（y，z | t=1）直接提供的信息建议最低质量要求。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:13:07

根据这一分析，评估还应考虑σ，即已建立的测试的灵敏度，并以此确保测试不是一种膨胀。σ ≤γζP（y=1，z=1 | t=1）与给定的最低标准相结合，提供了一种易于验证的避免扩张的有效条件。为此，设∑为最低（明显）灵敏度阈值，低于该阈值时，atest被视为不可靠，并用∑=P（z=1 | y=1，t=1）表示新试验的明显灵敏度，因此，如果∑>。然后，表达式（3）中用于避免膨胀的相关情况可以表示为σ>ζ/σ，或等效为∑>ζ/σ。如果∑≥ ζ/σ，则任何满足最小要求的测试都不能是膨胀。因此，必须确保新测试的产率不太高：ζ：=P（z=1 | t=1）≤ σ × Σ. （4）如果确定的测试是高度特定的，即σ≈ 1，表达式（4）是令人满意的，除非新测试的产量非常高。对于SARS-CoV-2抗原检测，世卫组织建议∑=0.8，如果PCR检测不具有高度特异性，则可能违反表达（4）。例如，表1的扩张试验ζ=0.49，如果PCR的灵敏度σ=0.6，则不仅违反了表达（4），而且该试验是扩张试验。更具体地说，表达式（3）可用于确定准确的thr eshold灵敏度σ*低于该值时，给定的测试会变成一个膨胀。对于膨胀试验，该值为σ*= 60.79%.即使是像Incasaniti等人（2020年）那样认为测试不充分的数据也满足了这种不平等。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:13:13

我感谢菲利普·奥布拉多维奇让我了解这份报告。通常，最低要求还包括特定城市的阈值，但这在这里并不重要。值得一提的是，当γζP（y=1，z=1 | t=1）增加时，这是一个有效条件≤γ(1-ζ） P（y=1，z=0 | t=1），在许多应用中，这个不等式变得与表达式无关（3），因为右手边大于1。2.3额外测试的信息性虽然新测试产生的信息不明确，但已建立的测试始终是信息性的。因此，从业者可能希望根据一个人从新测试中获得的结果是阴性还是阳性，进行额外的既定测试。例如，如果抗原检测用于检测SARSCoV-2，结果呈阳性，通常的做法是通过PCR检测来验证结果。由于PCR测试是评估抗原测试准确性的参考测试，当前的框架可用于阐明该额外测试的信息量。命题4（组合测试）。在假设1、假设2和假设4下，P（x=1 | y=1，z=1，t=1）=P（x=1 | y=1，z=0，t=1）=1，P（x=0 | y=0，z=0，t=1）∈h1-χ(1-σ） P（y=0，z=0 | t=1），在情况（C）h1中-χ(1-σ） P（y=0，z=0 | t=1），1-χP（y=0，z=0 | t=1）iin case（I）[0,1]in case（U）h0,1-χP（y=0，z=0 | t=1）在病例（X）中，和P（X=0 | y=0，z=1，t=1）∈[0,1]在（C）情况下，h0,1-病例（I）h1中的χP（y=0，z=1 | t=1）-χ(1-σ） P（y=0，z=1 | t=1），在（U）h1的情况下-χ(1-σ） P（y=0，z=1 | t=1），1-病例（X）中的χP（y=0，z=1 | t=1）。证据如果y=1，由于假设2，PPV必须独立于新测试的结果。对于净现值，再次从表20和表21开始，τ=1。首先，两个测试匹配的情况，即。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

何人来此

2022-4-26 15:13:20

y=0=z:P（x=0，y=0，z=0 | t=1）=最大{0，γ- χ+P（y=0，z=0 | t=1）}=max{0，P（y=0，z=0 | t=1）-χ(1 - σ）和p（x=0，y=0，z=0 | t=1）=min{1- χ、 P（y=0，z=0 | t=1）}.18 2.4总体人口的预测值现在，除以P（y=0，z=0 | t=1）得到P（x=0 | y=0，z=0，t=1）。如果试验结果不同，相关概率为：P（x=0，y=0，z=1 | t=1）=1-γσ，P（y=0，z=1 | t=1）o=minn1-γσ, 1 - γ - P（y=0，z=0 | t=1）o=1- γ - max{χ（1）- σ），P（y=0，z=0 | t=1）}和P（x=0，y=0，z=1 | t=1）=max{1- χ - P（y=0，z=0 | t=1），0}=max{P（y=0，z=1 | t=1）-χ(1 - σ), 0} .注意P（x=0，y=0，z=1 | t=1）≥ 在这种情况下，P（x=0，y=0，z=1 | t=1）。除以P（y=0，z=1 | t=1）得到P（x=0 | y=0，z=1，t=1）。命题4再次表明，应避免（U）和（X）类测试。即使两个测试结果匹配且均为阴性，也不能排除零（阴性）预测值的可能性。提案4还明确了表3中定义的案例的命名惯例。确认测试（C）在两个测试都产生负面结果时提供准确的信息，但当且仅当新测试有正面结果时，它完全没有信息。然而，一个信息测试（I）总是提供一些信息，从某种意义上说，它产生了不完全平凡的界限。矛盾测试（X）提供信息，但与已建立的测试结果相反。无信息测试（U）根本不提供任何信息，即使两个测试都同意否定结果。当然，从不是扩张的意义上来说，进行额外的测试总是有用的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:13:27

已建立的检测不会产生假阴性，因此，无论采用何种新检测，已建立检测的阳性结果始终是感染的完美预测。2.4总体人口的预测值命题1限制了已建立的总体人口测试的NPV，而不是测试人口的NPV。另一方面，到目前为止，新的测试只针对测试池进行了分析。附录A中的完整描述允许扩展新测试的分析，以对总体进行评估。由于这涉及到更麻烦的符号，我只说明NPV=P（x=0 | z=0）的结果界限。PPV的分析将在类似的物质中进行。命题5（无条件净现值）。在假设1–假设4下，新测试的（无条件）负预测v值急剧受限于1.-χ - τP（y=0，z=1 | t=1）1- τζ,1 - χ1 - τζ如果是（C*）1.-χ - τP（y=0，z=1 | t=1）1- τζ, 1 -P（y=1，z=0 | t=1）1- τζ如果（I*）0,1 - χ1 - τζ如果是（U*）0, 1 -P（y=1，z=0 | t=1）1- τζ如果是（X*），其中（C*）。P（y=0，z=0 | t=1）≥ 最大值1.- γ -1.-χτ, 1 -χ（我*）。1.-χ>P（y=0，z=0 | t=1）≥ 1.- γ -1.-χτ（U*）。1.- γ -1.-χτ>P（y=0，z=0 | t=1）≥ 1.-χ（X*）。闵1.- γ -1.-χτ, 1 -χ> P（y=0，z=0 | t=1）。证据从表20和表21中，我们分别得到：P（x=0，z=0）=max{0，1- χ - τP（y=0，z=1 | t=1）}P（x=0，z=0）=1- τmax{χ，1- P（y=0，z=0 | t=1）}=1- τmax{χ，ζ+P（y=1，z=0 | t=1）}。现在，结果是fr om除以P（z=0）=1- τζ. 如果不是预测值，而是关注新测试在整个人群中的敏感性或特异性，则会出现另一个并发症。在测试池的条件下，这些测量值的BOT h可以在第2.2节中推导出来。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

可人4

2022-4-26 15:13:34

例如，对于灵敏度，可以使用命题2的证明，并除以P（x=1 | t=1）=χ，而不是P（z=1 | t=1）=ζ。通过考虑表20和表21的极值，确定灵敏度范围增益。然而，对于条件灵敏度，分子和分母都被设置为识别的，因为P（x=1）∈ [χ, χ]. 因此，在两种极端分布中都可能无法获得下限。这使得求解灵敏度的闭式表达式变得非常困难。尽管如此，通过考虑固定的Γ：=P（y=1），可以通过计算获得边界∈ [τγ，γ]20种应用，相应的p=Γ/σ。对于这个Γ，可以通过使用表18和表19获得灵敏度的尖锐界限，比如[LΓ，HΓ]。为了找到灵敏度的总体界限，需要对所有Γ值的两个（非线性）优化问题进行验证，以给出[minΓLΓ，maxΓHΓ].3应用在本节中，将用几个应用来说明理论框架。首先，我分析了引言中提出的（假设的）膨胀测试。然后，我检查了两个真实的SARS-CoV-2检测试验。最后，我表明检测2019冠状病毒疾病的CT扫描程序容易膨胀。3.1在表1中的假设试验数据对应于膨胀之前，膨胀试验存在争议。假设测试数据来源于检测SARS-CoV-2的抗原测试，而参考测试是PCR测试。。该测试满足WHO（2020）的最低要求，其表观敏感性（∑=80.6%）和特定城市（97.1%）分别高于80%和97%的特定阈值。对于这种设置，当前的框架是适用的。特别是，假设2似乎更为敏感，因为PCR检测具有高度特异性。然而，众所周知，PCR检测可能缺乏高灵敏度。Alcoba Florez等人。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 15:13:39

（2 020）报告几个点估计值在σ=60.2%到σ=97.9%之间的PCRTest的灵敏度f。所有95%的置信区间均不包括完美灵敏度，σ=1。利用第2.2小节的结果，表4总结了膨胀试验的一些关键统计数据。当PCR敏感性接近1时，新的（假设的）检测产生相对准确的测量结果，PPV接近1，NPV高于75%。然而，如果PCR检测缺乏高灵敏度，那么我们无法确定扩张检测的质量。在PCR敏感性最差的情况下（σ=0.6），新的检测确实是一种扩张：在获得检测结果之前（在检测池中），患病率为9.8%，在获得任一种扩张检测结果之后，感染的可能性至少为间隔[97.7%，100%]。在fa ct中，可能更令人困惑的是，阴性检测后的最低值严格来说是SARS Co V-2检测的最低值，PCR检测是用于评估其他检测的既定检测。（Esbin等人，2020年）这些数字的计算就好像参考测试是完美的一样。这与推论1和推论3相似。Alcoba Flore z e t al.根据目标基因区分不同的值。此处报告的范围涵盖所有基因和测试。比阳性结果后更高。使用表达式（3），σ*= 60.8%代表低于发生扩张的PCR敏感性。表4：扩张试验统计数据σ0.6 0.85 0.98 1χ=P（x=1 | t=1）98.8%69.8%60.5%59.3%PPVz[97.6%，100%][97.6%，100%][97.6%，100%]97.6%1- NPVz[97.7%，100%][40.7%，43.1%][22.6%，24.9%]22.6%NPVz[0%，2.29%][56.9%，59.3%][75.1%，77.4%]77.43%扩张阈值σ*= 60.8%3.2标准Q 2019冠状病毒疾病快速抗原试验接下来，考虑SD Biosensor/Roche的标准Q（StQ）2019冠状病毒疾病快速抗igen试验，用于检测SARS-CoV-2，如Kaiser等人所分析。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-4-26 15:13:47

(2020). 他们使用PCR检测结果作为对比（见脚注35）。测试数据汇总见表5。当σ=1时，StQ的PPV和NPV可通过表5获得：Kaiser等人（2020年，第3页）的StQ测试结果z\\y y=0 y=1 Sumz=0 63.71%3.97%67.67%z=1 0.19%32.14%32.33%和63.89%3 6.11%推论1和推论3分别产生99.42%和94.13%。这些是Kaiser等人（2020年）的报告值。然而，正如上面所解释的那样，它并不完全敏感。因此，要评估StQ测试，当前的框架是适用的。表6首先只关注测试池，使用命题2和命题3总结了PCR敏感性（σ）不同值的PPV和NPV。即使PCR检测缺乏高灵敏度，StQ也有接近完美的阳性预测值（PPVz）≈ 1). 然而，当σ降低时，净现值显著下降。在最坏的情况下，负StQ结果变得接近公平币流量。然而，从低膨胀阈值σ可以看出，该测试总体上信息量很大*= 36.3%.Kaiser等人（2020年）使用针对E基因的PCR检测，在Alcoba Florez等人（2020年）的分析中，E基因往往具有较高的敏感性。针对E基因的PCR检测的最低报告敏感性为65.33%。22 3.2标准Q 2019冠状病毒疾病快速抗原检测表6：St Qσ0.6 0.85 0.98PPVz[99.4%，100%][99.4%，100%][99.4%，100%]NPVz[58.6%，58.9%][84.7%，85%][93.1%，94.1%]扩张阈值σ的准确性*= 36.3%的Kaiser等人（2020年，第。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝