因果网络 - 外文文献专区

2022-5-6 09:05:52

因果网络Chattopadhyayic99@cornell.eduFAbstract-虽然在数据驱动的科学研究的几乎所有分支中，相关度量都被用来识别观测变量之间的统计关系，但我们真正感兴趣的是因果依赖的存在。事实证明，因果关系的统计检验很难构建；这种困难既源于精确定义因果关系的哲学障碍，也源于从哲学上合理的定义中获得操作程序的实际问题。特别是，设计一个有效的因果关系测试，可以在没有对手头数据的基本动态结构进行限制性预先假设的情况下进行，这是非常重要的。然而，与简单相关性的计算相比，计算推断因果依赖的统计初步证据的能力可能是数据分析的一个更具辨别力的工具。在目前的工作中，我们提出了一种新的非参数测试格兰杰因果关系的量化或符号数据流生成的遍历平稳来源。与最先进的二进制测试相比，我们的方法可以精确计算数据流之间的因果依赖程度，而无需做出任何限制性假设、线性或其他。此外，在没有任何先验的特定动态结构的情况下，我们推断出因果交叉依赖的显式生成模型，然后可以用于预测。这些显式模型被表示为广义概率自动机，称为交叉自动机，并被证明足以捕捉一类相当普遍的因果关系。所提出的算法在PAC意义上是计算有效的；i、例如，我们找到了具有多项式运行时间和样本复杂性的高概率交叉依赖模型。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:05:56

这些理论结果被应用于谷歌趋势API（Google Trends API）的每周搜索频率数据，以获得一组选定的社交“收费”关键字。从这个数据集中推断出的因果网络，相当令人期待地揭示了某些关键词的因果重要性。它还表明，相关性分析无法收集这样的见解。内容1动机11.1格兰杰对因果关系的操作定义。21.2格兰杰因果关系的性质。21.2.1确定性因果关系。21.2.2引用性、对称性和及物性。21.2.3缺失变量和未观察到的原因21.3标准方法中的额外假设。22当前工作的贡献32.1组织。43量化随机过程和概率自动机43.1规范表示。53.2符号导数。73.3计算-同步字符串。84串扰概率模型84.1交叉概率有限状态自动机（XPFSA）94.1.1特定情况：无依赖性和相同样本路径。94.1.2方向相关性的概念104.1.3方向相关性的程度。115算法基因：自模型推理145.1实现步骤。145.2复杂性分析和PAC可学习性。155.3 QSP的PAC识别能力。15作者是芝加哥大学计算研究所和经济学与系统生物学研究所的研究员。他与康奈尔大学计算机科学系和机械与航空航天工程系有5次会面。与无因果关系相关X0 2000 400060008000001Timey-200B。因果关系-20-10010timeY0Fig。1.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:01

相关性与因果依赖。板A中的信号呈负相关；但在统计学上没有明显的因果关系。这是因为变量X的未来预测不能通过考虑变量Y的过去值来改进；X本身的过去值足以提供最大程度的正确预测（相同的参数适用于X与Y的互换）。相反，板B中的信号是因果相关的；虽然Xa的过去值对预测其自身的未来值没有用处（这是一种无偏随机游走），但详细的分析将表明，Ydo的过去值确实携带了独特的信息，可以改善X的未来预测。因此，除了XandY之间的负相关，从Yto X.6算法xGenESeSS：交叉模型推理166.1 xGenESeSS的实施步骤中，有初步统计证据表明因果依赖性（在格兰杰因果关系的意义上）。176.2 XGeneses和PAC可学习性的复杂性。177因果网络的生成187.1使用交叉概率自动机进行预测。197.1.1单个预测的融合：。208互联网搜索趋势的应用209结论21参考文献211动机“相关性并不意味着因果关系”是统计学中早期和经常学到的一课。显而易见的下一个问题几乎总是在初稿中没有提及：我们如何检验因果关系？这是哲学[1]、[2]、[3]、[4]、[5]、法学[6]、统计学[7]、[8]、[9]、[10]以及最近的学习理论中争论的一个老问题；专家们基本上未能就一种合乎哲学的操作方法达成一致。因果关系，作为一个直观的概念，并不难理解。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:10

对于如何从数据中推断因果关系缺乏共识，可能是因为难以将这一直观概念精确到数学上。“与艺术不同，因果关系是一个概念，人们知道自己不喜欢什么，但很少有人知道自己喜欢什么。”C.W.J.Granger[11]Granger试图获得因果影响的精确定义，并建立了一个有效的统计论述框架：考虑一个宇宙，其中变量在预先指定的时间点t=1，2，·进行测量。表示在n之前宇宙中所有可用的知识Ohm→n、让我Ohm→n\\Y→n请注意此完整信息，除了在时间n之前由变量yt获取的值，其中Y→N∈ Ohm→NOhm→9包括在时间点t>n测得的新星，尽管它很可能包含对此类值的预期或预测。然而，这些期望只是Ohm→n、在定义因果关系之前，我们需要额外的结构，即：o公理A：过去和现在可能导致未来，但未来不能导致过去公理B：Ohm→n不包含冗余信息，因此如果某个变量zt以确定性方式与一个或多个其他变量功能相关，则Z→n将被排除在外Ohm→n、在此框架内，Granger提出了以下定义，并指出它不是有效的[12]，即不直接适用于数据：定义1（Granger因果关系）。Y→如果给定一个变量Xn+1取值的集合，我们得到：Pr（Xn+1∈ A|Ohm→n），Pr（Xn+1）∈ A|Ohm→n\\Y→n）（1）格兰杰的概念直观上很简单：Y是X的一个原因，如果它具有改变X近期概率估计的独特信息。并非所有因果影响的概念都可以用这种方式表达，也不是所有哲学上的微妙之处都能得到充分解决。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-5-6 09:06:15

Granger的动机更加务实，他主要感兴趣的是获得一个数学上精确的框架，从而得出一个有效的或算法的解决方案——一个因果关系的具体统计测试。1.1格兰杰对因果关系的操作定义在给定时间点之前，对宇宙中的“所有知识”进行编码的时间短，定义1并不直接有用。假设一个人对一个向量序列Yt引起另一个向量Xt的可能性感兴趣。Letjn是在时间n可用的信息集，由向量序列Zt的项组成，即Jn={Zt:t5n}（2）如果Xt包含在Zt中，则Jn是关于Xt的适当信息集。此外，假设Zt不包括Yt的任何成分，并且definejn={（Zt，Yt）：t5n}（3）用F（Xn+1 | Jn）表示Xn+1的条件分布函数，平均值为E（Xn+1 | Jn）。然后，我们可以定义：定义2.o关于Jnif:F（Xn+1 | Jn）=F（Xn+1 | Jn）（4），即Jn中的额外信息，不会导致Xn+1影响条件分布。一个必要条件是：E（Xn+1 | Jn）=E（Xn+1 | Jn）（5）o如果Jn=Ohmn、通用信息集，以及ifF（Xn+1 | Jn），F（Xn+1 | Jn）（6），那么，Yn被认为是导致Xn+1的原因就Jnif而言，Ynis是Xn+1的一个表面原因：F（Xn+1 | Jn），F（Xn+1 | Jn）（7）o就Jnif而言，Ynis被认为不会导致Xn+1的平均值：（Jn），E（Xn+1 |Jn）- E（Xn+1 | Jn）=0（8）o如果（Jn）不等于零，那么Yn是关于Jn的平均值中因果n+1的初步证据。定义2更有用；再多一点结构，我们就可以得到一个有效的因果关系测试。我们将很快讨论这些常用的附加假设。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

nandehutu2022

2022-5-6 09:06:29

但首先，我们阐明了格兰杰因果关系定义的一些关键含义。1.2格兰杰因果关系的性质1。2.1确定性原因不可能为自确定性系列找到原因。因此，如果Xnis可以表示为其先前值的确定函数，那么没有其他信息可以改变这种“预测”，因此不需要其他原因。根据Take的嵌入定理[13]，这有一个重要的含义。对于由普通微分方程系统描述的某些类型的动力学系统，单个变量可能能够通过Take的延迟坐标构造完美地重建动力学，这意味着，就Granger的概念而言，其他变量可能会被发现是因果超复杂的。1.2.2参考性、对称性和传递性早期，因果关系不要求对称；XT可能会导致YT，但不是相反。此外，Xt，Xt可以独立于所有t，t，但YT可能是Xt的原因。因此，XT不一定是其自身的原因，即因果关系不一定是必然存在的。它也不要求是可传递的（见[11]中的示例1），即XT原因和YT原因ZT不一定隐含定义2.1.2.3缺失变量和未观察到的原因缺失变量可能导致虚假因果关系。未被观察到的共同原因尤其重要。例如[11]，假设：Zt=at（9）Xt=at-1+bt（10）Yt=at-2+ct（11），其中at、bt、CTA是独立的白噪声过程。这是一个常见的原因。然而，如果我们只观察XT和Yt，那么XT似乎是导致Yt的原因。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:32

这方面没有通用的fix；但已经证明，这种单向虚假因果关系在物理系统中不太可能发生，而双向或反馈关系更可能是未观察到的共同原因[14]的结果。1.3标准方法中的附加假设在平均值中传递因果关系（见等式（8））更容易，如果一个人对使用最小均方预测误差作为评估增量预测能力的标准感到满意，那么可以使用线性一步超前最小二乘预测器从等式（8）中获得操作程序：如果Var（X | Jn）是Xn+1given Jn的一步预测误差的方差，那么Y是X关于Jnif的一个初步原因：VAR（X | Jn）<VAR（X | Jn）（12）均值中的二元格兰杰因果关系测试涉及估计线性简化形式向量自回归：Xt=a（L）Xt+B（L）Yt+UX，t（13）Yt=C（L）Xt+D（L）Yt+VY，t（14）其中a（L）、B（L）、C（L）和D（L）是滞后算子L中的单侧滞后多项式，且根都不同，且在单位圆之外。假设回归误差UX、t、VY、tar相互依赖，且各自的i.i.d.具有零均值和恒定方差。标准联合检验（F或χ-检验）用于确定滞后Y对currentX是否具有显著的线性预测能力。如果B（L）中元素的系数与零有显著差异，则Y不会严格格兰杰导致Xis的无效假设被拒绝。线性测试预先假设了数据的限制性且通常不现实[15]，[16]结构。Brock[17]提出了一个简单的二元模型，以分析证明线性测试在揭示非线性影响方面的局限性。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:35

为了解决这个问题，已经报告了一些非线性试验，例如，广义自回归条件异方差（GARCH）模型[18]，使用小波变换[19]，或启发式加性关系[20]。然而，q0q1σ1 | 0.15σ0 | 0.85σ1 | 0.75σ0 | 0.25A。过程HAover字母∑={σ0，σ1}∑的生成模型？q0q1splitSet of all strings over∑即由以σ1i结尾的所有字符串的进程集产生的所有可能历史的集合。e、所有可能历史的集合，最后一个符号为σ1，所有字符串的集合以σ0i结尾。e、所有可能的历史的集合，最后一个符号σ0表示任何历史，在Q1类中，下一个符号被分配为[25.75]表示任何历史，在Q0类中，下一个符号被分配为[85.15]B.因果状态表示历史的等价类图。2.因果状态概念的说明。图A显示了一个概率有限状态自动机，该自动机生成一个平稳的遍历量化随机过程HA，取值于字母表∑={σ，σ}。状态的含义如图B所示：过程产生的所有可能的历史或序列集可分为两类，分别包含以σ和σ结尾的所有序列。这一类分别代表状态Q和Q。对于映射到q的类中的任何字符串，下一个符号以[0.85 0.15]的形式分布，对于映射到q的类中的任何字符串，下一个符号以[0.25 0.75]的形式分布在字母表∑上。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:39

请注意，这是由图版A中显示的生成模型的结构决定的，例如，可以很容易地沿着边，并得出结论，任何以σ结尾的字符串都以状态QIR结束，而不是从哪里开始。因此，HAhas有两种因果状态，因为只有两类这样的历史导致任何生成序列的不同未来演化。这些方法通常假定为允许的非线性；因此，并不能完全缓解预设结构的问题。这不仅仅是一个学术问题；格兰杰因果关系已被证明对非线性变换非常敏感[21]。另一方面，非参数方法，例如Hiemstra-Jones（HJ）测试[22]，试图完全免除因果关系结构的假设。给定两个系列XT和Yt，HJ测试（是Baek Brock测试[23]的修正）使用相关积分来测试XT的相似未来概率，如果我们同时为XT和Yt设定相似过去的条件，则其变化是否显著。然而，数据序列必须是遍历的、平稳的和绝对规则的，即β-混合，β系数接近零的速率上限[24]，以实现对相关积分的一致估计。额外的假设Beyond遍历性和平稳性有助于保证数据序列中有效分离的片段几乎是独立的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:42

HJtest及其变体[25]，[26]在计量经济学中相当成功；揭示货币与收入[23]、股票总收益与宏观经济因素[27]、货币未来收益[28]与股票价格与交易量[22]之间的非线性因果关系。令人惊讶的是，尽管有明确证据表明线性测试通常在揭示非线性因果关系方面的能力较低[22]，[28]，但非参数测试的应用在金融、或宏观经济利益以外的领域受到了限制。2.本研究的贡献HJ测试及其变体专门设计用于在预先指定的显著水平上检测格兰杰因果关系的存在；没有明显的扩展，可以从手头的数据中提炼出这种相互依赖的生成性非线性模型。我们留下的是一个黑匣子里的甲骨文——它在回答问题时没有洞察到被调查系统的动态结构。另一方面，基于线性回归的方法以及参数非线性方法有一个明显的优势；它们产生了观察变量之间因果影响的生成模型。希姆斯特拉的建议是将非参数测试纯粹视为揭示系统动力学中非线性存在的原子工具；将详细研究动力结构的任务留给基于参数模型的方法：尽管本文提出的因果检验的非线性（非参数）方法可以检测出高功率的非线性因果关系，但它没有提供关于非线性依赖来源的指导。这样的指导必须留给理论，理论可能会提出特定的参数化结构模型。-希姆斯特拉等人。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:45

[22]这可能是将[22]中的HJ检验应用于估计线性自回归模型的误差残差背后的动机；通过使用回归移除线性结构，作者得出结论，任何额外的因果影响都必须是非线性的。然而，在我们不愿意先验地指定任何动态结构的情况下，要求因果交叉依赖的生成模型是完全不合理的吗？当前工作的中心目标是表明这样一项工作确实富有成效；从对两个变量的连续观察开始，我们可以推断出因果影响的非启发式生成模型，而不预设隐藏的线性或非线性动力学的性质。然而，这是一项非常重要的工作；如果我们要考虑到动力学模型具有不特定且不受限制的结构，我们需要重新思考进行此类引用的框架。众所周知，如果对数据源的统计性质[11]缺乏至少一些广泛的假设，尤其是在基本统计参数的时间或顺序变化的性质上，这项任务是不可能实现的。我们将自己局限于遍历和固定的数据源，并另外假设数据流采用的是单元集内的值；i、例如，我们只考虑遍历的、平稳的量化随机过程（后面给出了明确的定义）。我们简要回顾了一个早期的结果，即遍历平稳量化过程中单个数据流的底层生成器可以表示为概率自动机。然后我们证明，对于两个流，因果影响的生成模型可以表示为广义概率自动机，称为交叉自动机。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

nandehutu2022

2022-5-6 09:06:50

然后，我们的任务就简化为在缺乏有关结构和参数的先验知识的情况下，从数据中推断这些交叉机器。我们推断出的非对称机器是可能的；捕获sAto流SBI流入的交叉机器不需要与sBto sA流入的机器相同。此外，我们还表明，数据流之间缺乏因果影响表现为一个平凡的交叉机器，这种平凡的表示在两个方向上的存在对于欠考虑的数据流之间的统计独立性是必要且有效的。我们发现因果依赖生成模型的能力使我们能够进行样本外预测。相比之下，HJ很容易受到Granger反对[11]的影响，即在缺乏有效模型的情况下，人们没有严格遵守Granger因果关系的原始定义，这需要提高预测能力，而不仅仅是分析过去的数据。基于模型的方法可以对预测进行索引和测试，但代价是预先施加的模型结构（见[11]中的建议配方）。与之相反，当前的方法产生了没有预设结构的生成模型；因此，它能够在没有前述成本的情况下执行和测试预测。除了获得观测数据流之间因果关系的显式模型外，本研究还为量化过程（即在有限集合内取值的过程）确定了格兰杰因果关系的新测试。我们的方法涉及计算因果关系γAB的效率，从生成流Sat的过程到生成流sB的过程。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:53

它被定义为流Sb中下一个符号分布的熵的预期变化与流Sat中的观测值之间的比率，与流Sb中下一个符号分布的熵之间的比率，前提是没有对流Sb进行观测。我们表明，γAb在闭合单位区间上取值，值越高，表明SBSA的可预测性越强，即因果影响程度越高。因此，与Granger的因果关系概念一样，γAb量化了观测到的关于sB流中近期未来的额外信息量。我们证明了流sA，sb在统计上是独立的，且仅当γAB=γBA=0时。重要的是，给出γAB=0和γBA>0的例子也很容易，从而说明方向性影响的存在（见图6）。值得注意的是，包括HJ测试在内的最新技术，只是“测试”因果关系的存在；在经典二元假设检验的框架下设置问题。一旦统计上确定了因果关系的存在，就不会试图推断因果关系的程度。也许有人会指出测试通过（或失败）的重要值；但这些测试的统计意义与因果关系的程度无关，至少在任何明显的方面是如此。相比之下，我们对γAb的定义明确地包含了这一概念。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:56

正如我们之前所说，系数越高，表明因果关系越强；γAB=1表示一种情况，在这种情况下，考虑到sA的过去值，SBI的近期符号是确定的，但如果只有Sb的过去值可用，则看起来是完全随机的。虽然HJ检验和因果系数的计算推断对数据施加了类似的假设，但后一种情况下的假设在物理上可能更透明。这两种方法都需要遍历性和平稳性；HJ测试进一步要求过程是绝对规则的（β混合），β系数具有一定的最小渐近衰减率（见[29]，第4页脚注和[24]）。绝对规律性是一个人具有弱依赖性的几种方式之一；本质上意味着一个数据流中两个完全分离的片段几乎是独立的。除了平稳性和遍历性，我们的算法还需要弱依赖性；然而，我们要求过程具有一定数量的因果状态，而不是调用混合系数（见图2）。因果状态是产生类似未来的历史的等价类；因此，一定数量的因果状态决定了我们需要一定数量的历史类别来进行未来的预测。至于算法的计算成本，我们证明了交叉自动机的推理是有效的[30]，即我们可以在渐近多项式时间和样本复杂度下以高概率推断出良好的模型。HJ测试可能具有良好的计算性能；但文献缺乏详细的调查。总之，本文的主要贡献可以概括为：1）引入了一种新的非参数格兰杰因果关系检验方法。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:06:59

除了二元假设检验，我们量化了观测数据流之间因果影响程度的概念，而不预先假设任何特定的模型结构。2）结果表明，因果影响的生成模型是可推断的，没有先验的、超越随机性、平稳性和弱依赖形式的动态结构。明示生成模型可用于预测。3）所提出的算法被证明是高效的。2.1组织本文的其余部分组织如下：第3节阐述了量子化随机过程的概念，以及与概率自动机的联系。本节中的一些材料已出现在其他地方[31]，但出于完整性的考虑，以及一些关键的技术差异和对本节内容的扩展，本节中的一些材料被包括在内。第4节介绍了表示交叉依赖的生成模型的框架；引入交叉概率自拟矩阵。定义了因果依赖的系数，并在此背景下研究了因果关系的方向性。第5节介绍了从单个数据流推断生成自模型的算法。同样，在[31]的前面已经报道了基因，但为了完整起见，这里也包括了基因。第6节介绍了算法xGenESeSS，它从成对的数据流中推断出自动机，作为特定方向因果关系的生成模型。研究了xGenESeSS的复杂性和速度效率。第7节讨论了多个数据流之间因果网络的差异，以及从推断的交叉模型中融合未来的预测。一个简单的应用开发的理论是说明在第？？，其中计算了所选关键字列表的每周搜索频率数据（数据源：Google Trends）之间的因果关系网络。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:07:02

本文在第9.3节量化随机过程和概率自动机中总结。我们的方法取决于有效地使用概率自动机模型平稳遍历过程。我们的自动机模型与文献[32]，[33]中报道的不同。这种形式主义的细节可以在[31]中找到；为了完整起见，我们在此提供一个简要概述。符号1。∑是一个有限的符号字母表。∑上所有有限但可能无界字符串的集合用∑表示？[12]. ∑上的一组有限字符串构成一个级联幺半群，空字λ作为恒等式。∑上的严格有限字符串集表示为∑ω，其中ω表示第一个反有限基数。对于字符串x，|x |表示其长度，对于集合a，|a |表示其基数。另外，∑d+={x∈ Σ?s、 t.| x | 5d}。定义3（QSP）。QSP H是一个离散的∑值严格统计遍历随机过程，即H={Xt:Xt是一个∑值随机变量，t∈ N∪ {0}（15）如果可以从长时间的实现计算矩，则过程是遍历的；如果矩是时不变的，则过程是严格平稳的。接下来，我们将QSP与PFSA生成器的连接形式化。我们在假设QSP H的多重实现和固定初始条件的情况下发展了该理论。利用遍历性，我们将能够将我们的构造应用于一个足够长的实现，初始条件不再重要。定义4（有限字符串上的σ-代数）。对于∑上的有限元集合，我们定义B为由集合{x∑ω：x生成的最小σ-代数∈ Σ?}.引理1。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:07:16

每个QSP都会产生一个概率空间（ω，B，u）。证明：假设平稳性，我们可以构造概率测度u：B→ [0,1]通过定义任意序列x∈ Σ?\\{λ} ，以及大量实现NR（假设遍历性）：u（x∑ω）=limNR→∞# 所有长度为|x |的序列的初始发生次数，并通过最多可数和将度量扩展到B\\B的元素。因此u（ω）=Px∈Σ?u（x∑ω）=1，对于空字u（λ∑ω）=u（ω∑）=1。符号2。μx表示简略，μx表示简略。经典上，自动机状态是nerode关系的等价类；两个字符串是等价的，当且仅当字符串的任何一个有限扩展都是所考虑的语言中的两个或其中一个[12]。我们使用概率扩展[34]。定义5（概率内极等效关系）。（ω，B，u）导出了一个等价关系~非有限字符串集∑？作为：x、 y∈ Σ?, 十、~纽约<==> Z∈ Σ?Pr（xz）=Pr（yz）=0_Pr（xz）/Pr（x）- Pr（yz）/Pr（y）= 0（16）符号3。为了x∈ Σ?, x的等价类是[x]。很容易看出这一点~Nis右不变量，即~纽约=> Z∈ Σ?, xz~Nyz（17）∑上的右不变等价？总是诱导一个自动机结构；因此，概率Nerode关系产生了一种概率自动机：状态是~N、过渡结构如下：对于状态qi，qj和x∈ Σ?,（[x]=q）∧ （[xσ]=q）=> qσ-→ q（18）在将上述构造形式化之前，我们引入了具有初始状态但没有最终状态的概率自动机的概念。定义6（初始标记PFSA）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:07:20

初始标记的概率有限状态自动机（初始标记的PFSA）是一个五元组（Q，∑，δ，eπ，Q），其中Q是一个有限状态集，∑是字母表，δ：Q×∑→ Q是状态转移函数，eπ：Q×∑→ [0,1]规定了条件符号生成概率，以及q∈ QI是初始状态。δ和π递归扩展为任意y=σx∈ Σ?详情如下：Q∈ Q、 δ（Q，λ）=Q（19a）δ（Q，σx）=δ（δ（Q，σ），x）（19b）Q∈ Q、 eπ（Q，λ）=1（19c）eπ（Q，σx）=eπ（Q，σ）eπ（δ（Q，σ），x）（19d）此外，我们对不同的状态qi，qj施加了这一点∈ Q、存在一个字符串x∈ Σ?, 使得δ（qi，x）=qj，andπ（qi，x）>0。注意，空单词的概率是每个状态的统一。如果指定了当前状态和下一个符号，则我们的下一个状态是固定的；类似于概率确定性自动机[35]。然而，与后者不同，我们在模型中缺少最终状态。此外，我们假设我们的图是强连通的。稍后我们将使用遍历性来消除初始状态依赖。接下来，我们将正式说明aPFSA是如何从QSP中产生的。引理2（PFSA发生器）。每个初始标记的PFSA G=（Q，∑，δ，eπ，Q）在可测空间∑ω，B上产生唯一的概率测度。证明：定义可测空间的集函数∑ω，B）：uG() , 0（20a）十、∈ Σ?, uG（x∑ω），eπ（q，x）（20b）x、 y∈ Σ?, uG（{x，y}∑ω），uG（x∑ω）+uG（y∑ω）（20c）uGis immediate的可数可加性，我们有（见定义6）：uG（∑ω）=uG（λ∑ω）=eπ（q，λ）=1（21），这意味着（ω，B，uG）是一个概率空间。我们将（∑ω，B，uG）称为初始标记的PFSA G引理3（概率空间到PFSA）生成的概率空间。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:07:34

如果对应于概率空间（∑ω，B，u）的概率Neroderelation有一个fineindex，则后者有一个初始标记的PFSA生成器。证明：设Q为概率节点关系（定义5）的等价类集合，定义函数δ：Q×∑→ Q、 eπ：Q×∑→ [0,1]as:δ（[x]，σ）=[xσ]（22a）eπ（[x]，σ）=Pr（xσ）Pr（x）对于任意选择的x∈ [x] （22b）其中我们递归地将δ，eπ扩展到y=σx∈ Σ?当δ（q，σx）=δ（δ（q，σ），x）（23a）eπ（q，σx）=eπ（q，σ）eπ（δ（q，σ），x）（23b）为验证空字概率，选择一个x∈ Σ?对于某些q，使得[x]=q∈ Q.然后，从等式（75b）中，我们得到：eπ（Q，λ）=Pr（xλ）Pr（x）∈ [x]=>eπ（q，λ）=Pr（x）Pr（x）=1（24）的有限指数~Nimplies|Q|<∞, 因此，将λ表示为q，我们得出结论：G=（q，∑，δ，eπ，q）是一个初始标记的PFSA。引理2表示G生成（∑ω，B，u），这就完成了证明。上述构造为初始标记的PFSA提供了最低限度的实现，这是唯一的状态重命名。引理4（QSP到PFSA）。任何具有有限指数当量的QSP均由初始标记的PFSA生成。证明：从引理1（QSP到概率空间）和引理3（概率空间到PFSA生成器）立即开始。3.1规范表示我们将QSP定义为遍历和平稳，而初始标记的PFSA具有指定的初始状态。接下来，我们引入规范表示来消除初始状态依赖。Weusee∏表示eπ的矩阵表示，即e∏i j=eπ（qi，σj），qi∈ Q、 σj∈ Σ. 我们需要变换矩阵的概念。定义7（转换矩阵）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:07:38

对于初始标记的PFSAG=（Q，∑，δ，eπ，Q），符号特定的变换矩阵Γσ∈{0，1}| Q |×| Q |是：σi j=eπ（qi，σ），如果δ（qi，σ）=qj0，否则（25）变换矩阵每行有一个非零条目，反映了我们的生成规则，即给定一个状态和一个生成的符号，下一个状态是固定的。首先，我们注意到，给定一个初始标记的PFSA G，我们可以关联一个概率分布在G的每个状态上∈ Σ?在以下意义上：如果x=σr···σrm∈ Σ?, 然后我们有：x=σr··σrm=||λQmj=1Γσrj | | |{z}归一化因子λmYj=1Γσrj（26），其中λ是G态上的平稳分布。请注意，可能存在多个导致分布的字符串x、从平稳分布开始λ. 因此x对应于字符串的等价类，即x不是唯一的。定义8（典型代表）。初始标记的PFSAG=（Q，∑，δ，eπ，Q）唯一地导出一个规范表示（QC，∑，δC，eπC），其中QC是Q上概率分布集合的子集，δC:QC×σ→ QC，eπC:QC×∑→ [0,1]的构造如下：1）使用由G诱导的马尔可夫链的转移概率，构造Q上的平稳分布，并将其作为第一个元素QC的λ。注意，G的传递矩阵是行随机矩阵M∈ [0,1]|Q |×|Q |，其中mi j=Pσ：δ（qi，σ）=qjeπ（qi，σ），因此λ满意度：λM=λ（27）2）定义δCπC(x、 σ）=||xΓσ||xΓσ，xσ（28）eπC(x、 σ）=xe∏（29）对于QSP H，正则表示被表示为CH引理5（正则表示的性质）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:07:49

给定一个初始标记的PFSA G=（Q，∑，δ，eπ，Q）：1），正则表示与初始状态无关。2）正则表示（QC，∑，δC，eπC）包含一个g的副本，即存在一组状态Q QC，因此存在一对一映射ζ：Q→ Q、与：Q∈ Qσ ∈ ∑，（eπ（q，σ）=eπC（ζ（q），σ）δ（q，σ）=δC（ζ（q），σ）（30）3）如果在施工期间（从λ）我们遇到对于某些x，x=ζ（q）∈ Σ?, Q∈ Q和（2）中定义的任何映射ζ，那么我们将保持在初始标记的PFSA副本的图中，用于x的所有正确扩展。证明：（1）遵循QSP的遍历性，这使得λ与初始标记PFSA中的初始状态无关。（2）正则表示包含了初始标记表示，即后者的状态本身可以被视为Q上的退化分布，即通过Letting=工程安装∈ [01]| Q |，i=1，···，| Q|（31）表示满足以下条件的分布集：ei | j=1，如果i=j0，否则（32）（3）来自G的强连通性。引理5暗示初始状态不重要；我们可以将QSP H诱导的初始标记PFSA（去除初始标记）表示为PH，并将其简称为“PFSA”。在E的CHas元素中，状态可以表示为状态。注意，我们总是会遇到一个状态，任意接近于从平稳分布开始的正则结构中的某个元素λ关于PH的状态。然而，在我们继续之前，我们建立了唯一极小实现的存在性。注意，即使初始标记的PFSA是强连接的，规范表示也可能不是。定义9（PFSA之间的结构同构）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

大多数88

2022-5-6 09:07:53

如果存在双射映射ξ：Q，则定义在同一字母表∑上的PFSA G=（Q，∑，δ，eπ）和G=（Q，∑，δ，eπ）在结构上同构→Qsuch表示：Q∈ Q、 σ∈ ∑，（ξ（δ（q，σ））=δ（ξ（q），σ）eπ（q，σ）=eπ（ξ（q），σ）（33）注意，ξ的双射性要求|q |=|q |。两个PFSA之间的结构同构意味着存在状态的置换，使得一个状态转换为另一个状态。因此，结构同构的PFSA编码相同的QSP。定理1（唯一强连通极小实现的存在性）。如果对应于概率空间（∑ω，B，u）的概率Nerode关系（代表平稳遍历QSP）有一个有限的指数，那么它有一个强连通的PFSA生成器唯一的结构同构。证明：首先，我们使用引理3中描述的构造来获得有限指数Neroderelation的PFSA生成器G=（Q，∑，δ，eπ）~n对应于概率空间（∑ω，B，u）。注意，由于概率空间代表的QSP是遍历的，我们可以从引理3的构造中得到初始状态。设G=（Q，∑，δ| Q，eπ| Q）是G的强连通分量，即我们有Qj Q，δ| Q，eπ| qa是对应函数对可能更小的状态集的限制，（Q，δ| Q）定义了一个强连通图，qa是节点集，并且有一个标记边qiσ-→ qji ffδ| Q（Q，σ）=qj。让q∈ Q、以至于十、∈ Σ?, [x] =q，使得u（x∑ω）>0。设H是通过将Gwithqas扩充为初始状态而获得的初始标记PFSA，即H=（Q，∑，δ| Q，eπ| Q，Q）。让我们表示：EH={[xy]：y∈ Σ?} （34）设E为~N.直接的结果是：EHj E（35），因为H是强连通的，并且X的任何右扩张都在某个状态q上终止∈ Q、直接存在目标映射H:Q→ 嗯。如果可能的话，让它存在∈ 这样E<EH。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:07:57

让z∈ Σ?,以至于∈ E.那么，就这样Z∈ Σ?, xz/Nz（36），这与我们关于QSP是遍历的假设相矛盾。因此，我们得出结论E=EH，即H是~N.我们声称地图H:Q→ E是内射的。要看到这一点，假设可能的话，对于一些不同的q，q∈ Q:H（Q）=H（Q）=E∈ E（37）由于q，qa是不同的，所以存在字符串x，x∈ Σ?因此[xi]，[x]与式（37）相矛盾。因此，我们得出结论，他的观点是一种最低限度的认识。由于G是G的任意强连通分量，且上述论点对状态标签的任何排列都有效，我们得出结论，H在结构等价性上是唯一的。这就完成了证明。总之，对于任何固定的初始状态，每个PFSA G=（Q，∑，δ，eπ）代表一个概率空间（ω，B，u），并且始终存在对后者进行编码的最小实现；然而，G可能是潜在概率空间的非最小实现。因此，给定一个PFSA G=（Q，∑，δ，eπ）和一个初始状态Q的选择，我们在∑？上有两个相关的等价关系：1）过渡等价~由PFSA图定义的Gde，即其过渡结构和状态：x~如果δ（q，x）=δ（q，y）（38）2）概率能量等效~Ngiven by:x~纽约如果Z∈ Σ?, u（xz∑ω）=u（yz∑ω）（39）我们有以下直接结果：引理6（跃迁等价）。给定PFSA G=（Q，∑，δ，eπ），并选择初始状态Q∈ Q、过渡等效必然是相应的Nerode等效的一个补充。如果G是一个最小实现，那么这两个等价物是相同的。证明：紧接着注意到：x~Gy=> δ（q，x）=δ（q，y）=> Z∈ Σ?, δ（q，xz）=δ（q，yz）=> Z∈ Σ?, u（xz∑ω）=u（yz∑ω）（40）接下来我们介绍-probabilisticautomata的同步（见图3）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:08:01

自动机的同步是fixing或q0q1σ1 | 0.15σ0 | 0.85σ1 | 0.75σ0 | 0.25可同步q0q1σ1 | 0.15σ0 | 0.85σ0 | 0.25σ1 | 0.75不可同步图。3.可同步和不可同步的机器。识别上下文是估计随机信号源熵率的关键步骤；对于PFSA发电机，这就转化为一个状态同步问题。然而，并非所有PFSA都是可同步的，例如，虽然顶部机器是可同步的，但底部机器不是。请注意，只有一个符号的历史足以确定可同步机器（顶部）中的当前状态，而在不可同步机器（底部）中，没有一个完整的历史可以这样做。然而，我们表明-可同步字符串alwaysexists（定理2）。确定当前状态；因此，它类似于利萨宁的“上下文算法”[36]中的上下文。我们表明，虽然并非所有PFSA都是可同步的，但所有PFSA都是可同步的-可同步。定理2(-概率自动机的同步）。对于大于∑的任何qsp H，PFSA PHSaties：> 0, 十、∈ Σ?, θ ∈ E||十、- θ||∞5.（41）证明：我们证明了所有PFSA至少是近似可同步的[37]，[38]，这对于确定性自动机是不正确的。如果PH图（即，通过移除弧概率获得的确定性自动机）是可同步的，那么等式（41）对于= 0表示任何同步字符串x。因此，我们假设PHA的图形不可同步。从非同步性的定义来看，如下所示：齐，qj∈ Q、与齐，qj，十、∈ Σ?, δ（qi，x），δ（qj，x）（42）如果PFSA只有一个状态，那么每个字符串都满足等式（41）中的条件。因此，我们假设PFSA有多个州。现在如果我们有：十、∈ Σ?,Pr（xx）Pr（x）=Pr（xx）Pr（x），其中[x]=qi，[x]=qj（43）。那么，根据定义5，我们有一个矛盾qi=qj。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:08:04

因此xsuch thatPr（xx）Pr（x），Pr（xx）Pr（x）其中[x]=qi，[x]=qj（44）自：xx∈Σ?Pr（xx）Pr（x）=1，对于其中[x]=qi（45）的任何x，我们在不损失一般性的情况下得出结论齐，qj∈ Q、有了qi，qj：xi j∈ Σ?,Pr（xxi j）Pr（x）>Pr（xxi j）Pr（x），其中[x]=qi，[x]=qjIt根据归纳得出，如果我们从一个分布开始就这样我=j=0.5，则对于任何> 0我们可以构造一个有限的xi j，如果δ（qi，xi j）=qr，δ（qj，xi j）=qs，那么对于新分布执行xi协议后，将满足s> 一,-. 我们注意到，对于任何qt∈ Q、存在一个字符串y∈ Σ?, 使得δ（qs，y）=qt。设置xi，j→t？=xi jy，我们可以确保分配执行xi j后获得？满足感t> 一,- 无论我们选择什么。对于任意初始分布Aon Q，我们必须考虑同时执行xi，j所产生的贡献→T来自其他州，而不仅仅是钱德qj。然而，不难看出，执行xi→T意味着在新的分布中A、我们有在>Ai+Aj- . 接下来是执行字符串x1,2→|Q | x3,4→|Q |··xn-1，n→|Q |，在哪里=|如果| Q |是偶数| Q |- 1否则（46）将导致最终分布令人满意的A | Q |>1-N.适当缩放然后完成证明。定理2引出了-同步字符串，并保证它们在任意PFSA中的存在。定义10(-同步字符串）。字符串x∈ Σ?是在以下情况下同步PFSA：θ ∈ E||十、- θ||∞5. （47）定理2是一个存在的结果，并且不会产生计算同步字符串的算法（参见定理4）。我们可以估计这样一个搜索的渐近上界。推论1（定理2）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:08:08

最多0（1）/) 需要分析给定字母表上所有字符串的自由顺序集合中的字符串，以找到-同步字符串。证明：定理2将∏矩阵中的条目相乘，这些条目不可能完全相同（否则状态将崩溃）。设两个不相等条目之间的最小差值为η。然后，按照定理2中的构造，同步字符串的长度`，直到线性缩放，满足：η`=O(), 意味着`=O（log（1/). 因此，要分析的字符串的数量是atmost all strings of length`，其中∑| `=|∑| O（log（1/)= O（1）/).3.2符号导数计算-同步字符串需要符号导数的概念。PFSA状态不可见；我们观察隐藏状态产生的符号。给定字符串的符号导数指定了下一个符号在字母表上的分布。符号4。我们将一组基数k上的概率分布表示为D（k）。定义11（符号计数功能）。对于大于∑的字符串，计数函数#s:∑？→ N∪ {0}，统计特定子串在s中出现的次数。计数是重叠的，即在s=0001时，我们将00s的出现次数计为0001和0001，这意味着#s00=2。定义12（符号导数）。对于aQSP在∑上生成的字符串s，符号导数φs:∑？→ D（|∑|- 1）定义为：φs（x）i=#sxσiPσi∈∑#sxσi（48）因此，十、∈ Σ?, φs（x）是∑上的概率分布。φs（x）被称为x处的符号导数气∈ Q、 eπ诱导∑上的概率分布为[eπ（qi，σ），··，eπ（qi，σ|∑|）]。我们表示这个aseπ（qi，·）。下一步，我们展示了x处的符号导数可以用来估计qi=[x]的这个分布，前提是x是-同步。定理3(-收敛）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-5-6 09:08:13

如果x∈ Σ?是-同步，然后： > 0，林| s|→∞||φs（x）-eπ（[x]，·）||∞a、 s （49）证明：我们使用Glivenko-Cantelli定理[39]研究经验分布的一致收敛性。因为x是-正在同步： > 0, θ ∈ E||十、- θ||∞5. （50）回想一下E=工程安装∈ [01]| Q |，i=1，···，| Q|表示满足Q:ei | j的分布集=1，如果i=j0，否则（51）让x-同步到q∈ Q.因此，当我们遇到x个whilereading s时，我们被保证分布在Q上x、其中：||十、- θ||∞5. => x=αθ+（1- α） u（52）其中α∈ [0, 1], α = 1 - , u是q的未知分布。定义Aα=αeπ（q，·）+（1）- α） P | Q | j=1ujeπ（qj，·），我们注意到φs（x）是Aα的经验分布，这意味着：lim | s|→∞||φs（x）-eπ（q，·）||∞= 林氏|→∞||φs（x）- Aα+Aα-eπ（q，·）||∞a、格里文科·坎特利兹|{lim | s |的s.0|→∞||φs（x）- Aα||∞+ 林氏|→∞||Aα-eπ（q，·）||∞a、 s（1）- α）（| | eπ（q，·）- u||∞)a、 s这就完成了证明。推论2（定理3的右延拓）-同步字符串）。如果x∈ Σ?是-那么同步呢σ ∈ ∑，这样xσ-与同步= C, 和Cis有限常数：C，maxqi，qj∈Q、 σ∈∑s.t.eπ（qj，σ）>0eπ（qi，σ）eπ（qj，σ）<∞ （53）证明：让x∈ Σ?是-同步。定义10意味着：θ ∈ E||十、- θ||∞5. （54）我们注意到，如果Nerode关系只有一个等价类（即，基本的最小PFSA只有一个状态），那么每个σ的结果都是真的∈ Σ. 因此，我们假设基本PFSA的最低实现有多个状态。在不失概括性的情况下，让θi？=1，暗示（定义10）：x|i？>1.- （55）由于我们假设基础PFSA是强连接的，因此存在σ∈ ∑使得δ（qi？，σ），qi？，andeπ（qi？，σ）>0。Wecomputexσ显式，使用等式。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝