复杂随机过程的简单介绍-
在我关于该主题的第一篇文章(请参阅此处)中,我介绍了华尔街数据科学家使用的一些复杂的随机过程,该过程采用的是一种简单的方法,只有统计课程101之类的第一门课程的人才能理解。我通过离散随机游走的近似值定义并说明了连续布朗运动(所有这些随机过程的母亲),简单地适当地重新缩放X轴和Y轴的比例,并使时间增量(X轴)更小并且较小,因此限制过程是时间连续的。无需使用任何复杂的数学原理(例如测量理论或过滤条件)即可完成此操作。
在这里,我将更进一步,使用基本数学介绍此类过程的积分和导数。我在该主题上找到的所有文章都充满了复杂的方程式和公式。这里不是这样。我不仅用简单的英语解释了该材料,而且还提供了图片以显示“集成布朗运动”的样子(我在文献中找不到这样的插图),如何计算其方差以及着重于应用程序,尤其是针对数论,金融科技和密码学问题。在此过程中,我将在理论但基本的框架中(同样是图片)讨论移动平均值,并讨论这些(时间连续或离散)时间序列的最佳窗口应为什么。
1.总体框架
就像我在上一篇文章中一样,我们将时间连续过程定义为时间离散过程的极限。时间离散过程称为基本过程。基本示例如下:
从离散的随机变量U(k)开始,k = 1、2,依此类推(基本过程),这些变量独立且相等地分布,均值等于0。通常,时间序列{ U(k)}是a白噪声。
定义X(n)= U(1)+ ... + U(n)
标准化X(n),以使其方差不依赖于n,即引入Y(n)= X(n)/ SQRT(n)。此步骤包括重新缩放Y轴。
重新缩放时间轴(X轴),以使时间增量现在等于1 / n而不是1,并且让n趋于无穷大。随着n趋于无穷大,Y(n)的极限变量表示为Z(1)。在时间的值吨(吨是连续的这个时间)的限制值?(INT(NT)),为?趋于无穷大,其中INT是整数部分的功能,并且它被表示为?(吨)。
随机变量{ Z(t)}的集合定义了结果,时间连续,适当重新定标的随机过程。在这种情况下,Var [ Z(t)] = t Var [ U(1)]。还?(吨)具有高斯分布,由施工并凭借的中心极限定理。此过程称为布朗运动。初始随机变量U(k)可以是高斯,或者在{-1,+1}上是统一的,或者在[-1,+1]上是统一的。不要紧。请参阅此处的插图。
这个过程到处都是连续的,但无处可区别。因此,构建从{ Z(t)}派生但更平滑(可在任何地方微分)的过程的想法。我们介绍了两种可满足此目标的过程类型:
累积或集成过程{小号(吨)}衍生自{ ?(吨)}
理论移动平均处理{中号(T) }衍生自{ ?(吨)}
最后,我们还将积分的逆运算定义为微分。在分化过程的小号(吨)是?(吨)。实际上,更平滑的(积分或移动平均值)过程更易于研究,有时显示原始过程中无法识别的模式。上一节将对此进行更多介绍。
2.积分,移动平均和微分过程
在这里,我们定义了三种将随机过程转变为另一种过程的方法,希望对解释和决策制定比原始过程更有用:积分,微分和移动平均。在所有这三种情况下,构造均遵循相同的原理:在上一节中描述的布朗运动的构造中,将X(n)= U(1)+ ... + U(n)替换为X(n)= V( 1)+ ... + V(n),其中V(k)会在下面针对每个转换进行说明。我们还将讨论使该方法在数学上更强大的一些挑战。
集成过程,构造:V(k)= U(1)+ ... + U(k)。
微分过程,构造:V(k)= U(k +1)-U(k)。如果{ Z(t)}是引言中描述的布朗运动,则产生的过程是白噪声:连续无处可微。
移动平均过程,构造:V(k)= U(k)+ U(k + 1)+ ... + U(k + h(k))其中h(k)尽可能小以使结果过程到处都是连续且可区分的。对于布朗运动, h(k)= SQRT(k)有效。确实?(?)=日志(?)工作?这将使生成的过程与原始过程更加相似,但可能几乎(如果有的话)是连续的-换句话说,比h(k)= SQRT(k)更混乱 。
挑战性
由于以下原因,需要从理论的角度进一步研究上述一般施工过程:
派生过程是否取决于U(1),U(2)等?事实并非如此。这个问题对于差异化流程尤其重要。
差异化运营真的是整合的逆转吗?
我对微分和集成过程的定义是否与文献中发现的高度技术定义兼容或相等?
适当的重新缩放和方差计算
在构造微分,积分或移动平均过程时,需要调整通用框架的第二步(请参阅第一部分)以使事情正确。简而言之,您必须保持X(n)的方差不依赖于n,因为n趋于无穷大。让我们向您展示它如何用于集成布朗运动。在这种情况下,对于集成过程,我们有:
从而,
因此,在这种情况下,当n趋于无穷大时, Y轴的适当缩放系数为Y(n)= X(n)/ SQRT(n ^ 3/3)。使用类似的论点,可以轻松证明
同样,出于与第一部分所述相同的原因,S(t)具有高斯分布。相同的逻辑适用于计算Var [ M(t)]。细节留作练习。更为复杂的练习包括计算s > 0时S(t)和S(t -s)之间的协方差,并证明{ S(t)}本身不是布朗运动(与布朗运动不同,在任何地方都是可微的)。
图1:布朗运动实现(蓝色)及其移动平均值(红色)
在图1和2中,X轴表示时间轴,介于0和1之间。布朗运动在任何地方都是连续的,而在任何地方都是微分的。相反,移动平均和集成过程在任何地方都是连续且可区分的。
图2:布朗运动实现(蓝色)及其集成过程(绿色)
3.在数论中的应用
这里的目的是研究对大素数的p和q 与p < q,用于设计密码密钥米= PQ。这些质数中的一些素数显示出很强的模式,使其不适合在高度安全的密码系统中使用,从而使得分解m的难度降低。 如果精心选择p和q,则分解两个大质数的乘积,每个质数都有数百个数字,通常是一个棘手的问题。换句话说,我们正在寻找素数p和q不像典型的大质数那么“随机”(或者换句话说,强度不那么强)。分解因数m使您可以破解密码系统中的密钥,您需要通过仔细选择p和q来精确避免这种情况。
我们在这里讨论这种不良对的一个示例,即p = 1879和q =3803。我们使用与第一部分中概述的相同的构造技术,从而导致一个过程看起来像布朗运动,直至t的某个值,然后在此时间范围内,很早就在时间范围内突然表现出两次大震动。
基本过程{ U(k)}(请参见第一部分)由
公式中的方括号表示整数部分函数。使用在第一部分中描述的技术创建的结果过程{ Z(t)}是直到k = SQRT(m)发生的直至第一颠簸的布朗运动。第二个抖动发生在k = q处。请注意,对于小k,{ U(k)}让人想起各种系统中的数字表示形式,如本文所述。在其他示例中,有趣的震荡发生在k = p(较小的素数)处。在大多数情况下,没有发现明显的模式。
图3:布朗运动直到第一次颠簸;第二个震动,用于破坏加密密钥
图3基于前25
题库