神经量子态
现代理论物理学中最具挑战性的问题之一就是所谓的多体问题。典型的多体系统由大量强相互作用的粒子组成。很少有这样的系统适合精确的数学处理,并且需要数字技术来取得进步。但是,由于指定通用多体量子态所需的资源成倍地取决于系统中粒子的数量(更确切地说,取决于自由度的数量),因此即使是当今最好的超级计算机也缺乏足够的能力来精确编码此类状态(它们只能处理相对较小的系统,粒子少于?45个)。
就像我们将看到的那样,机器学习技术(特别是人工
神经网络)的最新应用已被证明可以提供这种复杂状态的高效表示,从而使它们的压倒性复杂性在计算上易于处理。
在本文中,我将讨论如何应用(一种)人工神经网络来表示许多粒子的量子态。本文将分为三个部分:
基本量子力学概念的鸟瞰图。
机器学习概念的简要说明,特别关注一种称为受限玻尔兹曼机(RBM)的人工神经网络
一种解释如何使用RBM表示多粒子量子态。
序言
阿尔伯特·爱因斯坦(Albert Einstein)的科学合作者之一,波兰物理学家利奥波德·英菲尔德(Leopold Infeld)在自传中讲述了一个有趣的故事。
爱因斯坦的家中的爱因斯坦和因费尔德(来源)。
根据英菲尔德的说法,在两位物理学家花了几个月的时间进行冗长而艰苦的计算之后,爱因斯坦将发表以下评论:
“上帝[自然]不在乎我们的数学难题。他凭经验进行整合。”
-爱因斯坦(1942)。
爱因斯坦的意思是,尽管人类必须诉诸复杂的计算和符号推理来解决复杂的物理问题,但自然并不需要。
快速说明:爱因斯坦在这里使用了“积分”一词,因为许多物理理论是使用称为“微分方程”的方程式来拟定的,要找到此类方程式的解,必须应用“积分”过程。
多体问题
如导言所述,理论物理学中一个众所周知的难题是多体问题。这个问题在经典系统(基于牛顿运动及其精细化三定律的物理系统)和量子系统(遵循量子力学定律的系统)中都进行了很长时间的研究。
首先要广泛研究的(经典)多体问题是涉及地球,月球和太阳的三体问题。
具有相等质量的三体系统的简单轨道。
最早解决这种多体问题的科学家之一就是伊萨克·牛顿(Issac Newton)的杰作《数学原理》(Principia Mathematica):
“每当一颗行星旋转,它就会追踪一个新的轨道[...],每个轨道都取决于所有行星的联合运动,更不用说它们彼此之间的作用了[...]。除非我很误会,否则要同时考虑这么多运动原因,并通过精确的定律来定义运动,这将超出容易的计算范围。
-艾萨克·牛顿(1687)
牛顿的《数学原理》,可以说是历史上最重要的科学著作。
由于基本上所有相关的物理系统都是由相互作用粒子的集合组成的,因此多体问题非常重要。
可怜的人的定义
可以将问题定义为“研究物体之间的相互作用对多物体系统行为的影响”。
金离子的碰撞产生了夸克-胶子等离子体,这是一种典型的多体系统。
在这种情况下,“许多”的含义可以是从三到无限。在最近的一篇论文中,我和我的同事表明,对于N = 5的自旋激发,已经可以找到量子多体行为的特征(下图)。
一种自旋系统(XX模型)的状态密度。随着自旋激发的数量从2增加到5,将达到高斯分布(具有2体耦合的多体系统的典型值)。
在本文中,我将重点介绍自2013年以来一直是我研究的主要话题的量子多体问题。
量子多体系统
量子多体系统的复杂性已经在1930年代被物理学家确定。大约那个时候,伟大的物理学家保罗·狄拉克(Paul Dirac)设想了量子力学中的两个主要问题。
英国物理学家保罗·狄拉克(Paul Dirac)。
根据他的说法,第一个是“与相对论思想的理论的精确匹配有关”。第二个是“这些[量子]定律的精确应用导致方程过于复杂而无法解决”。第二个问题正是量子多体问题。
幸运的是,许多物理系统的量子态可以用比希尔伯特空间最大容量大的信息来描述。通过包括已知的量子蒙特卡洛(QMC)方法在内的多种数值技术来利用这一事实。
量子波函数
简而言之,量子波函数以数学方式描述了量子系统的状态。最早接受精确数学处理的量子系统是氢原子。
在氢原子中找到电子的概率(由亮度表示)。
通常,量子状态由复数概率幅度Ψ(S)表示,其中自变量S包含有关系统状态的所有信息。例如,在旋转1/2链中:
一维自旋链:每个粒子在z轴上都有一个σ值。
从Ψ(S),可以得出与在系统上进行测量相关的概率。例如,Ψ(S)的平方模(一个正实数)给出与Ψ(S)相关的概率分布:
哈密??顿算子
量子系统的性质由系统的哈密顿算子H封装。后者是两个术语的总和:
系统中所有粒子的动能及其运动
系统中所有粒子的势能,与粒子相对于其他粒子的位置有关。
量子系统的允许能级(其能谱)可以通过求解所谓的薛定inger方程来获得,该方程是描述量子力学系统行为的偏微分方程。
奥地利物理学家Erwin Schrodinger,量子力学之父之一。
Schr?dinger方程的时间独立版本由以下特征值系统给出:
特征值和对应的本征态为
最低能量对应于系统的所谓“基态”。
一个简单的例子
为了具体起见,让我们考虑以下示例:量子谐波振荡器。QHO是经典谐波振荡器的量子力学对应物(请参见下图),该系统在从初始位置位移时会受到力,从而将其恢复到平衡位置。
质量弹簧谐波振荡器
下面的动画比较了简单谐波振荡器的经典概念和量子概念。
描述量子谐波振荡器(Wiki)的波动函数。
虽然在明确定义的轨迹中的简单振荡质量表示经典系统(上图中的块A和B),但相应的量子系统由复波函数表示。在每个块中(从C开始),都有两条曲线:蓝色的一条是the的实部,红色的一条是虚部。
量子自旋系统的鸟瞰图
在量子力学中,自旋可以大致理解为粒子和原子核所携带的“角动量的本征形式”。尽管将旋转看作是粒子绕其自身轴的旋转是很直观的,但此图片并不完全正确,因为那时粒子将以比光速更快的速度旋转,这会违反基本的物理原理。如果事实自旋是没有经典对应物的量子力学对象。
多体系统的示例:自旋杂质通过原子链传播
量子自旋系统与磁性现象密切相关。磁铁是由原子组成的,原子通常是小磁铁。当这些原子磁体变为平行取向时,它们便产生了我们熟悉的宏观效应。
磁性材料通常会显示自旋波,从而以磁性顺序传播干扰。
现在,我将以一种有助于读者理解它们与量子系统的联系的方式,快速总结一下
机器学习算法的基本组成部分。
机器学习=机器+学习
机器学习方法有两个基本组成部分(Carleo,2017):
该机器,这可能是例如使用参数的人工神经网络Ψ
使用例如随机优化算法执行的参数W的学习。
机器学习的两个组成部分。
神经网络
人工神经网络通常是非线性多维嵌套函数。他们的内部工作只能通过试探性的方式来理解,而对他们的结构进行调查并不能产生关于其近似功能的见解。
具有两个隐藏层的简单人工神经网络。
由于网络参数和所近似的数学函数之间没有明确的连接,因此人工神经网络通常被称为“黑匣子”。
什么是受限玻尔兹曼机?
受限玻尔兹曼机是生成随机神经网络。它们具有许多应用程序,包括:
协同过滤
降维
分类
回归
特征学习
主题建模
RBM属于一类模型,称为“基于能源的模型”。它们不同于其他(更流行的)神经网络,后者基于输入来估计值,而RBM估计输入的概率密度(它们估计许多点而不是单个值)。
RBM具有以下属性:
它们是浅层网络,只有两层(输入/可见层和隐藏层)
它们的隐藏单位h和可见(输入)单位v通常为二进制值
有一个与隐藏单元和可见单元之间的连接相关的权重矩阵W
偏置项有两个,一个表示由a表示的输入单元,一个表示由b表示的隐藏单元。
每种配置都有一个相关的能量函数E(v,h),在训练过程中将其最小化
他们没有输出层
没有层内连接(这是“限制”)。对于给定的一组可见单元激活,隐藏的单元激活是相互独立的(相反也成立)。此属性极大地方便了分析。
要最小化的能量函数由下式给出:
式1:RBM使能量功能最小化。
可见和隐藏单元的联合概率分布为:
式2:总概率分布。
归一化常数Z称为分区函数。找出隐藏的单位,我们获得可见(输入)向量的边际概率:
式3:输入单位的边际概率分布,
如前所述,鉴于给定的可见(隐藏)单元激活,隐藏(可见)单元激活是相互独立的,因此可以这样写:
式4:由于相互独立,条件概率成为乘积。
并且:
等式 5:与等式4相同。
最后,激活概率为:
式6:激活概率。
其中σ是S型函数。
培训步骤如下:
我们首先将可见单位状态设置为训练向量。
然后,使用等式6左侧的表达式来计算隐藏单元的状态。
在为隐藏单元选择状态后,将执行所谓的“重构”,根据等式6右侧的表达式将每个可见单元设置为1。
权重的变化方式为(素数变量为重构值):
RBM如何处理输入,一个简单的例子
以下分析主要基于此出色的教程。以下三个图显示了RBM如何处理输入。
一个简单的RBM处理输入。
在隐藏层的节点1处,输入x乘以权重w,加上偏置b,结果被馈送到激活中,从而将原点提供给输出a(请参见最左图)。
在中央图中,所有输入在隐藏节点1处合并,每个输入x乘以其对应的w。然后将乘积相加,加上偏差b,并将最终结果传递到激活函数中,从而产生来自隐藏节点1 的完整输出a
在第三张图中,输入x传递到隐藏层中的所有节点。在每个隐藏节点处,x乘以其相应的权重w。各个隐藏节点接收所有输入x的乘积,其权重为w。然后将偏差b添加到每个和,结果通过激活函数传递,从而为所有隐藏节点生成输出。
RBM如何学习重建数据
RBM执行不受监督的过程,称为“重建”。他们学会重建数据,以在其两层之间执行一连串的传递(前进和后退)。在向后传递中,如下图所示,隐藏层中节点的激活功能成为新的输入。
将这些输入与各个权重的乘积相加,并在每个输入节点处添加来自可见层的新偏差b。这些操作的新输出称为“重构”,因为它是原始输入的近似值。
自然,重建和原始输入首先是非常不同的(因为w的值是随机初始化的)。然而,由于错误对反复backpropagated Wˉˉ时,则逐渐减少。
因此,我们看到:
RBM在前向通道上使用输入来进行关于节点激活的预测,并以加权输入x 为条件来估计输出的概率分布。
在向后传递时,RBM尝试根据激活a来估计输入x的概率分布
结合两个条件分布,可以获得x和a的联合概率分布,即RBM学习如何近似原始数据(输入的结构)。
如何连接机器学习和量子系统?
在最近发表在《科学》杂志上的一篇文章中,有人提出可以将一个量子多体系统的量子波函数Ψ(S)视为一个黑盒,然后使用RBM对其进行近似。RBM 通过优化其参数来训练以表示Ψ(S)。
Carleo和Troyer(2017)使用的RBM编码自旋多体量子态。
问题是如何将作为特征值问题的(与时间无关)Schrodinger方程重新构造为机器学习问题。
变分方法
事实证明,答案已经存在了相当长的一段时间,它基于所谓的变分法,是波动方程的另一种表示形式,可用于获得量子系统的能量。使用这种方法,我们可以编写优化问题,如下所示:
其中E [Ψ]是取决于本征态和哈密顿量的泛函。解决此优化问题,我们既获得了基态能量,又获得了其相应的基态。
量子态和受限玻尔兹曼机
在Carleo和Troyer(2017)中,RBM用于表示量子态Ψ(S)。它们概括了RBM,以允许使用复杂的网络参数。
很容易证明能量函数可以写成
最后一个等号后的期望值的自变量是局部能量。然后使用随机重配置(SR)方法训练神经网络。相应的优化迭代为:
梯度下降更新协议。
其中η是学习率,S是随机重构矩阵,它取决于本征态及其对数导数。
Carleo和Troyer(2017)对自旋1/2的量子系统特别感兴趣,他们写出如下量子态:
在此表达式中,Ψ 的W参数是参数集:
其中a和b的成分是实数,但W可能很复杂。由于没有层内交互(RBMs体系结构的典型特征),因此可以隐藏(或追溯)隐藏变量,从而将上述表达式大大简化为:
要训??练量子波函数,请遵循上述针对RBM的类似过程。
令人印象深刻的准确性
下图显示了NQS基态能量估算的相对误差可忽略不计。每个图对应一个测试用例,该用例是具有已知精确解的系统。水平轴是隐藏单位的密度,即隐藏单位与可见单位之间的比率。请注意,即使隐藏单元相对较少,模型的准确性也已经非常令人印象深刻(百万分之一的误差!)
在三个测试案例中,模型基态能量相对于精确值的误差。
结论
在这篇简短的文章中,我们看到了受限的玻尔兹曼机器(RBM),一种简单的人工神经网络,可以用于以极高的精度计算许多粒子的量子系统的基态能量。
谢谢阅读!
一如既往,欢迎建设性的批评和反馈!

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!