大种群随机动态博弈:闭环Mckean-Vlasov系统和纳什确定性等价原理。公社。信息系统。6 (3), 221–252.Kingma,D.P.,Ba,J.,2014年。ADAM:一种随机优化方法。arXiv预印本arXiv:1412.6980。Lasry,J.-M.,Lions,P.-L.,2007年。平均场比赛。《日本数学杂志》2(1),229–260。默顿,R.,1971年。在连续的时间框架内优化消费和投资组合规则。经济理论杂志。默顿,R.C.,1969年。不确定性下的终身投资组合选择:连续时间案例。《经济学与统计评论》,247–257。Pham,H.,2009年。金融应用中的连续时间随机控制与优化。第61卷。施普林格科学与商业媒体。Shalev Shwartz,S.,Ben David,S.,2014年。理解机器学习:从理论到算法。剑桥大学出版社。Sirignano,J.,Spiliopoulos,K.,2018年。DGM:解偏微分方程的深度学习算法。arXiv预印本arXiv:1708.07469。Srivastava,R.K.,Greff,K.,Schmidhuber,J.,2015年。公路网。arXiv预印本arXiv:1505.00387。Touzi,N.,2012年。最优随机控制、随机目标问题和反向SDE。第29卷。施普林格科学与商业媒体。