《金融与随机》,15:655–6832011。[6] C.折弯机。连续时间内多个行权期权的原始和双重定价。《金融数学杂志》(SIAMJournal on Financial Mathematics),2(1):562–5862011。[7] M.Binois、J.Huang、R.B.Gramacy和M.Ludkovski。复制还是探索?随机模拟实验的顺序设计。Technometrics,2018年。认可的。[8] 托马斯·比约克。连续时间套利理论。牛津大学出版社,2009年。[9] Phelim P Boyle、JeremyEvnine和StephenGibbs。多变量索赔的数值评估。《金融研究评论》,2(2):241–2501989。[10] 布罗迪先生和曹先生。通过模拟对美国期权定价的上下限算法进行了改进。《定量金融》,8(8):845–8612008年。[11] S.Bubeck、R.Munos和G.Stoltz。在全副武装和持续武装的强盗中进行纯粹的探索。《理论计算机科学》,412(19):1832–18522011。[12] S.Bubeck、R.Munos、G.Stoltz和C.Szepesvari。X武装匪徒。《机器学习研究杂志》,12:1655–16952011。[13] J.F.Carriere。使用模拟和非参数回归对期权的早期行权价格进行估值。保险:数学。经济体。,19:19–30, 1996.[14] H.A.奇普曼、E.I.乔治和R.E.麦卡洛赫。BART:贝叶斯加性回归树。《应用统计年鉴》,4(1):266–2982010。[15] F.Chollet等人,Keras。https://keras.io, 2015.[16] T.Dozat。将nesterov momentum纳入adam,2016年。[17] W.E,J.Han和Q.Li。深度学习的平均场最优控制公式。Res.Math。Sci。,6:10, 2019.[18] V.Gabillon、M.Ghavamzadeh、A.Lazaric和S.Bubeck。多强盗最佳武器识别。《神经信息处理系统的进展》,第2222–22302011页。[19] L.Gouden\'ege、A.Molent和A.Zanette。