具体是怎么推导的我有点忘了,但是可以这么想:
比如,我现在只要O(x-x0)的精度,以f(x)在x0这点一阶和两阶求导都大于零为例(其他情况类似):
f(x) = f(x0) + f'(x0)*(x-x0) +O(x-x0)
对于这项O(x-x0)的余项就是0.5*f''(theta)*(x-x0)^2, x0<theta<x。因为f(x0)+f'(x0)*(x-x0)+0.5*f''(x0)*(x-x0)^2比f(x)小,而f(x0)+f'(x0)*(x-x0)+0.5*f''(x)*(x-x0)比f(x)大,所以就取了一个theta介于x和x0之间。
O((x-x0)^n)以及多变量等的情况类似。