首先我不明白这里提到的期望\mathbb{E}的具体类型(是前面出现的\mathbb{E}_{S_t}或者就是\mathbb{E})。 如果是\mathbb{E}的话,那么我对该处的\mathbb{E}_{S_t}期望的处理存在疑惑,这个期望\mathbb{E}_{S_t}的运算能与\mathbb{E}合并吗? 该处得到最终收敛率O(\frac{LB^2\Delta}{\epsilon})的...