问答题

There are two optimal policies for Dynamic Programming, one is ____, and the other is policy iteration.
动态规划有两种优化策略，一个是_，而另一种是策略迭代。

【参考答案】

value iteration 值迭代

<上一题目录下一题>

热门试题

单项选择题

一病人因咯血入急诊，你考虑可能的病变部位包括 A、口腔 B、支气管 C、心血管 D、鼻腔

单项选择题

‍汪曾祺的语言特点是？‏

A．抑扬顿挫，形成一个独特的语流
B．夹叙夹议，形成一个独特的语流
C．骈散结合，形成一个独特的语流.
D．偶句、单句的组合，形成一个独特的语流

相关试题