问答题
There are two optimal policies for Dynamic Programming, one is ______________, and the other is policy iteration.
动态规划有两种优化策略,一个是___________,而另一种是策略迭代。
【参考答案】
value iteration 值迭代
点击查看答案
<上一题
目录
下一题>
热门
试题
单项选择题
一病人因咯血入急诊,你考虑可能的病变部位包括 A、口腔 B、支气管 C、心血管 D、鼻腔
点击查看答案
单项选择题
汪曾祺的语言特点是?
A.抑扬顿挫,形成一个独特的语流
B.夹叙夹议,形成一个独特的语流
C.骈散结合,形成一个独特的语流.
D.偶句、单句的组合,形成一个独特的语流
点击查看答案
相关试题
在常用螺纹中,效率最低、自锁性最好的是_...
This is the _____ thinking: a...
提高螺纹连接强度的措施有哪些?
圆柱槽摩擦传动机构压紧力较圆柱平摩擦传动...
前角选择的原则是:在刀具强度允许的条件下...