单项选择题
A.智能体可以随时选择任何动作B.环境的动态会随时间改变C.下一个状态只取决于当前状态和采取的动作D.智能体可以看到完整的状态空间
A.图像与图像叠加B.样本与样本叠加C.特征与特征叠加D.标签与标签叠加
A.监督学习B.无监督学习C.半监督学习D.策略梯度