单项选择题

在强化学习中，什么是“策略”（）？

A.智能体选择的动作序列
B.智能体根据状态选择动作的规则
C.智能体获得的累积奖励
D.智能体与环境交互的次数

<上一题目录下一题>

热门试题

单项选择题

以下哪个不是谱聚类的主要步骤（）？

A.构建相似度矩阵
B.计算拉普拉斯矩阵
C.对拉普拉斯矩阵进行特征分解
D.使用K-means 对特征向量进行聚类

单项选择题

在K-means 算法中，初始聚类中心的选择对结果有何影响（）？

A.没有影响
B.可能导致局部最优解
C.一定导致全局最优解
D.使算法收敛速度更快

相关试题