单项选择题

在强化学习中,什么是“策略”()?

A.智能体选择的动作序列
B.智能体根据状态选择动作的规则
C.智能体获得的累积奖励
D.智能体与环境交互的次数

<上一题 目录 下一题>
热门 试题

单项选择题
以下哪个不是谱聚类的主要步骤()?

A.构建相似度矩阵
B.计算拉普拉斯矩阵
C.对拉普拉斯矩阵进行特征分解
D.使用K-means 对特征向量进行聚类

单项选择题
在K-means 算法中,初始聚类中心的选择对结果有何影响()?

A.没有影响
B.可能导致局部最优解
C.一定导致全局最优解
D.使算法收敛速度更快

相关试题
  • 数量归约中无参数的方法一般使用()。
  • 图像数据标注可以用于()算法中。
  • 度量泛化能力的好坏,最直观的表现就是模型...
  • 反向传播算法和梯度下降算法在神经网络训练...
  • 在自然语言处理任务中,哪些技术适用于提升...