单项选择题
A.小数据集、相似数据B.小数据集、不相似数据C.大数据集、相似数据D.数据集、相似数据
A.强化学习算法的组合B.强化学习算法与监督学习算法的集成C.强化学习算法与无监督学习算法的集成D.强化学习算法与半监督学习算法的集成
A.一种用于优化策略的方法B.一种用于计算状态值的方法C.一种用于选择动作的规则D.一种用于表示环境模型的数据结构