单项选择题
A.博弈过程中,博弈方以非概率形式随机从可选收益中选择一个收益,而达到的纳什均衡被称为混合策略纳什均衡B.博弈过程中,博弈方以概率形式随机从可选收益中选择一个收益,而达到的纳什均衡被称为混合策略纳什均衡C.博弈过程中,博弈方通过概率形式随机从可选策略中选择一个策略而达到的纳什均衡被称为混合策略纳什均衡D.博弈过程中,博弈方通过非概率形式随机从可选策略中选择一个策略而达到的纳什均衡被称为混合策略纳什均衡
A.静态博弈与动态博弈B.完全信息博弈与不完全信息博弈C.合作博弈与非合作博弈D.囚徒困境与纳什均衡
A.动态规划与Q-LearningB.策略优化与策略评估C.Q-learning 与贪心策略优化D.价值函数计算与动作-价值函数计算