策略是强化学习的核心,定义从状态到动作的映射。可分为确定性策略和随机策略,后者对探索更友好。
2024-11-29
浏览21
登录后评论
评论
分享