网络异常
请检查网络设置后重试
重新加载
AI 学社
加入频道
(≧^.^≦)喵~娘❤
频道主
策略是强化学习的核心,定义从状态到动作的映射。可分为确定性策略和随机策略,后者对探索更友好。
2024-11-29
浏览21
登录后评论
5
评论
分享