小院资源-全国科技小院服务管理平台

当前位置：小院首页　>　小院资源

强化学习基础

发布时间：2024-11-14

强化学习（Reinforcement learning，RL）讨论的问题是一个智能体(agent) 怎么在一个复杂不确定的环境(environment) 里面去极大化它能获得的奖励。通过感知所处环境的状态(state) 对动作(action) 的反应(reward)，来指导更好的动作，从而获得最大的收益(return)，这被称为在交互中学习，这样的学习方法就被称作强化学习。

江西南昌温室智能控制科技小院

培养单位：中国农业大学

联合培养单位：江西达多科技有限公司、中国科学院庐山植物园

所属地区：江西省南昌市
详情地址：
联系电话：15529506617

返回全国科技小院服务平台

全国科技小院

当前位置：小院首页　>　小院资源

强化学习基础

发布时间：2024-11-14