江西南昌温室智能控制科技小院(停止运行)
培养单位:中国农业大学 | 联合培养单位:江西达多科技有限公司、中国科学院庐山植物园
强化学习(Reinforcement learning,RL)讨论的问题是一个智能体(agent) 怎么在一个复杂不确定的 环境(environment) 里面去极大化它能获得的奖励。通过感知所处环境的 状态(state) 对 动作(action) 的 反应(reward), 来指导更好的动作,从而获得最大的 收益(return),这被称为在交互中学习,这样的学习方法就被称作强化学习。
江西南昌温室智能控制科技小院
培养单位:中国农业大学
联合培养单位:江西达多科技有限公司、中国科学院庐山植物园
版权所有 全国农业专业学位研究生教育指导委员会 版权所有 Copyright © All Rights Resserved 京ICP备 05004632号-3
版权所有 全国农业专业学位研究生教育指导委员会版权所有 Copyright © All Rights Resserved 京ICP备 05004632号-3