强化学习

维基百科,自由的百科全书
跳转至: 导航搜索

强化学习机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。和博弈论有密切的关系,也是多主体系统学习的常用方法。