强化学习

维基百科,自由的百科全书
跳转至: 导航搜索

强化学习人工智能策略学习的一种,基于预期最大利益原则。和博弈论有密切的关系,也是多主体系统学习的常用方法。