强化学习
维基百科,自由的百科全书
跳转至:
导航
、
搜索
本条目
需要擴充。
(2012年11月12日)
请協助
改善这篇條目
,更進一步的信息可能會在
討論頁
或
扩充请求
中找到。请在擴充條目後將此模板移除。
强化学习
是
人工智能
中
策略学习
的一种,基于预期最大利益原则。和
博弈论
有密切的关系,也是
多主体系统学习
的常用方法。
2个分类
:
机器学习
人工智能
1个隐藏分类:
自2012年11月扩充中的条目
导航菜单
个人工具
创建账户
登录
名字空间
条目
讨论
不转换
变换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
马新简体
台灣正體
查看
阅读
编辑
查看历史
操作
搜索
导航
首页
分類索引
特色内容
新闻动态
最近更改
随机条目
帮助
帮助
维基社群
方针与指引
互助客栈
询问处
字词转换
IRC即时聊天
联系我们
关于维基百科
资助维基百科
工具
链入页面
相关更改
上传文件
特殊页面
打印页面
永久链接
页面信息
引用本页
其他语言
Български
Česky
Deutsch
English
Suomi
Français
עברית
Italiano
日本語
한국어
Bahasa Melayu
Norsk bokmål
Русский
Tiếng Việt
编辑链接