机读格式显示(MARC)
- 000 01641cam0 2200361 450
- 010 __ |a 978-7-111-56960-2 |d CNY69.00
- 092 __ |a CN |b 人天789-3016
- 099 __ |a CAL 012017115931
- 100 __ |a 20170724d2017 em y0chiy50 ea
- 200 1_ |a 多智能体机器学习 |A duo zhi neng ti ji qi xue xi |e 强化学习方法 |f (加) 霍华德 M. 施瓦兹著 |g 连晓峰, 谭励等译
- 210 __ |a 北京 |c 机械工业出版社 |d 2017
- 215 __ |a 185页 |c 图 |d 24cm
- 314 __ |a 责任者Schwartz规范汉译姓: 施瓦茨
- 330 __ |a 本书主要介绍了多智能体机器人强化学习的相关内容。全书共6章,首先介绍了几种常用的监督式学习方法,在此基础上,介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后,介绍了双人矩阵博弈问题、多人随机博弈学习问题,并通过3种博弈游戏详细介绍了纳什均衡、学习算法、学习自动机、滞后锚算法等内容,并提出LR-I滞后锚算法和指数移动平均Q学习算法等,并进行了分析比较。接下来,介绍了模糊系统和模糊学习,并通过仿真示例详细分析算法。后,介绍了群智能学习进化以及性格特征概念和应用。
- 500 10 |a Multi-agent machine learning : a reinforcement approach |m Chinese
- 517 1_ |a 强化学习方法 |A qiang hua xue xi fang fa
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _1 |a 施瓦茨 |A shi wa ci |g (Schwartz, Howard M.) |4 著
- 702 _0 |a 连晓峰 |A lian xiao feng |4 译
- 702 _0 |a 谭励 |A tan li |4 译
- 801 _0 |a CN |b CAU |c 20171030
- 905 __ |a CAU |d TP181/35