搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
无库存
强化学习实战——从零开始制作AlphaGo围棋(微课视频版)
0.00     定价 ¥ 69.90
泸西县图书馆
此书还可采购1本,持证读者免费借回家
  • ISBN:
    9787302629696
  • 作      者:
    刘佳
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2023-04-01
收藏
目录

第一部分计算机围棋的基础知识和传统的智能算法


第1章围棋: 黑白的世界


1.1什么是围棋


1.2围棋的规则


1.3胜负的判定


1.4围棋棋手的棋力


1.5计算机眼中的围棋


1.5.1SGF文件


1.5.2GTP


第2章实现一个围棋软件


2.1软件版本


2.2围棋软件的组成


2.3佐布里斯特散列


2.4围棋智能体


2.5围棋的棋盘


2.6引入裁判


2.7让智能体下棋


第3章传统的棋类智能


3.1极小化极大算法


3.2AlphaBeta剪枝算法


3.3棋类局面评估


3.4蒙特卡罗模拟


3.4.1蒙特卡罗算法


3.4.2蒙特卡罗树搜索


3.4.3蒙特卡罗算法改进


3.4.4需要注意的问题


3.5监督学习


3.6传统方法的讨论


第二部分基于神经网络的机器学习


第4章机器学习入门


4.1人工神经网络


4.1.1神经元


4.1.2常见的激活函数


4.1.3多层感知器


4.1.4卷积神经网络


4.1.5反向传播算法


4.1.6小批量训练法


4.1.7残差网络


4.1.8多层感知器的应用示例


4.1.9卷积网络对图片进行多分类的应用示例


4.2优化神经网络


4.2.1训练集、验证集、测试集以及交叉验证


4.2.2欠拟合与过拟合


4.2.3损失函数的正则化


4.2.4精确率和召回率的权衡


4.3其他人工智能方法简介


4.3.1K近邻算法


4.3.2朴素贝叶斯法


4.3.3决策树


4.3.4Boosting算法/Bagging算法


4.3.5支持向量机


4.3.6随机场算法


4.3.7传统智能算法所面临的挑战








第5章第一个围棋智能体


5.1电子围棋棋谱


5.2HDF5文件结构


5.3数据模型


5.4获取训练样本


5.5代码演示


第6章通用化围棋智能体程序


6.1在网络上发布围棋智能体


6.2本地对战


6.2.1计算机的围棋语言


6.2.2围棋的对弈图形界面


6.2.3围棋引擎


6.3让围棋智能体自己去网上下棋


第三部分强化学习


第7章策略梯度


第8章深度价值网络


8.1传统的QLearning算法


8.1.1原始版QLearning


8.1.2原始版QLearning计算时的优化


8.1.3QLearning的变种Sarsa


8.1.4Sarsa的进化Sarsaλ


8.2在神经网络上应用DQN


第9章ActorCritic算法


第10章AlphaGo和AlphaZero


10.1AlphaGo的结构和训练流程


10.2AlphaZero的结构与训练流程


10.3可行的优化


附录AKeras入门


附录BPyTorch入门


附录C反向传播算法


C.1命名约定


C.2正文


C.3进一步讨论


C.4拓展


附录D不同地区的围棋规则


D.1中国规则


D.2日本规则


D.3应氏规则


D.4新西兰规则


D.5美国规则


D.6智运会规则


D.7TrompTaylor规则



展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用泸西县图书馆的读者帐号和密码进行登录

点击获取验证码
登录