本书主要研究如何通过新型函数近似技术提升大规模强化学习器的性能。本书首先分析了传统的函数近似技术,如Tile编码与Kanerva编码在处理大规模问题性能不佳的原因,即原型冲突与不均匀的原型访问频率分布。为了解决这些问题,本书分别应用自适应Kanerva函数近似、模糊逻辑函数近似与基于粗糙集的函数近似等方法对强化学习中的函数近似方法进行改进。本书还将以上函数近似方法分别应用于强化学习中不同难度的捕食者-猎物追逐问题与认知无线电网络应用问题,以此进行验证。实验结果表明:本书所提方法不仅提高了类似问题的求解率,同时减少了所需原型数量,最终显著提高了函数近似技术解决大规模强化学习与多智能体问题的有效性。
展开