康老师

蒙特卡洛树搜索的主要流程有

2018-01-30 分类:百科

TIPS:本文共有 263 个字,阅读大概需要 1 分钟。

蒙特卡罗树搜索(Monte Carlo Tree Search)并不是一种"模拟人"的算法。而是通过随机的对游戏进行推演来逐渐建立一棵不对称的搜索树的过程。可以看成是某种意义上的强化学习,当然这一点学界还有一些争议。

蒙特卡罗树搜索大概可以被分成四步。选择(Selection),拓展(Expansion),模拟(Simulation),反向传播(Backpropagation)。

在开始阶段,搜索树只有一个节点,也就是我们需要决策的局面。

搜索树中的每一个节点包含了三个基本信息:代表的局面,被访问的次数,累计评分。

小编精心整理的这篇内容:蒙特卡洛树搜索的主要流程有,如果你看到此处请一定要收藏哦!

阅读剩余内容
网友评论
相关阅读
小编推荐