致力于电脑围棋程序的开发
发新话题
打印

MC-UCT的delphi实现

动态数组的运行效率当然不是最高的,不用怀疑

不过,还不至于低到它对效率的影响会高过模型架构设计的影响,这是我的体会,短板不在数据结构上,也不在编程范式上(结构化还是OO),而在模型设计上.

TOP

没错!

不错!

TOP

最近也没有人再谈算法的改进了?

这个算法是有前途的,最近没有人再来谈这个算法?

TOP

源程序三篇之一

除了算法原理的帖子外,这一篇算是最有价值的三篇之一源程序delphi帖子了!
可惜,现在已经无人讨论!

TOP

有个问题,我看到的公式是UCBi=Xi+ sqrt(2*ln(N)/Ti)与楼主的程序中的公式后半部分差个1/sqrt(10)倍。这是为什么呢?

还有这优先扩展新节点。我认为有点不妥,看了一份MOGO的资料。嗯,图片不让发,只能发文字了
Starting with playing all arms is not optimal; Let c a default
constant. Let X such that
X = X +……(这是那个UCB公式)
X = c if T = 0;
Choose the highest X .
Empirically c ≈ 1 → +50 ELO.

[ 本帖最后由 vilinov 于 2009-3-10 10:49 编辑 ]

TOP

这只是最基本的代码!

<P>这只是最基本的代码!其实,如果要让程序能提高效率,必须进行适当的剪技!</P>
<P>但是MC本身就是随机模拟的,如果剪得历害,反而会严重降低效率,有些点照顾不到!</P>
<P>至于UCB与UCT的区别,差10倍我看不是大问题,这个公式本身我没有细研究过!是直接抄的!</P>

TOP

请问这什么意思?

请问这什么意思?

TOP

发新话题
最近访问的版块