134. 给你们来一个七定王 (第2/2页)

如果不考虑其中原理的话，它的外在反馈其实就是给定这样一个[19，19]的棋盘，希望程序可以在上面仅改变一个无子的数字0到给定的棋子类型(数字-1或者1)，同时使得该方获胜的概率尽可能地变大。

“棋盘就是一副黑白的单通道分辨率为19的图像。”这个事情在普通人看来比较不会想到。

不过对于比较熟悉图像技术和深度神经网络的孟繁岐来说，是很自然的事情和概念。

“我们从深度神经网络的突破中获得了灵感，在2012年底的AlexNet之前，疯狂石头这款围棋智能提供的准确率是最高的，达到35%左右。

目前主要是在研究，如何使用深度神经网络使得围棋智能的判断更加精准。

Alex和你引领的深度神经网络在分类问题上有了惊人的突破，这是我们今年启动这个项目的一大原因。

我们目前在尝试收集大量的专业对弈棋谱，目前已经有了十多万场比赛的内容。而从这十万多场比赛当中，又可以抽离出上百万个单次落子。

通过这个数据，我们现阶段在确立合适的网络结构，在这个方面，我想你是专家中的专家。”

“我大概了解了。”孟繁岐听完之后基本明白了DeepMind现阶段的想法和进展情况。

虽然此前黄博士在围棋AI项目上有过很多研究，但阿尔法围棋项目毕竟才刚刚开始，同时也是基于全新的深度网络技术。

目前为止，他们还没有形成一整套的学习以及对抗的思路，那一套策略网络-评估网络-强化学习-蒙特卡洛搜索的总体结构还没有成型。

还停留在比较早期的阶段，甚至还没有最后决定到底使用怎样的网络结构比较好，此时正在对模型本身的结构进行测试和设计。

“这方面确实是我比较擅长的方向，尤其最近，我在CPU和小模型的设计上有一些想法，这些内容应该会对你们有一定的帮助。”

要说各种设备和各种类型的任务，网络用什么算子比较好，速度和性能怎么取舍，即便再往后五年，孟繁岐都是当之无愧的第一人。

因为他熟知的那些取舍和结论，都是后来谷歌这样的大平台NAS(网络结构搜索)的实验结果。

所谓NAS，其实就是一种穷举对比的方式。

在特定的数据集上，把所有想得到想不到的算子组合用穷举的形式全都特么的测试一遍。

最后得出的网络结构，当然会比人类自己设计的要好要快，不过换一个差距很大的数据未必好用。

获取这个答案的代价是相当惊人的，随着搜索空间的增大，显然需要非常恐怖的计算资源去支撑。

好在孟繁岐已经将几个大公司上万张显卡，数年时间测试出来的主要结论全都白嫖了。

这个知识的价格成本，恐怕不止十数亿美金。

“那实在太好了。”见孟繁岐一口答应在阿尔法狗的网络设计上提供帮助，黄博士喜笑颜开，“我们现阶段除了需要快速迭代对比确定网络结构之外，没有什么特别大的困难。”

“如果非要说的话，就是缺少一个职业守门员级别的人类棋手。”黄博士想了想，补充道。

他自己业余六段，其实可以担当此任。

可他毕竟太过了解围棋AI，起到的测试效果可能不够真实，并且他也很忙，不可能一直负责对弈测试。

同时，欧美那边围棋的热度也并不高，樊麾二段就曾经多次夺得欧美围棋冠军，职业守门员级别测试员不是那么好找。

“这个没关系，我二月份会去一次英国，跟你们确认一下效果和后续的思路。”孟繁岐闻言笑了笑：“到时候给你们找一个守门员中的守门员。”

要说的职业守门员水平的棋手，想必没有谁比已经连续定段了七年，今年正在第八次对职业棋手这个身份发起冲击的七定王战鹰，更加适合的了吧？

这门都守了第八回了。

九九读小说网www.99duxs.cc