目前为止,他们还没有形成一整套的学习以及对抗的思路,那一套策略网络-评估网络-强化学习-蒙特卡洛搜索的总体结构还没有成型。
还停留在比较早期的阶段,甚至还没有最后决定到底使用怎样的网络结构比较好,此时正在对模型本身的结构进行测试和设计。
“这方面确实是我比较擅长的方向,尤其最近,我在CPU和小模型的设计上有一些想法,这些内容应该会对你们有一定的帮助。”
要说各种设备和各种类型的任务,网络用什么算子比较好,速度和性能怎么取舍,即便再往后五年,孟繁岐都是当之无愧的第一人。
因为他熟知的那些取舍和结论,都是后来谷歌这样的大平台NAS(网络结构搜索)的实验结果。
所谓NAS,其实就是一种穷举对比的方式。
在特定的数据集上,把所有想得到想不到的算子组合用穷举的形式全都特么的测试一遍。
最后得出的网络结构,当然会比人类自己设计的要好要快,不过换一个差距很大的数据未必好用。
获取这个答案的代价是相当惊人的,随着搜索空间的增大,显然需要非常恐怖的计算资源去支撑。
好在孟繁岐已经将几个大公司上万张显卡,数年时间测试出来的主要结论全都白嫖了。
这个知识的价格成本,恐怕不止十数亿美金。
“那实在太好了。”见孟繁岐一口答应在阿尔法狗的网络设计上提供帮助,黄博士喜笑颜开,“我们现阶段除了需要快速迭代对比确定网络结构之外,没有什么特别大的困难。”
“如果非要说的话,就是缺少一个职业守门员级别的人类棋手。”黄博士想了想,补充道。
他自己业余六段,其实可以担当此任。
可他毕竟太过了解围棋AI,起到的测试效果可能不够真实,并且他也很忙,不可能一直负责对弈测试。
同时,欧美那边围棋的热度也并不高,樊麾二段就曾经多次夺得欧美围棋冠军,职业守门员级别测试员不是那么好找。
“这个没关系,我二月份会去一次英国,跟你们确认一下效果和后续的思路。”孟繁岐闻言笑了笑:“到时候给你们找一个守门员中的守门员。”
要说的职业守门员水平的棋手,想必没有谁比已经连续定段了七年,今年正在第八次对职业棋手这个身份发起冲击的七定王战鹰,更加适合的了吧?
这门都守了第八回了。
请记住本书首发域名:。看小说吧手机版阅读网址: