半夜两点,程延清睡梦中迷迷糊糊觉察到谢榆起立,走到阳台上,打了个电话。
“能打败AlphaGo的,是开局的妙手。”晦暗的月色下,谢榆的侧脸冷静得像古代的武士。
第三天,魏柯赢下了人类棋士对战AlphaGo的第一场胜利!
谷歌方一度认为AlphaGo被黑客入侵!
因为自从魏柯在危难之中以一手挖惩戒AlphaGo后,AlphaGo就突然不会下棋了!
价值网络的自我评判疯狂下跌,导致整个系统紊乱!
网络上凯歌高奏,仿佛魏柯已经取得了最终的胜利,而棋院中的众人却一脸懵逼,静静地看着双眼青黑的谢榆。谢榆看完了棋,依旧一头扎进了代码中。
他昨天不过是猜测。他并不确信他的结果,但现在看来,他的策略确实奏效了。
开局妙手,是他思考了一个晚上的无奈之举:AlphaGo的策略网络,是检索的KCS围棋服务器上所有真人在线对弈——这就暴露了一个问题:那是一个面向业余棋手的网站,中国棋坛的顶尖棋手,鲜少上那儿去。诚然,业余棋手们为AlphaGo提供了大量的参考,但是这些参考,恰恰与顶尖棋手的水准稍稍差了那么一点。
换句话说,魏柯有可能下出AlphaGo预测不到的棋。
预测不到而又子效非常高的棋,刚好有个专业术语——妙手。
妙手有可能在AlphaGo的预料之外,但不一定会给AlphaGo带来巨大的打击。因为AlphaGo是没有情绪的,它既不会因为优势而自满,又不会为落后而丧失斗志,从某种意义上,冰冷的机械之心才是它最强大的地方。顶尖棋手很多时候比拼的不是技术,而是心态。谁的心波澜不起,谁就越是能冷静地操纵局面,像李在中和魏柯这类人,就往往能将自己的技术发挥到十成,然后捕捉对方的失误,放在动物里,是一等一的捕猎者。
可是魏柯的妙手无法震慑AlphaGo,很可能只是让AlphaGo的一步思考完全报废。在下一手,它依旧会重振旗鼓,进行着它冰冷的计算。
除非,那一步妙手,已经给它的最优解制造了天花板!
也就是说,妙手要对AlphaGo起作用,不能仅仅是普通意义上的妙手,而必须将全局指向一个对魏柯来说胜率极高的局面,以至于AlphaGo再也不相信自己会赢。它只能在战败的框架下进行蒙特卡洛树搜索,它的瞬时胜率必须在49%以下!
谢榆有理由这么认为,因为AlphaGo与人类棋手对弈,从来没有处于过极度下风。或者说的更精确一点,在AlphaGo的价值评价下,它从来不曾思考过自己战败。这不一定是AlphaGo太强,而是因为它不能。一旦价值评价下跌,它就失去了还手之力。