本篇文章8887字,读完约22分钟

我不知道这个副本的开头。

没有语言可以表达我现在的心情。


李世石两连败说没有发现阿尔法围棋的弱点。

19年前,在围棋入门课上,用十个棋子在半山腰下了双眼活棋。

4年前,挥舞围棋相扑台进入大学。

没想到今天我在为棋谱哭泣。

哭得很开心。

我不知道这个世界上还有几个人和我的感觉一样。 是的,可能从来不多。

我不希望读这篇文章的人能理解我在说什么。

但是,把我看到的东西记录下来。

不是纪念,是感谢。

我发现在感情中,只能记录我的感情,却写不出这段感情的由来。 虽然我以为我很清楚它的由来。

写抒情文案很容易,但没什么价值。 我看到的,这就像应该用“美”来表达,很难抽象成语言来描绘。 于是,我试图从理性中表达因果,直到感情消失。

那样的话,会有越来越多的人享受这种美吗?

不知道。

也许可以试试

深夜。 终于能动笔了。

年3月10日,alphago对战李世石、人机大战第二局。

关于这一招,虽然与上一招有很大分歧,但职业棋手之间依然存在着多种意见。

随着时间的推移,这些看法最终可能会合二为一。 但是,在今天发生故事的今天,面对经验之外的事件,人类的观点之多是不可避免的。 我的观点也是这多元中的一元,正是人类思想的多元性丰富了我们的世界。

敲击完上面的文字后,我准备神游到中午,从头整理我的所见所闻,逐渐表达了我无法直接用看到的语言表达的心情的由来。

但是,事实教育我们写文案的时候不要刷微信微信信息wechat朋友圈……

一个小时后,我不得不再次改变写法。

这两局棋,没有人比李世石下得更好!

是的,这是我复印件的标题。

我知道我说服不了所有人。 这样的标题也不是我一贯的风格。

但是,在对铺天盖地的李世石的质疑声中,必须谈谈我所看到的。

因为,我不相信这些疑问来自恶意。 我只能理解为我看到的有些东西人们没有看到。 每个人的认识体系不同,对事物的态度也不同,对此我不多加指责。

小说《冰与火之歌》中有《黑水河之战》。 守方指挥是侏儒,想尽各种策略,最后上战场被砍了鼻子,终于抵抗了对方的攻击,拯救了那个城市。 但是战争结束后,他被解除了职务,成为了俘虏。 他做的事人们没有看到。

《冰与火之歌》电影的截图。

不,我说我看到的东西。

希望网民能耐心读完这篇文章,再做评价。

建议在阅读本章之前,先阅读昨天的“【火线快递】——李世石的策略和alphago的弱点”,帮助理解这篇文章。

0无须的“禁止抢夺协定”

这一节是本论文最没有价值的部分,也是我最不想写的部分。 谣言自取灭亡,我不需要回应。 但是,我一方面为谣言扩散到圈外感到羞耻,另一方面也帮助我稍微了解alphago的算法。

关于“禁止抢夺协定”的疑问来自“alphago七局都没有出现抢夺斗争”的说法。

deepmind可能会正式应对这件事,但在下一轮对局中谣言可能会散去。

但是,不需要这些说明。 我们不能分辨吗?

从弱到强,我先做出三个回应。

1、懂围棋的朋友,你真的相信李世石会在世界顶级棋手代表人类战斗的历史时刻签下这样的协议吗? 你相信不擅长围棋的朋友,谷歌队会签这样的改变围棋玩法的协议吗?

2、alphago的算法决定了在他不抢就能赢的条件下尽量不抢劫。 因为特色抢劫增加了搜索的不确定性,常常会降低他对胜率的估计。 这也是上一篇文章中提到的逃避抢劫问题的本质。 但是,无论如何都赢不了的强盗,电脑一定会打。 可以从逻辑上推断或参考第3条。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

3、能不能去看一下去年10月alphago对樊麿的棋谱? 第三次、第五次,都有抢劫斗争。 其中第三次就发生了抢劫转换。 第五局的抢夺过程形成了18个手续,也形成了转变。

我认为在围棋被空关注之前的时候,圈子里的人有造谣的义务,不助长谣言是底线。

1 alpha go算法的主要优点

很多人说发现了alghago的很多错误,不能理解这么弱的ai怎么能战胜李世石,所以blablabla……是……

如果看了之前的分解还这么想的话,那我可能没说清楚。 大多数alpha go实力的错误估计是因为不知道alpha go算法的原理。

让我强调一下

alpha go的算法不是根据“最佳”而是根据“胜率”来决定落子的决定!

质疑ai错误的同学请记住这一点。

这也是这个副本整体分解的逻辑起点。

这意味着我们人类所谓的“错误”很可能对“ai”来说不是错误。

2第一局李世石在做什么?

第一局结束后,一位棋手说:“李世石心情不好,太着急了,计算机计算能力一定很强。 必须慢慢地进行形势评估。 其评价力度绝对不行”。

真是个好故事。 李世石第二局就是这样做的。

只是,在第一局之前,几乎没有人认为李世石的混战能力不如电脑。

上篇中,在赛前分析alphago算法时谈到,面对“开放性多而复杂的局面”时有可能变弱。 因为深入学习和蒙特卡罗剪枝和探索,在面临开放性多、复杂的局面时有可能失效。

第一局,李世石先尝试了无谱布局(你说李世石没有什么策略吗? 好),然后很快就引入了开放复杂的局面,呈现出六七只手纵横交错的场景。

结果,第一个策略失败了。 至少在中盘收兵之前,赛后的职业棋手基本上都认为李世石是赤字。

如果我在场上,我可能会在第一盘选择这样的第一个战略,但我会只考虑一盘,尝试一盘的战略。 最终,有五局的空之间。

但是,李世石在中盘及时收手,第77、79手主动休战走向收空,引入了精细的局面。

他第一次居然尝试了两个策略!

那么,如果李世石本来的形势不利,如何才能引导细手,甚至反超领先呢? 那不是证明了ai有足够的错误来逆转胜负吗?

昨天,不能完全肯定地回答这个问题,但是今天可以确认。

第一局所谓李世石的领先和细手都是人类经历带来的错觉! 从开局到最后,一直是阿尔法go的特征!

这个评价也符合alphago自身胜率的趋势。

在前篇中,他提出了对alpha go局面的评价是基于对方未计算的严厉手段( 102 )。 左上的缓手( 80岁)和左下的坏手( 86岁),我确实不认为是好的,但我认为在ai上是最接近胜利的选择。 观战者在左下角逆转黑色大获全胜是因为

1 )“左下白手大损”

2 )第102步没有充分的准备。

3 )人类的傲慢自负。

但是,

1 )是依赖于经验的局部评价,不具备能够构成说明的正确性

2 ) alphago的棋局评价基于有102只手的基础上

3 )人类的情感降低了评价能力。

102一出手,李世石长考毫无结果,局部损失惨重。 但是,这个巨大的损失在alpha go的评价中,对它来说只是探索树上可能出现的分支。

很多人以为走到后面的黑色右下角还能收到——确实能收到,但恐怕赢不了。 当然,和我一起你可能会赢,但对阿尔法go不行。 这源于alpha go的算法和下法逻辑。 当然,这个结论的结论是alphago在对抗人类时依赖这种做法也没有问题。 基于这两天,这种方法对人类还没有产生任何问题(关于错误问题,请参阅上一章或上一章)。 我最大限度地相信那个。 这个信念只有在alpha go这种做法因人类问题而失败时才会动摇,需要找出这个问题在哪里,以及人类可以如何利用。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

有趣和可怕的是,对人类来说非常闪耀的“胜负手”102包含了这么多计算、评价和计划,而对ai来说只是平凡的93只手中平凡的一只手。

这样的话,李世石的第二战略起到了什么样的作用呢?

起到很大的作用。 关于第一局的80手和86手,从经验上来看我认为可能是不好的手,但不能严格说明。 但是对于后面的136手和142手,可以严格说明肯定不如另一个选择。 这让我们确认了ai的弱点之一“逻辑能力的缺乏”(参照上篇)。 再补充一点,可以认为是“缺乏局部封闭搜索能力”(可以讨论这一个是否是弱点)。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

由于缺乏逻辑能力,ai在人类看来有时会犯明显的错误。

但是,我们所认为的莫名其妙的错误,似乎只是这样并不会降低胜率的选择。 确实,我们可以指出他有些逻辑上可以解释的局部损失,比如无用的绝对先手交换,比如目数无用的损失。 最初的磁盘总结认为,这可能是计算机的弱点(对ai来说不是错误),也就是“缺乏逻辑”造成的局部小损失,但这可能是人类仅有的两个突破口之一。 虽然ai在特征上是局部退让确保胜利,但平均退让对人类来说不也是领先的机会吗? 因为这是我提议的

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

1、我最期待的战略是,李世石将按照人类研究的深入道路开局。 因为ai不会背道而驰。 即使不能以此占据特征,也必须尽量维持局面的平均走势。 在这个条件下,ai可能会在稍微简单的局部因逻辑缺失而损失,但人类会牢牢把握这些小好处,最终取得小胜利。 但这似乎不是李世石常用的风格。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

这是第一局之后,我认为比较电脑弱点的最佳策略。

第三局李世石在做什么?

如果是你,第一局下法失败后,第二局会怎么样?

我的想法是,通过第一次就意识到了ai的强大可能超出了以前的想象,我想他最有可能失败的地方他成功了,但幸运的是我也看到了他可能的弱点。 我根据其最有可能的弱点制定了新的战略,然后严格按照这个战略执行。

这是因为发现与ai的弱点相比,可以执行的战略很少,第一局采用了两个战略失败了。 我可能需要更加专注于一个战略的执行。 结果,还有3个磁盘的空之间。 这是我在第一局之后做出的决定。

“你说得那么玄乎,你不是李世石。 他没有说。 你要怎么证明那个? ”

是的,我不能证明那个。 就算他说了也不能完全证明。 这只是棋谱报纸加上ai算法的合理推测。 当然,李世石可能没有制定任何第一种策略。 那样的话,他太天才了——别人通过知识和推理达成的方案,他只凭意识做了。

前面说了这么多,还得经常用棋谱说话呢。 那么,让我们看看第二局发生了什么。

我个人认为,对于这个游戏,以前流传下来的棋评解说意义不大。

请先看第13手。 右下先虎之后摆脱了中国流,这又是“专业棋谱中未出现的布局”。 看到这一步,李世石站了起来,抽了根烟。

让李世石在抽烟的时候暂时代入他想想。 (画风突变时请不要觉得不好)。

这个局我决心执行一个策略。 这个策略是针对ai弱点的攻击。 这个策略简单地说:“以熟练的开局,争优越。 在微不足道的局面下,等待失误。 “(理由之前已经说清楚了)

于是我开局选择了最常见的布局应对。 白方这个布局历史不衰,即使没有千局,也有数百局在实战(有兴趣的话可以查一下)。 经过昨天的试探,ai不会背谱。 人类的整体经验可能是最有力的。 我必须尽量引入熟悉的道路。

到了12手,我还是有点兴奋。 这个布局在我看来很多。 国际象棋总是不吃亏的。

然后,看到对方掉了黑色的13个。

纳尔尼?

无法确定吗?

这个还能拔吗?

我去。 ai你并不知道我在想什么。 和我打心理战吧?

你什么时候通过图灵测试的?

让我想想。 你不玩的话我得先制裁你啊。 夹击怎么样?

我一,你二,我三,你抢四……这招失控了啊。 这局面没人下过吗?

我的这盘棋好吗? 下面会怎么样? 足以抵消黑色上阵吗?

以下,省略几十个脑海中迅速出现的变化图……

评价不明确,好像不太自信。

怎么办? 战略就这样被打破了吗?

有了! 我要是觉得右手黑手没换老虎就好了!

我们应该去哪里,去哪里,机器怎么办?

啊,我怎么这么机智?

alphago有我那么机智吗?

一盒香烟正好抽完之后,李世石回到座位上,掉了第十四只手。

这是右下方没有老虎和解体更换时最常见的下法,不知道有几百只。 而且,这个时候,黑手虎白手大多也会被解体。

那么,这个小故事告一段落。 我不是说这一定是李世石的心理过程,我会这么做。

这个将棋技术上无与伦比的精彩我想留到第二部再谈,那里有更精彩的新世界,我在这里暂时忽略。

让我简单回答一下李世石后来认为84、146、172三只手是抢劫有问题的观点。

1 )李世石没有选择抢劫,认为是因为签署了协定的人。

你好,再见。

2 )李世石认为不选择掠夺的真的是别人的人:

如果看前面的分解也这么想的话,请回答“强盗会赢吗”

当然,可以说84老虎明显优于实战。 146只有被夹在中间才能获胜。 172不足以引起平民的愤怒。

那句话怎么说来着……你已经为你做了是你已经做的吗? (这句话用来看人和ai真是金句)

对ai来说,气势是什么? 血性是什么? 胜负感是什么?

只看ai :胜率是多少?

确实,我这不也是我想的吗?

是的。 告诉我让老虎抢劫为什么比实战好。 你觉得后两个地方哪个会影响胜负? 让我们进行比较有效的辩护。 说了几步也没说清楚就赢了。

在我看来,这盘棋的李世石完美地贯彻了他的策略。

很遗憾,还没有赢。 原本预计在熟练的布局模式上,上半场将占优势或持平,但下半场将等待因ai逻辑缺失而造成的局部小损失。 但是,在局势接近的情况下,电脑局部的“失误”比第一局小,难以确认(例如15、117等先手不保存)。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

这可能是非常可怕的事件。 形势临近的情况下,ai的“错误”也变少,告诉我们会消失(不会被发现)。 alphago形势越好,他的“失误”可能越多。 我们只能根据这些“错误”对其进行棋艺水平的评价,并无限误解。

还是在这里引用前面文案的结语。

如果人类只通过思考围棋的方法来理解alphago,我们可能永远都不知道怎么输。

读到这里,我相信大家对alpha go有更直观的认识。

也许有人会这样想。 这样看来,alphago不是更强吗?

确实!

那个目标只是获胜,不求最好。

如果对方很弱,那么可以选择的胜算之类的点就会增加。

如果对方很强的话,像胜算这样的点可能会很少。

后者意味着更准确,从人类思维的意义上来说更少失误。

那么,阿尔法go的极限在哪里? 不知道。

但是,我认为alphago如果原谅世界的话首先是迫不及待的事件。

我希望赛前和现在李世石都能赢,因为人机彼此拥有的时间越长,能向围棋界反省的时间就越长。

但理智告诉我,ai真的没尘了。

让我们回顾一下罗先生的话。

“人工智能就像火车,走近时会听到轰鸣声。 你期待着它的到来。 他终于到了,一晃就过去了,然后远远地把你抛在后面。 ”。

围棋是这句话最好的脚注。

看了第二遍之后,所有的alphago都认为他是下半场坚强的人。 如果能理解前面所说的知识和逻辑的话,你也应该能理解那个。

正是李世石的强大迫使了alphgo的下半场。

为什么最初ai后半段的“失误”越来越多? 因为“失误”,ai赢了。

在第二轮赛后的采访中,demis hassabis在节目单上暂时认为局势接近(根据胜率),但李世石表示自己惨败。

如果有第一局李世石输了之后还一度领先的错觉,那么这个局他自己完全没有错觉。 即使在棋坛公认alphago明显亏损的左下角定型后,李世石也认为自己没有任何特点。 正是这样的正确(保守的? )的认知再加上上半场盘比较熟练的结构,alphago一时认为局势很接近( alphago是否认为自己落后,好奇心很强)。 这也激发了阿尔法go强有力的下半场,在对阵世界顶级棋手时,只要下场,胜负之差就会扩大到盘面的十几倍。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

对于这个事件的夸张程度,棋手们能正视吗? 人类面对无法理解的东西,总是用固有的知识体系来理解。 但是,新的时代真的到来了。

4李世石,面对ai的围棋英雄

希望读到这里,有人能理解李世石和alphago之间发生了什么。

这一段,我告诉过你们。

自古以来,我们就不知道人类在围棋技术浩瀚空之间到底站在什么位置。 距离天空只有3英尺吗? 还是还站在地平线上?

如果把穷举看成天,把入门看成地,那么人类对今天围棋的认识到底是什么水平?

藤泽秀行说:“围棋只知道百分之五。” 我相信包括我在内的大部分棋手都认为这是谦辞。 正面解决,是敬畏的否定解决,不知道是什么心。

真的谦让吗?

虽然在纵向看不清楚,但是横向比较一下比较好吧。 其他有职业体系的棋类项目,变化比围棋少,未知的非常少,那么那个职业选手比我们更有可能在各自的体系中站在更高的水平上吗?

但是,他们已经接受了ai阶层高于人类的事实。

确实,短时间内围棋是唯一的硕果,围棋选手看着用机器训练的同事们,豪言壮语说“围棋绝不输给机器”,似乎在守护着什么精彩的东西。

不是我想冲破这样的幻影,而是事实摆在眼前,所以你不能相信。

国际象棋遇到深蓝挑战时,人机之间还持续了一段时间。 到今天为止,在国象和象棋中,人是不可能战胜ai的,但守和还是有可能的。 一方面ai的技术水平可能不比人类高多少,另一方面象棋的空之间是一个很大的缓冲带。

围棋呢? 围棋确实很难被ai打破,但一旦被打破,会比人类的空之间高出多少? 围棋离天还有多远? 人类棋手离天有多远? 谁也不能给出正确的答案。

如果没有围棋ai,我们就不知道自己在围棋天地之间的位置。

围棋是我们唯一的参照者。

在围棋下完之前,我们不能确切地知道自己在哪里,

我们不再孤独了。

多年来,围棋书籍中,尚不清楚如何评价此次李世石代表在人类围棋最高水平与新生ai对决中的种种努力,以及李世石对突然凌驾于人类之上的围棋ai的表现。

我只是想告诉大家在连李世石的职业精神都受到质疑的时代,我看到的事件。 真相与否,请自行评价。

“李世石面对alphago,在五个月前的棋谱中毫不轻视,所以他做了非常充分的准备。 他不顾人类的偏见和自负,理解alpha go运算的机制,试图找出其中可能存在的弱点。 比赛一开始,他就alphago可能存在的弱点进行了击中要害的攻击,同时在失败后迅速调整,展开了第二次、第三次对比性攻击。 他的战略对比让人们很好地了解了alphago的强大和优势,以及与人类不同的决策模式。 他在第二局中找到了足以在中盘接近和对抗alpha go的布局战略,让人类首次看到了alpha go梦幻般的下半场。 ”。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

——这是我对李世石在人机大战前两局表现的评价。

从这两盘来看,我不认为这个世界上有能代替李世石更好做这件事的身体。

写到这里,天已经亮了。

但是故事还没有结束。

5再来三个盘子能做什么?

第2局以后,上一个副本推测的最佳战略被ai强大的实力所说明,很难取胜。 这个战略可以最大限度地利用人类集团的经验,获得中盘接近的形势,但在这种情况下,alphago的后半盘并非限时人类所能抵抗的。 李世石发挥过多,认为自己可以不犯错的选手,低估了人性的弱点,低估了阿尔法go的实力。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

昨天给的下一个好战略是关于抢劫的。

2、另一个战略是在局面选择中尽量制造抢劫斗争,即对方不抢劫就制造不利局面。 当然,alphago目前没有表现出很多复杂的竞争能力,所以并不说明没有这样的能力。 因为这个战略有风险,故意不行,必须考虑情况的自然和平衡。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

但是,在看到第二次alphago的表现后,我认为这个战略也实际破产了。 alphago的算法只是打影响胜负的强盗,与胜负无关的强盗他不会战斗。

尽管如此,我还是想李世石试试。 我在第一局只看到了alphago的两个弱点,但第二局基本上说明了这两个弱点不能用于人类。 alphago能够在尽量避免抢劫斗争的同时战胜李世石,这是关于抢劫斗争值得关注的焦点。

关于弱点,李世石说,在第二轮比赛后,他没有发现alphago的弱点。 我觉得他很诚实。 而且,他确实在全力寻找。

虽然我希望李世石在这次比赛中获胜,为围棋领域的快速发展争取时间。 但是在我看来,后三盘在正常情况下李世石是没有胜算的。

空中开局比较有效吗? 我觉得无效,可能有兴趣。

如果不去找bug,剩下的事件只有——和ai学象棋。

6人类怎么和阿尔法go学象棋?

这是一个相当大的话题,将来会被围棋界的人反复讨论。 在这里我只是简单地开始,或者有不确定的地方。

先说一句: alphago的手容易学,难学。

为什么难学? 因为alphago的所有着作法都是全局考虑的,都是基于此的胜率,所以单纯模仿其下法,会陷入巨大的陷阱。

陷阱1:alphago的一点下法本身不是最合适的,也不及人类的选择。 例如,第一套的两个典型的“失误”。 如果真的要学局部手,可能就要指望他在左右搏斗时拿出最强的力量(或者说要对阵人眼,总之为了减少选择就需要加大难度)。 )

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

陷阱2:alphago的下法基于全球,如果全球形势略有不同,则有可能不适用。 例如第二局alphago在左下方的下法,大部分人认为局部明显缺失。 但是,alphago根据上和右的情况在左下进行选择(这将在第二部分进行解说……学习),对棋手的思维扩展有很大的好处,但是具体的做法不能照搬。 即使是天外飞仙的第37手,也只有在独特的局面下才是当时的好手,无论对什么高分解二都望尘莫及,东施颧骨。

“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

为什么容易学? 因为alphago的围棋技术水平已经在人类之上,所以它的每一招都值得棋手反复推敲。 光是两局就已经有这么多亮点,越来越多的困惑,这绝对是史无前例的棋谱。

虽然alphago给出选择点的想法与人类不同,但是能够用人类的方法理解它是多么了不起的事件啊! 在同一点上,alphago是用数据的方法给出的,但人类以合情合理的方式接受,围棋的数量和套路在这场对话中表现得很完美。

这篇文章的第二部分本来打算用棋谱解读的方法来表达我从第二局看到的无法用语言表达的震撼和美,但是本文已经太长了,两部分的相关性很弱,更首要的是,天变亮了……留到下一篇吧。

我想念吴清源大师。

文案自喆理围棋( zheliweiqi )微信号(作者李瑢,职业围棋全国冠军,北大学子,《围棋天地》专栏作家,围棋哲学探险家。 本文刊登在微信号《喆理围棋( zheliweiqi )》上,澎湃信息( thepaper )获准转载。 喆理围棋沙龙由李浴段发起,清华围棋文化交流与研究基金主办。 目的是以沙龙的形式,吸引志同道合的朋友,从文化、哲学等方面,共同思考、交流意见,探索围棋的价值和本质。 如果您想参加讨论、投稿、沙龙的扩展项目,请发邮件到zlweiqi@。 )

标题:“算法决策AlphaGo尽可能避劫争 打劫降其胜率估算”

地址:http://www.jcpa.cn/blgty/22419.html