91精品久久久久久久久久不卡,日韩亚洲精品电影,久久久久成人精品

柯潔別做夢(mèng)了！人類再進(jìn)化5000年也干不過AlphaGo

藍(lán)馨晴　2016年03月14日 08:13

【IT時(shí)代網(wǎng)編者按】計(jì)算機(jī)的算法依然是大數(shù)據(jù)+邏輯計(jì)算，離人類的抽象思維、自我意識(shí)什么的還很遠(yuǎn)。它們所扮演的角色依然是作為人類更加便捷的工具，有時(shí)候讓人變得更「懶」，有時(shí)候讓人變成「超人」。歸根結(jié)底計(jì)算機(jī)是人類發(fā)明的，如果人類輸?shù)袅诉@場比賽我們應(yīng)該歡欣鼓舞，因?yàn)槿祟愑忠淮螒?zhàn)勝了自己。

這是一場毫無意義的比賽，因?yàn)閯儇?fù)早已注定。李世石贏不了，就算贏一場也是僥幸，柯杰來了也沒用，吳清源復(fù)活也沒用。

如果你對(duì)AlphaGo或者如今的AI發(fā)展稍微有點(diǎn)了解的話，你就會(huì)明白為什么人類下不贏電腦，就算再進(jìn)化5000年也沒用。

先來解釋一下阿爾法狗是怎么下棋的。

圍棋有361個(gè)格子，理論上講，黑子的第一步有361種選擇，然后白子有360種應(yīng)對(duì)，然后黑子359，以此類推。每一步棋最終可能會(huì)導(dǎo)致各種各樣的結(jié)果，如果你能窮盡所有結(jié)果，看看其中有多少是獲勝的，有多少是失敗的，就可以計(jì)算出這步棋有多大的可能性讓你贏。每次輪到你下棋時(shí)，都選擇贏面最大的那一步棋，最終你就是獨(dú)孤求敗，永遠(yuǎn)都不會(huì)輸了。這就是從深藍(lán)到阿爾法狗都會(huì)使用的「蒙特卡羅樹」搜索方法。

人工智能又一次挑戰(zhàn)世界冠軍，人腦還能堅(jiān)持多久?

當(dāng)然，這只是理論上的，因?yàn)楦F盡所有是不可能的。經(jīng)過估算，圍棋的全部可能性為10^170種，全宇宙的原子數(shù)量加起來才10^80，阿爾法狗還沒流弊到能計(jì)算全宇宙的原子。既然不能窮盡，就只能拿有限數(shù)量的棋局來進(jìn)行估算，這就組成了阿爾法狗的核心部分：「PolicyNetwork」，稱為策略網(wǎng)絡(luò)。從5000年前中國人發(fā)明圍棋開始算起，全人類下過的棋局可能也不過幾十萬局到幾百萬局，有大量的變化和局面還未有人嘗試，這顯然不能滿足阿爾法狗的胃口。于是它發(fā)明了一種制造棋局的方法：自己跟自己下。據(jù)說它的「快速走子」2微秒可以下一步棋，1秒鐘已經(jīng)下完了幾千盤棋局了。它在和李世石比賽之前已經(jīng)儲(chǔ)備了3000萬個(gè)棋局，這里面有多少對(duì)局可能是人類再下5000年棋也創(chuàng)造不出來的。

如果光是這樣，那也還做不到獨(dú)孤求敗，畢竟和電腦相比人類還有「棋感」、「經(jīng)驗(yàn)」、「靈光一現(xiàn)」這類無法量化的東西。圍棋號(hào)稱「千古無同局」，經(jīng)常會(huì)出現(xiàn)一步棋讓盤面發(fā)生翻天覆地的變化，就像天龍八部里的珍瓏棋局所描述的那樣。為了防止人類通過奇招、怪招打敗阿爾法狗，它還有另外一套計(jì)算方法：「ValueNetwork」稱為估值網(wǎng)絡(luò)。它從儲(chǔ)備的3000萬個(gè)棋局(按1秒鐘下幾千盤棋局來算，現(xiàn)在估計(jì)又增加了很多)里提取了3000萬個(gè)局面，然后通過『蒙特卡羅樹』的推演來評(píng)估局面的變化，一來可以砍掉大量不值得分析的分叉提高計(jì)算效率，另外更重要的是可以推演出與之相關(guān)可能出現(xiàn)的新局面。將可能產(chǎn)生的有利或不利局面倒推回來，堵住一切人類有可能出奇制勝可能性，而選擇自己更容易下出「珍瓏棋局」的局面。比如通過算棋得出下一步走A位可繼續(xù)保持優(yōu)勢(shì)，但評(píng)估局勢(shì)認(rèn)為B位有可能改變整個(gè)局勢(shì)，那么就會(huì)選擇B位。大家看直播，也發(fā)現(xiàn)阿爾法狗經(jīng)常這么做。控制住了局面也就基本控制了由于樣本有限而沒有覆蓋到的怪招、妙招的威脅。

當(dāng)然，由于圍棋計(jì)算無法窮盡，人和機(jī)器看上去是在同一起跑線上。但阿爾法狗每1秒鐘又學(xué)習(xí)了幾千盤新棋局，其中的「珍瓏棋局」大多都是人類聞所未聞的，這簡直就是降維攻擊。人類還是洗洗睡吧。

這場比賽讓我想起了百年前英國人讓馬車與火車進(jìn)行比賽，剛開始火車還輸了呢!這些比賽都沒有意義，因?yàn)橛?jì)算機(jī)程序?qū)⒉豢杀苊獾爻饺祟?。?dāng)然有人說電腦程序怎么進(jìn)化也寫不出一首優(yōu)美的詩，機(jī)器無法理解人類的喜怒哀樂。這是當(dāng)然的，但是計(jì)算機(jī)技術(shù)悄然地改變著人類的生活，并在某些方面超越我們，但最終它們還是要為我們所用。

至于計(jì)算機(jī)會(huì)對(duì)圍棋界產(chǎn)生什么樣的影響?看看現(xiàn)在國際象棋界就知道了，有的棋手用電腦來學(xué)習(xí)和訓(xùn)練，而有的則用它來作弊。2010年，法國大師SebastienFeller在比賽中接收電腦提示而被FIFE(國際象棋聯(lián)合會(huì))判決提前回老家。當(dāng)然，現(xiàn)在主流的做法是棋手們使用「象棋程序」來輔助訓(xùn)練，經(jīng)過電腦的計(jì)算可以排除大部分沒有意義的分支，棋手們現(xiàn)在一天可以研究的棋局可能超過過去幾十年甚至幾百年的總和。有車不坐為啥非要走路呢?我猜想未來棋類運(yùn)動(dòng)將會(huì)朝幾個(gè)方面發(fā)展：要么完全去電腦化回歸人類運(yùn)動(dòng)的本質(zhì)，就像火箭都上天了奧運(yùn)會(huì)還有跑步一樣;要么像國際象棋那樣讓電腦來協(xié)助比賽;即使最終被「窮盡」了，回到「琴棋書畫」這類藝術(shù)活動(dòng)的范疇也不無不可。

AlphaGo的意義根本不在于下棋，而是計(jì)算機(jī)所進(jìn)化出的超強(qiáng)學(xué)習(xí)能力。算法的進(jìn)化可以大量節(jié)約CPU的計(jì)算能力，就像圍棋這樣如果真的要「窮盡」可能要用到全宇宙的原子才行，而現(xiàn)在只需要幾千萬盤對(duì)局就幾乎破解了這個(gè)游戲。同理像Siri這種語音助手，想要窮盡人類所有的詞語表達(dá)也幾乎是不可能的，但讓計(jì)算機(jī)從有限數(shù)量的語言庫中學(xué)習(xí)人類是怎么說話的已經(jīng)變?yōu)榭赡堋?/p>

另一方面，計(jì)算機(jī)的算法依然是大數(shù)據(jù)+邏輯計(jì)算，離人類的抽象思維、自我意識(shí)什么的還很遠(yuǎn)。它們所扮演的角色依然是作為人類更加便捷的工具，有時(shí)候讓人變得更「懶」，有時(shí)候讓人變成「超人」。歸根結(jié)底計(jì)算機(jī)是人類發(fā)明的，如果人類輸?shù)袅诉@場比賽我們應(yīng)該歡欣鼓舞，因?yàn)槿祟愑忠淮螒?zhàn)勝了自己。當(dāng)然，如果未來人類沒有利用好這個(gè)工具，并像科幻電影描述的那樣成為一種威脅，要怪也只能怪我們自己。

Geek's view

多說兩句。之前柯潔質(zhì)疑說李世石簽了保密協(xié)議回避打劫，我只想說呵呵。田淵棟博士在知乎上詳細(xì)分析了阿爾法狗的原理，除了上面說到的兩個(gè)系統(tǒng)之外，阿爾法狗還有一套快速走子程序，就是前面提到的可以2微秒走一步棋。打劫前后無非幾十步，加上所有可能性至多無非百千步走法，阿爾法狗不到一秒都計(jì)算好了。而且這個(gè)是運(yùn)行在本地的，不需要通過網(wǎng)絡(luò)搜索，來中國戰(zhàn)都毫無壓力。【責(zé)任編輯/荊玉珍】

來源：極客視界

IT時(shí)代網(wǎng)(關(guān)注微信公眾號(hào)ITtime2000，定時(shí)推送，互動(dòng)有福利驚喜)所有原創(chuàng)文章版權(quán)所有，未經(jīng)授權(quán)，轉(zhuǎn)載必究。
創(chuàng)客100創(chuàng)投基金成立于2015年，直通硅谷，專注于TMT領(lǐng)域早期項(xiàng)目投資。LP均來自政府、互聯(lián)網(wǎng)IT、傳媒知名企業(yè)和個(gè)人。創(chuàng)客100創(chuàng)投基金對(duì)IT、通信、互聯(lián)網(wǎng)、IP等有著自己獨(dú)特眼光和豐富的資源。決策快、投資快是創(chuàng)客100基金最顯著的特點(diǎn)。

相關(guān)文章