經(jīng)過三天的訓練,該系統(tǒng)能夠擊敗AlphaGo Lee,后者是去年擊敗了韓國選手李世石(Lee Sedol)的DeepMind軟件,勝率是100比0。
10月19日消息,專注于推進人工智能(AI)研究的谷歌子公司DeepMind今天發(fā)布了一款新版本的AlphaGo程序,它能通過自學玩轉多種游戲。這套系統(tǒng)名為“AlphaGo Zero”,它通過一種名為“強化學習”的機器學習技術,可以在與自己游戲中吸取教訓。
僅三天時間,AlphaGo Zero自行掌握了圍棋的下法,還發(fā)明了更好的棋步。這期間,除了被告知圍棋的基本規(guī)則,它未獲得人類的幫助。隨著AlphaGo Zero被不斷訓練時,它開始在圍棋游戲中學習先進的概念,并挑選出一些有利的位置和序列。
經(jīng)過三天的訓練,該系統(tǒng)能夠擊敗AlphaGo Lee,后者是去年擊敗了韓國選手李世石(Lee Sedol)的DeepMind軟件,勝率是100比0。經(jīng)過大約40天的訓練(約2900萬場自玩游戲),AlphaGo Zero擊敗了AlphaGo Master(今年早些時候擊敗了世界冠軍柯潔)。
舊版AlphaGo接受的訓練是,觀摩由實力強大的業(yè)余或專業(yè)棋手對弈的海量棋局。但AlphaGo Zero沒有獲得這樣的幫助。它自我對弈數(shù)百萬次,并從中學習。一開始,它只是隨意把棋子放在棋盤上,但后來它發(fā)現(xiàn)了獲勝的策略,棋藝就快速提升了。
AlphaGo的首席研究員大衛(wèi)·席爾瓦(David Silver)表示,“由于未引入人類棋手的數(shù)據(jù),AlphaGo Zero遠比過去的版本強大,我們?nèi)コ巳祟愔R的限制,它能夠自己創(chuàng)造知識。”
AlphaGo Zero通過“強化學習”這一程序來積累技能。當AlphaGo Zero走出一步好棋,它更有可能獲勝。若這步棋沒走好,它輸棋的概率變大了。
這一程序的核心是一組連在一起形成人造神經(jīng)網(wǎng)絡的 “神經(jīng)元”。對于棋局的每個回合,神經(jīng)網(wǎng)絡會觀察棋子在棋盤上的位置,并推算接下來的棋步以及這些棋步讓全盤獲勝的概率。每次對弈后,它會更新神經(jīng)網(wǎng)絡,讓棋藝更精進。雖然性能遠勝于以前的版本,但AlphaGo Zero是一個更簡單的程序,掌握棋法的速度更快,接受訓練的數(shù)據(jù)更少,使用的電腦更小。席爾瓦表示,如果擁有更多的時間,AlphaGo Zero還能夠自己學會圍棋規(guī)則。
研究團隊在《自然》雜志上發(fā)表的文章寫道,一開始AlphaGo Zero的棋藝糟透了,后來它逐漸成為一名缺乏經(jīng)驗的業(yè)余棋手,最終進階為圍棋高手,能夠走出極具戰(zhàn)略性的棋步。這些進步僅花費了幾天時間。最初10小時內(nèi)它就發(fā)現(xiàn)了一個定式。隨后不久它又領悟了一些棋法。三天后,AlphaGo Zero發(fā)現(xiàn)了人類專家正在研究的全新棋步。有趣的是,程序在發(fā)現(xiàn)更簡單的棋步之前就早已掌握了一些復雜棋步。
這一進展標志著通用型AI發(fā)展的大一里程碑。除了下棋贏過人類,通用型AI能做更多事情。由于AlphaGo Zero能夠從一無所知實現(xiàn)自學成才,如今其天賦可以在諸多現(xiàn)實問題上派上用場。
AlphaGo Zero正在研究蛋白質如何折疊的問題,這是一個艱難的科學挑戰(zhàn),不過有望成為藥物發(fā)明的一大突破。
DeepMind的CEO丹米斯·哈撒比斯(Demis Hassabis)表示,“對我們來說,AlphaGo不僅限于在圍棋對弈中獲勝,這也是我們開發(fā)通用算法的一大進步?!贝蠖鄶?shù)AI被認為“用途有限”,因為它們只能執(zhí)行單一任務,例如,翻譯、識別面孔。但通用型AI在許多不同任務上擁有超越人類的潛能。哈撒比斯認為,在接下來十年,AlphaGo的迭代產(chǎn)品將成為科學家和醫(yī)學專家,與人類并肩工作。
此外,AlphaGo Zero比它的許多前輩都要高效得多。AlphaGo Lee需要使用幾臺機器和48個谷歌張量處理單元機器學習加速器芯片,該系統(tǒng)的早期版本AlphaGo Fan需要176個GPU。而AlphaGo Zero和AlphaGo Master一樣,只需要一臺機器和4個TPU。
細分市場研究 可行性研究 商業(yè)計劃書 專項市場調(diào)研 兼并重組研究 IPO上市咨詢 產(chǎn)業(yè)園區(qū)規(guī)劃 十三五規(guī)劃
中研網(wǎng) 發(fā)現(xiàn)資訊的價值
研究院 掌握產(chǎn)業(yè)最新情報 中研網(wǎng)是中國領先的綜合經(jīng)濟門戶,聚焦產(chǎn)業(yè)、科技、創(chuàng)新等研究領域,致力于為中高端人士提供最具權威性的產(chǎn)業(yè)資訊。每天對全球產(chǎn)業(yè)經(jīng)濟新聞進行及時追蹤報道,并對熱點行業(yè)專題探討及深入評析。以獨到的專業(yè)視角,全力打造中國權威的經(jīng)濟研究、決策支持平臺!
廣告、內(nèi)容合作請點這里尋求合作
10月19日消息,中國在線消費分期平臺趣店在紐交所上市,交易代碼為“QD”。上市首日報收于29.18美元,較發(fā)行價24美元2...
專家最近在受到廣泛使用的Wi-Fi加密協(xié)議上發(fā)現(xiàn)的漏洞,可能導致數(shù)以百萬計的使用者容易遭受攻擊,包括41%的Android設...
9月25-28日,微信更改了啟動畫面,畫面中的“藍色彈珠”從非洲大陸轉到了中國。有些人說這是馬化騰熱愛天文學的例證。...
阿爾法狗再進化 最強版阿爾法狗是如何煉成的?倫敦當?shù)貢r間10月18日18:00(北京時間19日01:00),谷歌旗下的DeepMi...
近日,蘋果公司正在洽談收購美國一家醫(yī)療初創(chuàng)企業(yè) Crossover Health,并可能借此進一步拓展自己在醫(yī)療健康產(chǎn)業(yè)的版C...
在全面屏大潮的催使下,努比亞在10月12日發(fā)布旗下首款全面屏新機,努比亞Z17S。全面屏+無邊框讓筆者點亮屏幕的那一刻...
中研普華集團聯(lián)系方式廣告服務版權聲明誠聘英才企業(yè)客戶意見反饋報告索引網(wǎng)站地圖 Copyright ? 1998-2020 ChinaIRN.COM All Rights Reserved. 版權所有 中國行業(yè)研究網(wǎng)(簡稱“中研網(wǎng)”) 粵ICP備05036522號