首頁 分類 排行榜 閱讀記錄 我的書架

第1994章 第1997章 硬體條件受限的情況下,“蒸餾”的重要性

2026-01-04 作者:方寸山下

為了生存被動的工作,為了更好的生活主動去工作,哪種效率高?

無疑是後者。

既能夠滿足經濟需要,又能獲得名譽,基於興趣富有激情的去工作呢?

也許興趣和激情有一天會消退,但在消退之前,效率無疑是最高的。會讓人不自覺的,忘我的,不知疲憊的,靈感迸發的投入其中……

此刻位於溫莎的B實驗室,所有科研人員不論白髮蒼蒼已經功成名就的,還是笨拙稚嫩處於學習和積累階段的,每一個都拿出了平生最大的熱情,投入到了“大計劃”當中。

牛、劍與B實驗室之間的計算機網路架設完成後,一直有個國際象棋體驗專案。

之所以選國際象棋,是因為這是如今人工智慧領域競爭最激烈的賽道。從74年開始,專門開設了世界計算機象棋錦標賽。

人工智慧與人類棋手的對弈,也一直是非常熱門的話題。

主要是能夠讓不同知識背景的人,直觀的判斷出所謂“人工智慧”的智慧程度……

世界範圍內參與這條賽道的IT公司與實驗室非常多,小來小去的不提,比較知名的就有一堆。

老美的Cray Research公司,依靠Cray-1 超級計算機一直處於頂尖水平。

毛子的莫斯科控制科學研究所,第一屆世界計算機象棋錦標賽就是他們承辦的,並取得了冠軍。

還有老美的David Kittinger公司、老美的西北大學,以及77年啟動原型機開發, 78年獲得北美計算機象棋錦標賽並奪冠,80年獲得世界計算機象棋錦標賽冠軍的貝爾實驗室。

這裡面有兩個背景要科普一下。

第一個背景。

別看前面那些參與人工智慧專案的公司、高校和實驗室好像挺厲害似的,但即便是眼下效能最強的,貝爾實驗室的“Belle”專用計算機,國際象棋Elo評級也只有2200到2300。

其次是Cray Research對Cray-1 超級計算進行專業最佳化後的Cray Blitz,有2100到2200。

第三David Kittinger的MyChess,能夠達到2000至2100。

而時下的國際象棋頂尖大師們,Elo評分都在2700+。準頂級大師在 2650到2695之間。特級大師的最低標準是 2500分。“大師”的入門標準是2400。

也就是說,時下競爭火熱的“人工智慧們”,即便是排名第一的“Belle”,距離大師的入門水準,也還有一段距離呢。

第二個背景。

對計算機而言,棋力表現的基礎有兩個,算力和資料庫。

前者決定了單局落子時限內的搜尋深度,說白了就是每次落子前能算出後面多少步棋路發展。

時下人工智慧的算力,硬體基礎加上軟體最佳化,普遍在 8至9層左右。

貝爾實驗室的“Belle”,依靠PDP-11/23 加LSI-11處理器,再加上多塊專用定製電路板。採用混合架構和硬體加速技術,能達到10層+。

具象一點,每秒鐘能夠比對約16到18 萬個局面,是所有競爭對手中最快的。

這並不是一個穩定結果,具體表現要結合棋面的複雜程度。而且,國際象棋標準賽中,每局就時間分配而言分三個區段。每個區段留給人和計算機思考的時間都不一樣。

而人類頂尖大師,能夠穩定達到12到13層。狀態特別好時,甚至能達到14層。

這也是個波動值。畢竟人類身體的客觀條件決定了,時時刻刻都要面臨多維度的干擾和影響……冷了熱了、飢了飽了、有尿了憋屎了,後背有點刺撓,苦茶子有點勒溝子……

女朋友劈腿了,五歲的女兒早戀,十五歲的兒子又尿床,觀眾席有人咳嗽……哪來的臭雞蛋味兒……誒?內妞兒真漂亮……

至於資料庫,貝爾實驗室的“Belle”內建了二十八萬套局面的開局庫,是眼下賽道內所有計算機中最高的。

艾茲格一幫人早就想好了,“悟空”想要真正取得業內認可,最佳的捷徑就是參加世界計算機象棋錦標賽,以及戰勝知名人類棋手。

但那這三個月之前的想法,和制定的初步計劃。所有人都認為,需要很長的時間做準備。

因為,“悟空”和現有的所有“人工智慧”都完全不同的。

聚焦於國際象棋這一點,現有的“人工智慧”知識獲取,完全依賴人類專家編碼的規則和棋理。依託專用的“棋類計算器”執行,演算法與硬體深度繫結國際象棋問題。

這種“人工智慧”,無法應對人類未編碼的複雜局面,需要專家持續更新規則庫。

而“悟空”依託的算力單元,硬體層面沒有針對國際象棋做任何專項最佳化,也沒有做最佳化的計劃。

軟體層面,將國際象棋的基本規則“教”給它,然後透過兩種方式進行強化。

其一是,將歷史比賽資料轉化為知識,投餵給它。讓它基於“規則”和“知識”,透過 MCTS演算法和神經網路組合自我訓練。

其二是不斷給他找對手,它的深度卷積網路會在對局中基於勝率,自動捕捉高階模式。

聽著很美好,但也導致引數空間擴張和外部資料資產的不斷積累。

簡單的說,資料量越來越大。

而計算機的算力、匯流排、記憶體、外部儲存器和磁碟陣列控制器的吞吐、讀寫速度都是有限的。資料量越來越大,就意味著呼叫、比對、決策的時間越來越慢。

而國際象棋的時間規則又那麼嚴苛,這幾乎是無解的矛盾……

誰也沒想到,這個問題在曲卓上次來時,所有人都沒留意的情況下,就被初步解決了。

雖然他只待了大半天,其中很大一部分時間還用在了開會和閒聊上。

閒聊過程中,得知引數量越來越大,不但佔用了大量寶貴的硬碟空間,甚至為了保證讀取速度,不得不將資料分配到不同磁碟陣列裡。

確定了問題後,曲卓只用了兩個小時左右,就編輯了一個知識庫蒸餾程式。隨後用蒸餾程式對現有資料進行清洗、去重,還修改了標註規則。

“蒸餾”的過程非常慢,分佈在四個磁碟陣列下,已經累積到接近3G的專項知識庫,用了二十多個小時才完成。

等蒸餾結束後,實驗室的人驚訝的發現,新的智慧體資料包,居然只有兩百三十多兆,引數量從億級驟降到了百萬級。

沒有人知道如此誇張的脫水比,在提升知識密度的同時,會損失多少有效知識。但毫無疑問,運算速度重新回到了絲滑流暢的水平。

呃~~

只能說,不同的時代,對“絲滑流暢”這一評價的閾值,是不同的。

然後,就是不斷的驚喜。

大概從去年年底諾貝爾頒獎前後開始,引數進行過深度最佳化的“悟空”,進入了連勝狀態。

訊息傳開後,之前那些體驗後便失去了興致的國際象棋高手們,有人起了再次體驗的興趣。

今年一月中,“悟空”在所有人都毫無準備的情況下,突兀的贏了一位繼去年夏天后,第二次至牛津體驗與“悟空”對弈的國際象棋大師大衛?古德曼。

大衛?古德曼國際棋聯認證,Elo 2380-世界排名290至300的IM級職業選手。

“悟空”連贏了他三盤,一盤比一盤輕鬆。

越來越輕鬆,不是“悟空”短時間內“棋力暴漲”,是大衛?古德曼在輸掉第一盤後,被旁觀者的驚訝和驚呼影響了心態,後面兩盤水準連續下滑。

雖然“悟空”只是贏了個國際排位三百名左右的大師,但三百名也是大師呀。

很快,“WoKong”戰勝國際象棋IM級選手David Goodman這一訊息,被戴英Electronics Weekly(一份電子專業報)的81年一月上半月刊報道了出來,並很快在小圈子裡引發了熱議。

(國際特級大師 GM、國際大師 IM、棋聯大師 CM)

後面的一個多月,陸續有十餘位得到訊息的大師級選手,慕名前往劍橋和牛津……“悟空”的戰績是57勝,31負。

在戴英各路媒體的重點關注和推波助瀾下,訊息瞬間“吹”遍了歐洲各國,甚至北美的媒體也跟著開始報道。

尤其是計算機和電子類報紙、雜誌,幾乎全都做了報道,差異只在於篇幅、激動、樂觀與質疑。

四月初,“悟空”迎來了一位重量級對手,81年一月FIDE官方最新排名全球第五,毛子裔高盧GM級國際特級大師斯帕斯基。

結局是兩勝一和兩負。

“悟空”首局輸了,但斯帕斯基贏的並不輕鬆,第二局斯帕斯基依舊贏了,同樣不輕鬆。第三局和棋,四、五局悟空連勝。

很明顯,只要一直下下去,“悟空”的連勝數幾乎一定會不斷累加下去。

因為,只要不斷電、不卡機,網路不出故障,“悟空”就能一直保穩定的狀態。

但43歲的斯帕斯基不行。半天完成五局,已經是他體力和腦力的極限了,繼續下去狀態只會不斷下滑。

“戰平世界排名第五”這一訊息驚爆後,“悟空”真的出名了。

“WoKong”這個單詞剛與人工智慧領域出現時,在戴英媒體的吹捧下,靠著Q-learning、GBDT等一系列新演算法和卷積神經網路等全新的概念,成為了一時間熱議的話題。

但也只是一時熱議……

A−
A+
護眼
目錄