第1994章第1997章硬體條件受限的情況下，“蒸餾”的重要性

2026-01-04 作者：方寸山下

為了生存被動的工作，為了更好的生活主動去工作，哪種效率高？

無疑是後者。

既能夠滿足經濟需要，又能獲得名譽，基於興趣富有激情的去工作呢？

也許興趣和激情有一天會消退，但在消退之前，效率無疑是最高的。會讓人不自覺的，忘我的，不知疲憊的，靈感迸發的投入其中……

此刻位於溫莎的B實驗室，所有科研人員不論白髮蒼蒼已經功成名就的，還是笨拙稚嫩處於學習和積累階段的，每一個都拿出了平生最大的熱情，投入到了“大計劃”當中。

牛、劍與B實驗室之間的計算機網路架設完成後，一直有個國際象棋體驗專案。

之所以選國際象棋，是因為這是如今人工智慧領域競爭最激烈的賽道。從74年開始，專門開設了世界計算機象棋錦標賽。

人工智慧與人類棋手的對弈，也一直是非常熱門的話題。

主要是能夠讓不同知識背景的人，直觀的判斷出所謂“人工智慧”的智慧程度……

世界範圍內參與這條賽道的IT公司與實驗室非常多，小來小去的不提，比較知名的就有一堆。

老美的Cray Research公司，依靠Cray-1 超級計算機一直處於頂尖水平。

毛子的莫斯科控制科學研究所，第一屆世界計算機象棋錦標賽就是他們承辦的，並取得了冠軍。

還有老美的David Kittinger公司、老美的西北大學，以及77年啟動原型機開發， 78年獲得北美計算機象棋錦標賽並奪冠，80年獲得世界計算機象棋錦標賽冠軍的貝爾實驗室。

這裡面有兩個背景要科普一下。

第一個背景。

別看前面那些參與人工智慧專案的公司、高校和實驗室好像挺厲害似的，但即便是眼下效能最強的，貝爾實驗室的“Belle”專用計算機，國際象棋Elo評級也只有2200到2300。

其次是Cray Research對Cray-1 超級計算進行專業最佳化後的Cray Blitz，有2100到2200。

第三David Kittinger的MyChess，能夠達到2000至2100。

而時下的國際象棋頂尖大師們，Elo評分都在2700+。準頂級大師在 2650到2695之間。特級大師的最低標準是 2500分。“大師”的入門標準是2400。

也就是說，時下競爭火熱的“人工智慧們”，即便是排名第一的“Belle”，距離大師的入門水準，也還有一段距離呢。

第二個背景。

對計算機而言，棋力表現的基礎有兩個，算力和資料庫。

前者決定了單局落子時限內的搜尋深度，說白了就是每次落子前能算出後面多少步棋路發展。

時下人工智慧的算力，硬體基礎加上軟體最佳化，普遍在 8至9層左右。

貝爾實驗室的“Belle”，依靠PDP-11/23 加LSI-11處理器，再加上多塊專用定製電路板。採用混合架構和硬體加速技術，能達到10層+。

具象一點，每秒鐘能夠比對約16到18 萬個局面，是所有競爭對手中最快的。

這並不是一個穩定結果，具體表現要結合棋面的複雜程度。而且，國際象棋標準賽中，每局就時間分配而言分三個區段。每個區段留給人和計算機思考的時間都不一樣。

而人類頂尖大師，能夠穩定達到12到13層。狀態特別好時，甚至能達到14層。

這也是個波動值。畢竟人類身體的客觀條件決定了，時時刻刻都要面臨多維度的干擾和影響……冷了熱了、飢了飽了、有尿了憋屎了，後背有點刺撓，苦茶子有點勒溝子……

女朋友劈腿了，五歲的女兒早戀，十五歲的兒子又尿床，觀眾席有人咳嗽……哪來的臭雞蛋味兒……誒？內妞兒真漂亮……

至於資料庫，貝爾實驗室的“Belle”內建了二十八萬套局面的開局庫，是眼下賽道內所有計算機中最高的。

艾茲格一幫人早就想好了，“悟空”想要真正取得業內認可，最佳的捷徑就是參加世界計算機象棋錦標賽，以及戰勝知名人類棋手。

但那這三個月之前的想法，和制定的初步計劃。所有人都認為，需要很長的時間做準備。

因為，“悟空”和現有的所有“人工智慧”都完全不同的。

聚焦於國際象棋這一點，現有的“人工智慧”知識獲取，完全依賴人類專家編碼的規則和棋理。依託專用的“棋類計算器”執行，演算法與硬體深度繫結國際象棋問題。

這種“人工智慧”，無法應對人類未編碼的複雜局面，需要專家持續更新規則庫。

而“悟空”依託的算力單元，硬體層面沒有針對國際象棋做任何專項最佳化，也沒有做最佳化的計劃。

軟體層面，將國際象棋的基本規則“教”給它，然後透過兩種方式進行強化。

其一是，將歷史比賽資料轉化為知識，投餵給它。讓它基於“規則”和“知識”，透過 MCTS演算法和神經網路組合自我訓練。

其二是不斷給他找對手，它的深度卷積網路會在對局中基於勝率，自動捕捉高階模式。

聽著很美好，但也導致引數空間擴張和外部資料資產的不斷積累。

簡單的說，資料量越來越大。

而計算機的算力、匯流排、記憶體、外部儲存器和磁碟陣列控制器的吞吐、讀寫速度都是有限的。資料量越來越大，就意味著呼叫、比對、決策的時間越來越慢。

而國際象棋的時間規則又那麼嚴苛，這幾乎是無解的矛盾……

誰也沒想到，這個問題在曲卓上次來時，所有人都沒留意的情況下，就被初步解決了。

雖然他只待了大半天，其中很大一部分時間還用在了開會和閒聊上。

閒聊過程中，得知引數量越來越大，不但佔用了大量寶貴的硬碟空間，甚至為了保證讀取速度，不得不將資料分配到不同磁碟陣列裡。

確定了問題後，曲卓只用了兩個小時左右，就編輯了一個知識庫蒸餾程式。隨後用蒸餾程式對現有資料進行清洗、去重，還修改了標註規則。

“蒸餾”的過程非常慢，分佈在四個磁碟陣列下，已經累積到接近3G的專項知識庫，用了二十多個小時才完成。

等蒸餾結束後，實驗室的人驚訝的發現，新的智慧體資料包，居然只有兩百三十多兆，引數量從億級驟降到了百萬級。

沒有人知道如此誇張的脫水比，在提升知識密度的同時，會損失多少有效知識。但毫無疑問，運算速度重新回到了絲滑流暢的水平。

呃~~

只能說，不同的時代，對“絲滑流暢”這一評價的閾值，是不同的。

然後，就是不斷的驚喜。

大概從去年年底諾貝爾頒獎前後開始，引數進行過深度最佳化的“悟空”，進入了連勝狀態。

訊息傳開後，之前那些體驗後便失去了興致的國際象棋高手們，有人起了再次體驗的興趣。

今年一月中，“悟空”在所有人都毫無準備的情況下，突兀的贏了一位繼去年夏天后，第二次至牛津體驗與“悟空”對弈的國際象棋大師大衛?古德曼。

大衛?古德曼國際棋聯認證，Elo 2380-世界排名290至300的IM級職業選手。

“悟空”連贏了他三盤，一盤比一盤輕鬆。

越來越輕鬆，不是“悟空”短時間內“棋力暴漲”，是大衛?古德曼在輸掉第一盤後，被旁觀者的驚訝和驚呼影響了心態，後面兩盤水準連續下滑。

雖然“悟空”只是贏了個國際排位三百名左右的大師，但三百名也是大師呀。

很快，“WoKong”戰勝國際象棋IM級選手David Goodman這一訊息，被戴英Electronics Weekly（一份電子專業報）的81年一月上半月刊報道了出來，並很快在小圈子裡引發了熱議。

（國際特級大師 GM、國際大師 IM、棋聯大師 CM）

後面的一個多月，陸續有十餘位得到訊息的大師級選手，慕名前往劍橋和牛津……“悟空”的戰績是57勝，31負。

在戴英各路媒體的重點關注和推波助瀾下，訊息瞬間“吹”遍了歐洲各國，甚至北美的媒體也跟著開始報道。

尤其是計算機和電子類報紙、雜誌，幾乎全都做了報道，差異只在於篇幅、激動、樂觀與質疑。

四月初，“悟空”迎來了一位重量級對手，81年一月FIDE官方最新排名全球第五，毛子裔高盧GM級國際特級大師斯帕斯基。

結局是兩勝一和兩負。

“悟空”首局輸了，但斯帕斯基贏的並不輕鬆，第二局斯帕斯基依舊贏了，同樣不輕鬆。第三局和棋，四、五局悟空連勝。

很明顯，只要一直下下去，“悟空”的連勝數幾乎一定會不斷累加下去。

因為，只要不斷電、不卡機，網路不出故障，“悟空”就能一直保穩定的狀態。

但43歲的斯帕斯基不行。半天完成五局，已經是他體力和腦力的極限了，繼續下去狀態只會不斷下滑。

“戰平世界排名第五”這一訊息驚爆後，“悟空”真的出名了。

“WoKong”這個單詞剛與人工智慧領域出現時，在戴英媒體的吹捧下，靠著Q-learning、GBDT等一系列新演算法和卷積神經網路等全新的概念，成為了一時間熱議的話題。

但也只是一時熱議……