他抬頭往遠處瞥了一眼。
白色商務車還停在原位,車窗上映著路燈的橘黃色反光,看不清裡面坐的人。
林宇收回視線,按下了回撥鍵。
嘟——
第二聲還沒響完,對面接了。
“林老師?”
聲音比他預想中年輕,語速快,帶著一種常年泡實驗室的人才有的乾脆。
“沈教授,剛看到您的簡訊。”
“方便聊幾分鐘嗎?”
“方便。”
沒有“久仰大名”,沒有“冒昧打擾”,連“您最近很火”這種廢話都省了。
“林老師,你展示課上那個對話程式的底層架構,我反覆推演了三個小時。”
林宇握著手機的手微微收緊。
展示課的前十二分鐘流出去了,那部分只有投擲粉筆和預測股票,跟AI架構的核心程式碼八竿子打不著。後半段被王志海全面封鎖,所有學生手機裡的影像資料都做了處理。
沈一舟怎麼拿到的?
“沈教授,展示課後半段的內容已經被限制傳播了,您的資訊來源是?”
電話那頭頓了一拍,然後沈一舟笑了。
那笑聲裡沒有心虛,反而很坦蕩。
“省教育廳有個朋友,在現場聽了你的課。他沒拍影片,但手抄了幾頁你的板書推導過程。不是程式碼,全是數學公式。拍了照片傳給我的。”
停了一下。
“我根據你的數學推導,反向還原了程式的大致架構走向。”
林宇的拇指在褲縫上蹭了兩下。
幾頁板書推導,還不完整,中間肯定有斷層和缺失。
沈一舟硬是從這些殘缺的碎片裡,把架構的核心邏輯拼了出來。
對方不愧是頂尖學府的人。
“方案是我自己推的。”林宇回答。
“能解釋一下壓縮維度的動機嗎?64維降到16維,按常規理解,資訊損失會非常嚴重。”
林宇腦子裡,系統返還的宗師級AI知識體系自動運轉。
“因為64維本身就過剩了。”
他往下講,沒用任何學術腔。
“主流架構用64維,是五年前TranSfOrmer團隊做ablatiOn StUdy時的最優解。但那是五年前的資料規模。現在訓練語料翻了上千倍,高維度的邊際收益在急劇衰減,大部分維度佔了算力,對語義理解的貢獻接近於零。”
“繼續。”
“壓到16維確實會丟一部分細粒度的語義資訊。所以我在交叉層加了動態加權來補償。讓模型自己決定,每次推理中哪些維度值得保留,哪些直接丟。權重不是固定的,根據上下文實時調整。”
電話那頭傳來筆尖劃紙的聲音,急促、密集,刷刷刷響了十幾秒。
“林老師,再問一個。”
沈一舟的語氣變了,之前是學者討論技術時的精準和剋制,現在多了一層東西,是一種按捺不住的急切。
“幻覺問題。模型一本正經地編造事實,當前最大的痛點。你有沒有想過解決方案?”
林宇瞬間站直了身子。
這個問題他不是“想過”。是系統返還的知識體系裡,已經自然生成了一條完整路徑。
“在生成層之前,插一個事實錨定模組。基於貝葉斯後驗機率。”
“甚麼思路?”
“現在主流做法是生成之後做事實校驗,拿外部知識庫去比對。但本質上是'先說了再查',效率低,而且模型已經生成的內容會形成路徑依賴,糾錯成本極高。”
他頓了一下。
“我的思路反過來。在模型選擇下一個tOken之前,先過一道貝葉斯篩。候選tOken的機率分佈和訓練語料中的事實分佈做交叉驗證,偏差超過閾值,直接在源頭截斷,不讓它進入生成序列。”
電話那頭的筆停了。
安靜了很久。
“計算開銷呢?每一步都做後驗機率計算,推理速度會被拖垮。”
“所以錨定模組不是每一步都觸發。”林宇的語速不急不慢,“只有當生成層的困惑度突然飆升——模型自己也'拿不準'的時候——錨定模組才介入。常規生成任務,根本不需要額外計算。”
對面沒有聲音了。
安靜得只剩風聲。
林宇低頭看了眼螢幕,通話時間還在跳。沒斷。
“林老師。”
沈一舟再開口的時候,語氣跟二十分鐘前完全不是一個人。
“我做了二十二年的自然語言處理。”
“嗯。”
“今晚這四十多分鐘,我學到的東西,比過去三年加起來都多。”
操場上的風停了一瞬。
林宇站在原地,一隻手撐著鐵欄杆,另一隻手攥著手機,沒出聲。
上輩子,那間二十平米的補習教室,十幾個初三學生,他在黑板上講二次函式的頂點座標公式。一節課兩百塊,一個月賺不到六千。他教過最得意的一個學生,從班級倒數第五考到了正數第十二。
他連重點高中的校門都沒資格進去參觀。
那一輩子要是知道今天這一幕,怕是做夢都要笑醒。
“沈教授過獎了。”
“我沒有過獎。”沈一舟的語氣很認真,“林老師,我想正式跟你談一件事。”
林宇的後背離開了鐵欄杆。
“清華計算機系願意聘請你為特聘教授。”
每一個字都擲在地上。
“不需要走常規評審流程。我會聯合系裡三位院士直接推薦。待遇按最高標準配置,獨立實驗室、科研啟動經費、教職住房,全部到位。”
沈一舟停了一拍。
“我個人非常希望能成為你的同事。清華需要你,林老師。”
風又吹起來了,從東邊過來,帶著夜裡特有的潮氣。
清華大學特聘教授。
院士聯名推薦,跳過所有常規評審。
這份邀約擱在學術圈任何一個人面前,都足以讓人當場站不穩。
可林宇腦子裡蹦出來的第一個畫面,不是清華的實驗室,不是獨立經費。
是趙磊。
前天晚上興高采烈發來的截圖,PythOn寫的K線分析程式跑出了第一個正確的趨勢預測。
模型粗糙得不像話,但趙磊激動得在訊息框裡打了一整屏感嘆號。
一個兩週前連print函式都不會拼的體育生。
是陳雨薇。
機率論習題做到第三步才繞遠,比半個月前進步了不止一個檔次。
是張巧兒。
兩個小時前剛從高鐵站出來,行李箱右輪還是卡的,咕嚕咕嚕地在地磚上響。
307宿舍那張空了半年的床,今晚終於有人躺上去了。
還有周昊,還有蘇晚,還有那些從外院跑來蹭課、在走廊上坐著書包聽講的學生。
他們的課還沒上完。
“沈教授。”
林宇開口了。
“這件事,我得考慮考慮。”
“當然,你可以慢——”
“不是客氣話。”林宇接上去,
“我手上有一批學生,有幾個剛剛找到方向。
趙磊兩週前連PythOn的print函式都不會拼,昨天自己跑通了第一個程式。
有個女生半年前被校園貸逼退了學,今天剛回來,復學手續是我幫她辦的。”
他看著遠處宿舍樓裡零星亮著的窗戶。
“我現在走了,他們怎麼辦?”
電話那頭安靜了好幾秒。
然後沈一舟笑了一聲。
那個笑聲不大,但裡面沒有失望,沒有掃興。
“林老師,你知道嗎?”
“嗯?”
“你剛才這番話,恰好解釋了為甚麼你能教出那樣的課。”
林宇沒接。
“清華的大門,任何時候都為你敞開。不管是明天,還是十年後。你甚麼時候想來,一個電話就夠了。”
“謝謝您。”
“你那個貝葉斯錨定模組的方案,我回去再推一推。有新想法了還能找你討論嗎?”
“隨時都行。”
“那先這樣,晚安。”
“晚安。”
結束通話。
林宇低頭,通話記錄上跳著一行數字。
47分13秒。
他把手機揣回口袋,從欄杆上撐起身,往宿舍方向邁了兩步。
褲兜又震了。
林宇掏出手機。
螢幕上彈出來的名字,讓他邁出去的腳定在了原地。
歐陽清風。
蘇省科技大學計算機系主任。
省級展示課評審席上,把評分表翻到背面抄他程式碼框架、整整抄了兩大頁的那位。
手機震到第四聲,林宇按下接聽。
“林老師?我是歐陽清風。這個點打擾你了。”
對面頓了一下,聲音裡裹著一股明晃晃的急迫。
“但我怕再晚,你就被別人搶走了。”