首頁 分類 排行榜 閱讀記錄 我的書架

第2章 基礎算力的產業挑戰與突破路徑

2025-11-22 作者:巴蜀魔幻俠

咱們常說的“基礎算力”,其實就是支撐人工智慧、大資料這些技術跑起來的“底層動力”,像手機、電腦裡的晶片,還有資料中心裡的伺服器,都是它的核心硬體。但現在這個“動力系統”的發展,正卡在幾個關鍵難題上,同時還得兼顧安全、公平這些事兒。接下來咱們就拆成三個部分,用大白話把這些問題和解決辦法說清楚。

一、三大技術瓶頸:先進製程、架構創新、能耗,個個都是“硬骨頭”

基礎算力要想變強,核心得靠硬體升級,但現在硬體升級遇上了三個繞不開的“坎兒”——先進製程、架構創新和能耗問題。這三個問題能不能解決、解決得快不快,直接決定了未來算力能跑到多快、多穩。

先說說“先進製程”,這玩意兒其實就是晶片上電晶體的“大小”。電晶體越小,晶片上能裝的數量就越多,算力也就越強。現在全球最頂尖的晶片,已經做到3奈米甚至2奈米了(1奈米大概是一根頭髮絲直徑的五萬分之一),但再想往小做,難度簡直是“滾雪球”式增加。

一方面是“物理極限”攔路。當電晶體小到快接近原子級別時,就會出現“量子隧穿效應”——簡單說就是電流會“不守規矩”,本來該走的電路不走,反而“穿牆”跑到別的地方去了,這樣晶片就會出現漏電、效能不穩定的情況,就像家裡的電線短路一樣,機器根本沒法正常工作。現在科學家雖然能透過新材料、新結構緩解這個問題,但成本和技術複雜度都在飆升。

另一方面是“錢和良率”的問題。想生產先進製程的晶片,得先建生產線,一條3奈米的生產線,投資就得超過200億美元(差不多1400多億人民幣),相當於建好幾座大型發電廠的錢。而且就算生產線建好了,也不是每顆晶片都能合格——這就是“良率”問題。目前3奈米晶片的良率只能維持在60%-70%,也就是說生產100顆晶片,有30-40顆是壞的、沒法用的。這些壞晶片的成本,最後都得攤到好晶片上,導致算力硬體的價格居高不下,普通企業和使用者想用上高算力裝置,就得花更多錢。

再看“架構創新”,這裡的“架構”可以理解為晶片的“工作流程設計”。現在咱們用的AI計算,大多靠GPU晶片(比如英偉達的A100、H100),它的架構是“通用型”的,就像一輛能拉貨、能載人、還能跑長途的多功能車,啥活兒都能幹,但幹某件具體活兒的時候,效率不一定最高。

這裡的矛盾就在於“通用性和效率沒法兩頭顧”。如果把晶片架構設計成“通用型”,能適配影象識別、語音合成、資料分析等多種AI任務,不用為每個任務單獨造晶片,但面對某一個特定任務(比如專門算AI模型的訓練資料),它的計算效率就會變低,就像用多功能車拉超重貨物,跑不快還費油。

如果反過來,把架構設計成“專用型”,專門針對某一個任務最佳化,效率確實能提上去,比如專門算密碼的晶片、專門處理影象的晶片,速度比通用晶片快好幾倍,但問題是“不靈活”——一旦任務變了,這顆晶片就沒用了,比如用影象晶片去算語音資料,根本算不了。所以現在架構創新的核心難題,就是怎麼在“啥都能幹”和“幹得快”之間找到平衡,既不用為每個任務單獨造晶片,又能保證計算效率不打折。

最後是“能耗問題”,這事兒現在越來越突出,甚至成了算力產業的“緊箍咒”。隨著AI、大資料的需求暴漲,資料中心的數量越來越多,規模也越來越大,而這些資料中心都是“電老虎”——目前全球資料中心的能耗,已經佔了全球總能耗的3%以上,相當於好幾個中等國家一年的總用電量。

其中AI伺服器的能耗更是離譜,它比普通的傳統伺服器(比如咱們平時用的電腦主機)費電5-10倍。一臺用來訓練AI模型的伺服器,功率能達到好幾千瓦,相當於同時開幾十臺空調的耗電量。如果是一個大規模的算力叢集(比如有幾千臺伺服器的資料中心),一年的能耗能趕上一個小型城鎮的總用電量。

高能耗帶來的問題不止一個:一方面是運營成本高,資料中心光交電費就是一筆天文數字,這些成本最後還是會轉嫁到使用者身上;另一方面是和“雙碳”目標(碳達峰、碳中和)衝突——現在全球都在減碳,而資料中心的高能耗會排放大量二氧化碳,不符合環保要求。所以如果能耗問題解決不了,就算算力能提上去,也沒法持續發展,相當於給算力產業套上了“電量枷鎖”。

二、安全與合規:算力發展的“底線”,不能碰也碰不得

算力要發展,光解決技術問題還不夠,還得守好“安全底線”——也就是算力使用過程中的資料隱私保護和算力資源管控。這兩件事要是出了問題,不僅會損害使用者利益,還會影響整個產業的健康發展,相當於給算力產業埋下“定時炸彈”。

先說說“資料隱私保護”。算力的核心是“計算資料”,不管是AI訓練、大資料分析,還使用,都需要處理大量資料,其中很多是敏感資料——比如醫療領域的患者病歷(包含姓名、病情、病史等私人資訊)、金融領域的交易記錄(銀行卡號、轉賬金額、消費習慣等)、還有咱們手機裡的定位、聊天記錄等。這些資料在透過算力裝置計算、傳輸的時候,很容易出現洩露風險。

一方面是“傳輸環節被攻擊”。資料在從手機、電腦傳到資料中心的過程中,會經過網路,就像快遞在運輸途中可能被偷一樣,駭客可能會透過技術手段攔截這些資料,然後賣掉或者用來做違法的事。比如之前有駭客攻擊某醫療平臺,偷走了幾十萬患者的病歷,然後向平臺勒索錢財,否則就把病歷公開,這就是典型的資料傳輸洩露問題。

另一方面是“共享算力時的交叉訪問”。現在很多企業和個人會用“雲算力”——也就是租用雲服務商(比如阿里雲、騰訊雲)的算力資源,這些資源是多使用者共享的,就像好幾個人共用一個儲物櫃,要是鎖沒關好,就可能開啟別人的櫃子。2023年就發生過這樣的事:某雲服務商的算力排程系統出了漏洞,導致一些企業存在雲端的資料,被其他租用算力的使用者意外訪問到,雖然沒有造成大規模損失,但也暴露了共享算力的隱私風險。

再看“算力資源管控”。現在算力已經成了和水、電、石油一樣重要的“生產要素”,誰掌握了算力,誰就能在AI、科技競爭中佔優勢。但這種重要性也帶來了兩個問題:一是“算力濫用”,二是“算力壟斷”。

“算力濫用”就是用算力幹違法的事。比如有些不法分子會用高算力裝置破解密碼——比如銀行賬戶密碼、網站後臺密碼,因為算力越強,破解速度越快;還有人用算力大規模生成虛假資訊,比如AI換臉影片、虛假新聞,用來詐騙或者造謠。這些行為不僅危害個人和企業利益,還會擾亂社會秩序,要是不管控,算力就成了“違法工具”。

“算力壟斷”則是少數企業或國家掌控了大部分算力資源,導致其他人用不上或者用不起。比如全球排名前5的雲服務商(亞馬遜AWS、微軟Azure、谷歌雲、阿里雲、騰訊雲),掌控了超過70%的公共算力資源,相當於這5家公司手裡攥著大部分“算力水龍頭”。中小企業想租用算力,不僅價格高,還可能面臨資源被限制的問題——比如在AI模型訓練的關鍵時期,算力被大公司優先佔用,中小企業只能排隊等。這就導致“人工智慧+”的發展沒法普及,只有大公司能玩得起,中小微企業只能看著,不符合公平發展的原則。

三、區域算力均衡:“東數西算”+算力普惠,讓算力“不偏科”

咱們國家地域遼闊,東部和西部的經濟、資源情況差別很大,反映在算力上,就是“東部不夠用,西部用不完”——區域算力失衡,這就像一個人一條腿粗、一條腿細,跑不快也跑不穩。而要實現“人工智慧+”全面落地(比如讓AI在東部的工廠、西部的農業都能用起來),就得先解決這個“失衡”問題,讓算力在全國範圍內“均勻分配”。現在主要靠兩個辦法:“東數西算”工程和算力普惠實踐。

先說說“東數西算”工程,這名字聽起來有點專業,其實就是“把東部的資料,拿到西部去計算、儲存”。為啥要這麼做?因為東部和西部的“優勢和需求”剛好互補。

東部地區(比如長三角、珠三角、京津冀)經濟發達,AI應用場景特別多——工廠裡的智慧生產線、醫院裡的AI診斷、城市裡的智慧交通,都需要大量算力。但東部的土地資源緊張,建一個大型資料中心要佔不少地,而且電費也高(東部工業用電、商業用電價格比西部貴),再加上環保要求,很難再大規模建資料中心,導致算力供應跟不上需求,出現“算力缺口”。

而西部地區(比如內蒙古、貴州、甘肅)剛好相反:土地多,建資料中心不用愁地方;能源也豐富,尤其是風電、光伏這些清潔能源(比如內蒙古的風能、甘肅的太陽能),電費比東部低很多,而且這些清潔能源符合“雙碳”目標,不會造成太多汙染。但西部的經濟相對落後,AI應用場景少,算力需求低,建好的資料中心大多處於“閒置”狀態,算力資源浪費嚴重。

“東數西算”工程就是把這兩邊的優勢結合起來:在東部建“算力樞紐”,負責處理需要實時響應的任務(比如手機刷影片、線上支付,這些需要資料馬上計算、馬上反饋,慢了就會卡頓);在西部建大型資料中心,負責處理“非實時任務”(比如資料儲存——把手機裡的照片、影片存到雲端,不用馬上取;還有AI模型的離線訓練——比如訓練一個識別農作物病蟲害的AI模型,需要算大量資料,但不用實時出結果,可以慢慢算)。

透過這種佈局,東部的算力壓力緩解了,西部的閒置資源也被啟用了。截至2024年,這個工程已經在內蒙古、貴州、甘肅等西部省份建成了10個國家資料中心叢集,累計承接了東部超過5000項算力遷移任務——比如上海的某網際網路公司,把使用者的歷史聊天記錄、影片備份這些資料,遷移到貴州的資料中心儲存;深圳的某AI企業,把AI模型的訓練任務放到內蒙古的資料中心計算,既省了電費,又緩解了深圳的算力緊張。

再看“算力普惠實踐”,簡單說就是“讓更多人用得起算力”。之前因為算力資源集中在大公司手裡,中小微企業、科研機構想租用算力,要麼價格太高,要麼搶不到資源,導致很多好的AI專案沒法落地。現在各地都在想辦法解決這個問題,主要有兩種方式:

一種是建“公共算力平臺”,推出“算力優惠券”。比如長三角算力排程平臺,專門針對中小微企業推出補貼——符合條件的企業(比如做AI創新的初創公司),租用算力時可以領30%-50%的“優惠券”,相當於打五到七折。比如一家做AI教育的小公司,原本租算力一個月要花10萬元,領了優惠券後只要花5-7萬元,大大降低了成本。

另一種是高校、科研院所搭建“共享算力平臺”,向科研團隊開放免費算力。很多高校的AI實驗室,會把自己的伺服器整合起來,建成共享平臺,給本校或者合作機構的科研團隊免費使用。比如某大學的AI實驗室年透過共享平臺,給超過2000個科研專案提供了免費算力——有研究AI醫療的團隊,用這些算力訓練識別肺癌的模型;有研究農業AI的團隊,用這些算力分析農作物生長資料。這樣一來,就算科研團隊沒那麼多錢租商業算力,也能開展基礎研究,推動“人工智慧+”在更多領域落地。

總的來說,基礎算力產業現在正處在“攻堅克難”的階段:既要突破技術瓶頸,解決晶片、能耗的問題;又要守好安全底線,保護資料隱私、管控算力資源;還要兼顧區域公平,讓算力在全國範圍內均衡發展。這些問題雖然難,但只要一步步推進技術創新、完善政策監管、落實普惠措施,未來算力肯定能更好地支撐“人工智慧+”的發展,讓咱們的生活、工作變得更智慧、更便捷。

A−
A+
護眼
目錄