第179章 AI的“短板”與“未來機會”：為啥看書厲害，抓個球卻不行？

2025-11-22 作者：巴蜀魔幻俠

一、先聊AI的“致命短板”：物理世界裡是個“笨傢伙”

咱們平時總聽說AI多厲害，能寫論文、能畫畫、能聊天，但你知道嗎？AI在現實物理世界裡其實挺“笨”的。就拿最簡單的事兒來說，讓AI抓個球、拼個拼圖，或者從地上撿個東西，它大機率做不好。

你可能會問，這是為啥呢？咱們舉個例子，你讓AI讀一本關於“怎麼抓球”的書，它能把書裡的精華全吸收了，比如“抓球要判斷速度、角度”“手指要張開”這些理論它門兒清。但真讓它伸手去抓，它就抓瞎了——要麼抓空了，要麼把球捏變形了。這就像一個學霸，把物理書背得滾瓜爛熟，但實際動手做實驗就一塌糊塗。

有人總結了原因：現在的AI，尤其是大語言模型，就像個“書呆子”，它的知識全是從文字里學的，比如書籍、論文、網頁。它沒在現實世界裡摸爬滾打過，沒體驗過“球從手裡滑走”的感覺，沒感受過“拼圖塊卡不進去”的挫敗，所以遇到物理世界的事兒就抓瞎。打個比方，你教一個從沒見過蘋果的人，把“蘋果是紅色、圓形、甜的”這些文字背得再熟，他第一次見到蘋果也可能認錯，因為他沒實際摸過、嘗過。

二、AI的“培訓方式”有問題：光啃書本，沒接地氣

為啥AI在物理世界裡這麼“笨”？核心問題出在“培訓方式”上。現在培訓AI，尤其是大語言模型，就是把海量的文字知識一股腦灌進去，比如把人類寫的所有書、所有論文、所有網上的文字都餵給它。但這就像讓孩子只讀書本，從不出門體驗生活，他能考上高分，但一到實際場景就傻眼。

舉個例子，你想讓AI學會“倒咖啡不灑”，如果只給它看“倒咖啡要慢、杯子要拿穩”的文字，它永遠學不會。因為它不知道“慢”是多慢，“穩”是多穩，也不知道咖啡液的重量、流速這些實際因素。但如果讓它在現實裡練幾百次，灑幾次咖啡，它慢慢就知道怎麼控制了。但現在的AI沒這個機會，它的“老師”只有文字，沒有現實世界的“實操課”。

再比如，你想讓AI理解“甚麼是軟”“甚麼是硬”。文字里可能說“棉花是軟的，石頭是硬的”，但AI沒摸過棉花和石頭，它對“軟”和“硬”的理解就只停留在文字上。真讓它區分一塊海綿和一塊橡皮，它可能就分不清了。這就是“紙上談兵”的典型後果。

三、AI缺了個關鍵能力：空間智慧（三維感知）

除了沒在現實世界培訓，AI還缺一個核心能力——空間智慧。啥是空間智慧？簡單說就是“三維感知能力”，比如判斷一個物體的大小、形狀、位置，以及它和其他物體的關係。

咱們人類天生就有這能力。你看到一個杯子放在桌子邊緣，會本能地知道“它可能會掉下去”；你拼拼圖時，會知道哪塊該往哪個角落放。但AI沒有這種感知。比如讓AI玩積木，它可能知道“這塊積木是正方形”，但不知道“把它放在左邊第三層會不會倒”。

這就像一個人在黑夜裡走路，人類能透過周圍的環境（比如牆的位置、地面的高低）判斷方向，但如果這個人沒有空間感知能力，就會到處碰壁。AI在物理世界裡就像這個“摸黑走路”的人，因為它沒有空間智慧，所以搞不定需要三維判斷的事兒，比如抓球（得判斷球的運動軌跡和自己手的位置關係）、拼圖（得判斷拼圖塊的形狀和缺口的匹配度）。

四、未來機會1：智慧眼鏡+AR，讓AI“看見”物理世界

既然AI在物理世界裡這麼“笨”，那有沒有辦法解決呢？有人提出了一個方案：智慧眼鏡+增強現實（AR）。

啥是AR增強現實？簡單說就是你戴上眼鏡後，不僅能看到真實的世界，還能看到虛擬的東西疊加在上面。比如你戴AR眼鏡看桌子，能看到桌子上的杯子旁邊彈出一個標籤，寫著“這是陶瓷杯，容量300ml”；你看遠處的建築，能看到它的結構剖面圖。

如果把AI和AR眼鏡結合起來，AI就能“看見”物理世界了。比如你讓AI幫你修腳踏車，它透過AR眼鏡“看到”腳踏車的零件，然後在你眼前彈出維修步驟，告訴你“先拆腳踏板，再檢查鏈條”。這時候AI就不是隻靠文字知識，而是結合了現實世界的視覺資訊，決策就靠譜多了。

再比如，讓AI幫你整理房間，它透過AR眼鏡“看到”地上的書、桌上的杯子，然後規劃出“先把書放回書架，再把杯子拿到廚房”的步驟。這比只靠文字描述“房間裡有書和杯子”要準確得多。

五、未來機會2：XR+AI，打造“映象世界”（虛擬和現實的融合）

除了AR眼鏡，還有個更高階的概念叫XR（擴充套件現實），它包括了AR、VR（虛擬現實）、MR（混合現實）等。如果把AI和XR結合起來，就能打造一個“映象世界”——也就是和現實世界一模一樣的虛擬世界。

比如，我們可以用XR+AI把整個城市都“複製”到虛擬世界裡。在這個映象世界裡，AI可以自由地“練習”各種物理世界的技能，比如開車、操作生產線、抓球。它在虛擬世界裡練上幾百萬次，犯錯了也沒關係，因為是虛擬的。等它練好了，再把技能應用到現實世界裡，就能避免在現實中出錯。

就像一個司機，先在模擬駕駛器上練幾千次，把各種路況都體驗一遍，真正上路時就不容易出事故。AI在映象世界裡練好了“抓球”“拼圖”的技能，到現實世界裡就能得心應手了。

凱文凱利（科技領域的“預言家”）就說過，沒有AI就沒辦法做XR的增強，現在智慧眼鏡還沒普及， partly 是因為AI還不夠便宜。等AI成本降下來，智慧眼鏡+XR+AI的組合就能爆發，到時候AI就能在物理世界裡大顯身手了。

六、智慧眼鏡反哺AI：讓AI“移動”起來，打造“世界模型”

智慧眼鏡不僅能幫AI“看見”物理世界，還能反過來促進AI的發展。因為有了智慧眼鏡，AI就能“移動”了，能在現實世界裡定位自己，知道“我在哪裡”“周圍有甚麼”。

比如，AI戴著智慧眼鏡開車，它能實時看到路況、其他車輛的位置，然後做出決策。它還能把這些資訊整合起來，打造一個“世界模型”——也就是對整個物理世界的理解和模擬。有了這個世界模型，AI就能像人類一樣，預判“前面的車可能會變道”“這個路口可能會有行人闖紅燈”，從而做出更聰明的決策。

再比如，AI在生產線上戴著智慧眼鏡，能“看到”每個零件的位置、狀態，然後規劃出最優的組裝路徑，還能實時檢測產品的質量。這比只靠文字指令要高效、準確得多。

凱文凱利認為，AI特別擅長“造世界”（打造世界模型），而智慧眼鏡能給它提供打造世界模型的“原材料”（現實世界的視覺、空間資訊）。所以，智慧眼鏡和AI是相互成就的關係：智慧眼鏡讓AI更好地理解物理世界，AI讓智慧眼鏡的功能更強大。

七、總結：AI的“物理短板”是暫時的，未來靠這幾步突破

咱們把這些點總結一下，AI現在在物理世界裡“笨”，主要是因為：

1. 培訓方式單一：只靠文字學習，沒在現實世界實操過；

2. 缺乏空間智慧：對三維世界的感知和判斷能力不足。

而未來的突破方向很明確：

- 用智慧眼鏡+AR/XR讓AI“看見”物理世界，獲得現實中的視覺和空間資訊；

- 打造映象世界（虛擬的現實複製），讓AI在虛擬世界裡盡情“練習”物理技能；

- 透過智慧眼鏡和映象世界，讓AI打造世界模型，從而在現實世界裡做出聰明的決策。

現在的AI就像一個“偏科生”，文科（文字理解）特別好，理科（物理實操）特別差。但只要補上“現實培訓”“空間智慧”這兩門課，再配上“智慧眼鏡”“XR”這些工具，它就能變成“全才”，在物理世界裡也能大展拳腳。

對於咱們普通人來說，這意味著未來我們身邊的AI裝置會越來越“聰明”——不僅能和我們聊天、幫我們寫東西，還能幫我們修車、做飯、照顧老人。當然，這一切的前提是AI得先把物理世界的“課”補好，而智慧眼鏡、XR、映象世界就是它的“補課工具”。咱們可以期待一下，用不了多久，AI就不是隻會啃書本的“書呆子”，而是能在物理世界裡和我們並肩作戰的“全能助手”了。