一、先聊AI的“致命短板”:物理世界裡是個“笨傢伙”
咱們平時總聽說AI多厲害,能寫論文、能畫畫、能聊天,但你知道嗎?AI在現實物理世界裡其實挺“笨”的。就拿最簡單的事兒來說,讓AI抓個球、拼個拼圖,或者從地上撿個東西,它大機率做不好。
你可能會問,這是為啥呢?咱們舉個例子,你讓AI讀一本關於“怎麼抓球”的書,它能把書裡的精華全吸收了,比如“抓球要判斷速度、角度”“手指要張開”這些理論它門兒清。但真讓它伸手去抓,它就抓瞎了——要麼抓空了,要麼把球捏變形了。這就像一個學霸,把物理書背得滾瓜爛熟,但實際動手做實驗就一塌糊塗。
有人總結了原因:現在的AI,尤其是大語言模型,就像個“書呆子”,它的知識全是從文字里學的,比如書籍、論文、網頁。它沒在現實世界裡摸爬滾打過,沒體驗過“球從手裡滑走”的感覺,沒感受過“拼圖塊卡不進去”的挫敗,所以遇到物理世界的事兒就抓瞎。打個比方,你教一個從沒見過蘋果的人,把“蘋果是紅色、圓形、甜的”這些文字背得再熟,他第一次見到蘋果也可能認錯,因為他沒實際摸過、嘗過。
二、AI的“培訓方式”有問題:光啃書本,沒接地氣
為啥AI在物理世界裡這麼“笨”?核心問題出在“培訓方式”上。現在培訓AI,尤其是大語言模型,就是把海量的文字知識一股腦灌進去,比如把人類寫的所有書、所有論文、所有網上的文字都餵給它。但這就像讓孩子只讀書本,從不出門體驗生活,他能考上高分,但一到實際場景就傻眼。
舉個例子,你想讓AI學會“倒咖啡不灑”,如果只給它看“倒咖啡要慢、杯子要拿穩”的文字,它永遠學不會。因為它不知道“慢”是多慢,“穩”是多穩,也不知道咖啡液的重量、流速這些實際因素。但如果讓它在現實裡練幾百次,灑幾次咖啡,它慢慢就知道怎麼控制了。但現在的AI沒這個機會,它的“老師”只有文字,沒有現實世界的“實操課”。
再比如,你想讓AI理解“甚麼是軟”“甚麼是硬”。文字里可能說“棉花是軟的,石頭是硬的”,但AI沒摸過棉花和石頭,它對“軟”和“硬”的理解就只停留在文字上。真讓它區分一塊海綿和一塊橡皮,它可能就分不清了。這就是“紙上談兵”的典型後果。
三、AI缺了個關鍵能力:空間智慧(三維感知)
除了沒在現實世界培訓,AI還缺一個核心能力——空間智慧。啥是空間智慧?簡單說就是“三維感知能力”,比如判斷一個物體的大小、形狀、位置,以及它和其他物體的關係。
咱們人類天生就有這能力。你看到一個杯子放在桌子邊緣,會本能地知道“它可能會掉下去”;你拼拼圖時,會知道哪塊該往哪個角落放。但AI沒有這種感知。比如讓AI玩積木,它可能知道“這塊積木是正方形”,但不知道“把它放在左邊第三層會不會倒”。
這就像一個人在黑夜裡走路,人類能透過周圍的環境(比如牆的位置、地面的高低)判斷方向,但如果這個人沒有空間感知能力,就會到處碰壁。AI在物理世界裡就像這個“摸黑走路”的人,因為它沒有空間智慧,所以搞不定需要三維判斷的事兒,比如抓球(得判斷球的運動軌跡和自己手的位置關係)、拼圖(得判斷拼圖塊的形狀和缺口的匹配度)。
四、未來機會1:智慧眼鏡+AR,讓AI“看見”物理世界
既然AI在物理世界裡這麼“笨”,那有沒有辦法解決呢?有人提出了一個方案:智慧眼鏡+增強現實(AR)。
啥是AR增強現實?簡單說就是你戴上眼鏡後,不僅能看到真實的世界,還能看到虛擬的東西疊加在上面。比如你戴AR眼鏡看桌子,能看到桌子上的杯子旁邊彈出一個標籤,寫著“這是陶瓷杯,容量300ml”;你看遠處的建築,能看到它的結構剖面圖。
如果把AI和AR眼鏡結合起來,AI就能“看見”物理世界了。比如你讓AI幫你修腳踏車,它透過AR眼鏡“看到”腳踏車的零件,然後在你眼前彈出維修步驟,告訴你“先拆腳踏板,再檢查鏈條”。這時候AI就不是隻靠文字知識,而是結合了現實世界的視覺資訊,決策就靠譜多了。
再比如,讓AI幫你整理房間,它透過AR眼鏡“看到”地上的書、桌上的杯子,然後規劃出“先把書放回書架,再把杯子拿到廚房”的步驟。這比只靠文字描述“房間裡有書和杯子”要準確得多。
五、未來機會2:XR+AI,打造“映象世界”(虛擬和現實的融合)
除了AR眼鏡,還有個更高階的概念叫XR(擴充套件現實),它包括了AR、VR(虛擬現實)、MR(混合現實)等。如果把AI和XR結合起來,就能打造一個“映象世界”——也就是和現實世界一模一樣的虛擬世界。
比如,我們可以用XR+AI把整個城市都“複製”到虛擬世界裡。在這個映象世界裡,AI可以自由地“練習”各種物理世界的技能,比如開車、操作生產線、抓球。它在虛擬世界裡練上幾百萬次,犯錯了也沒關係,因為是虛擬的。等它練好了,再把技能應用到現實世界裡,就能避免在現實中出錯。
就像一個司機,先在模擬駕駛器上練幾千次,把各種路況都體驗一遍,真正上路時就不容易出事故。AI在映象世界裡練好了“抓球”“拼圖”的技能,到現實世界裡就能得心應手了。
凱文凱利(科技領域的“預言家”)就說過,沒有AI就沒辦法做XR的增強,現在智慧眼鏡還沒普及, partly 是因為AI還不夠便宜。等AI成本降下來,智慧眼鏡+XR+AI的組合就能爆發,到時候AI就能在物理世界裡大顯身手了。
六、智慧眼鏡反哺AI:讓AI“移動”起來,打造“世界模型”
智慧眼鏡不僅能幫AI“看見”物理世界,還能反過來促進AI的發展。因為有了智慧眼鏡,AI就能“移動”了,能在現實世界裡定位自己,知道“我在哪裡”“周圍有甚麼”。
比如,AI戴著智慧眼鏡開車,它能實時看到路況、其他車輛的位置,然後做出決策。它還能把這些資訊整合起來,打造一個“世界模型”——也就是對整個物理世界的理解和模擬。有了這個世界模型,AI就能像人類一樣,預判“前面的車可能會變道”“這個路口可能會有行人闖紅燈”,從而做出更聰明的決策。
再比如,AI在生產線上戴著智慧眼鏡,能“看到”每個零件的位置、狀態,然後規劃出最優的組裝路徑,還能實時檢測產品的質量。這比只靠文字指令要高效、準確得多。
凱文凱利認為,AI特別擅長“造世界”(打造世界模型),而智慧眼鏡能給它提供打造世界模型的“原材料”(現實世界的視覺、空間資訊)。所以,智慧眼鏡和AI是相互成就的關係:智慧眼鏡讓AI更好地理解物理世界,AI讓智慧眼鏡的功能更強大。
七、總結:AI的“物理短板”是暫時的,未來靠這幾步突破
咱們把這些點總結一下,AI現在在物理世界裡“笨”,主要是因為:
1. 培訓方式單一:只靠文字學習,沒在現實世界實操過;
2. 缺乏空間智慧:對三維世界的感知和判斷能力不足。
而未來的突破方向很明確:
- 用智慧眼鏡+AR/XR讓AI“看見”物理世界,獲得現實中的視覺和空間資訊;
- 打造映象世界(虛擬的現實複製),讓AI在虛擬世界裡盡情“練習”物理技能;
- 透過智慧眼鏡和映象世界,讓AI打造世界模型,從而在現實世界裡做出聰明的決策。
現在的AI就像一個“偏科生”,文科(文字理解)特別好,理科(物理實操)特別差。但只要補上“現實培訓”“空間智慧”這兩門課,再配上“智慧眼鏡”“XR”這些工具,它就能變成“全才”,在物理世界裡也能大展拳腳。
對於咱們普通人來說,這意味著未來我們身邊的AI裝置會越來越“聰明”——不僅能和我們聊天、幫我們寫東西,還能幫我們修車、做飯、照顧老人。當然,這一切的前提是AI得先把物理世界的“課”補好,而智慧眼鏡、XR、映象世界就是它的“補課工具”。咱們可以期待一下,用不了多久,AI就不是隻會啃書本的“書呆子”,而是能在物理世界裡和我們並肩作戰的“全能助手”了。