2025年的AI圈,最火的詞兒莫過於“具身智慧”。啥意思?說白了就是讓以前只會在電腦裡“思考”的AI,長出胳膊腿兒,能跑能跳能幹活,真正走進咱們的現實世界。就在這個風口上,商湯科技甩出了一個大動作——成立子公司“大曉機器人”,一頭扎進了機器狗和具身智慧的賽道。
外界有人嘀咕:“這是不是又跟風蹭熱點啊?”但內行人都清楚,商湯這步棋,早就布好了局。從早年搞視覺演算法,到後來做大模型,商湯一直盯著“讓機器看懂世界”這個目標,現在不過是把“看懂”升級成了“會幹”,一點都不突兀。
為啥偏偏選在2025年發力?很簡單,今年就是具身智慧的落地元年。擱以前,機器人要麼是“近視眼”,看得不遠還分不清東西;要麼是“路痴”,走兩步就撞牆,更別說讓它乾點精細活了。但現在不一樣了,大模型越來越聰明,感測器技術也越來越牛,機器終於有機會擺脫實驗室,跑到真實世界裡折騰折騰了。
一、機器人學幹活,不靠瞎摔靠“偷師”人類
說到教機器人幹活,以前的方法簡直笨到家了,跟教剛會爬的小孩走路一樣,摔了跤才知道疼,試錯成本高得離譜。舉個例子,想讓機器人擰個螺絲,得編一堆複雜的程式,還得讓它一次次試,擰滑絲了、擰太緊把零件弄壞了,都是常有的事兒,折騰半天還不一定能成。
但商湯的思路不一樣,他們走了條“捷徑”——讓機器人先當“學徒”,看人類師傅怎麼幹活,再照著學。這就是他們說的“以人為中心的技術正規化”,聽著高大上,說白了就是“偷師學藝”。
商湯專門派了團隊,跑到工廠、消防隊這些地方,架起攝像頭、裝上感測器,盯著工人擰螺絲、消防員爬梯子的每一個細節。工人擰螺絲用了多大勁兒、轉了幾圈,消防員爬梯子時手腳怎麼配合、重心怎麼調整,這些資料全都被記錄下來。然後把這些資料餵給機器人的“大腦”,讓它琢磨透裡面的門道。
打個比方,以前教機器人擰螺絲,是告訴它“你要轉五圈,用十牛的力”;現在是讓機器人看工人擰螺絲的全過程,它自己總結出“擰這個螺絲,轉五圈、用十牛的力剛好合適”。一個是死記硬背,一個是融會貫通,效果天差地別。
而支撐這個“偷師”過程的,就是商湯新推出的“開悟世界模型3.0”。這個模型可不簡單,它就像機器人的“超級大腦”,能同時處理影片、音訊和力反饋這些訊號。不光能看懂動作,還能預判下一步該幹啥。比如看到工人拿起螺絲刀對準螺絲,它就能算出接下來要擰幾圈、用多大勁兒,保證不滑絲、不損壞零件。
有了這個模型,機器人就不是個只會模仿的“復讀機”了,它能理解幹活的邏輯,遇到點小變化也能應對。比如螺絲的位置稍微偏了一點,它能自己調整角度,不用人再重新程式設計。
二、硬體不將就,機器狗的“眼睛”和“腿腳”都是定製款
技術路線定好了,接下來就是把藍圖變成實實在在的機器人。但做硬體這事兒,對AI公司來說可不是件容易事,商湯一開始也想省點事兒——直接買現成的機器狗底盤來組裝。
結果一試,全是坑。市面上的機器狗要麼是“近視眼”,視野特別窄,抬頭看不到天花板上的水管,低頭瞅不見腳邊的小石子,很容易撞上去;要麼是“嬌貴命”,下雨天一淋就“罷工”,別說去戶外巡檢了,稍微沾點水就歇菜。這哪行啊?商湯想做的是能在工廠、變電站這些複雜場景幹活的機器狗,這些毛病必須得解決。
沒辦法,商湯只能自己下場,拉著合作伙伴一起搞研發。首先解決的是“眼睛”的問題,他們跟全景相機制造商Insta360合作,給機器狗的腦袋上裝了個魚眼鏡頭。這一下,機器狗的視野直接擴到了180度,天上地下、左左右右,啥都能看見,天花板上的水管、腳邊的小零件,再也逃不過它的“法眼”。
眼睛解決了,接下來就是“腿腳”。機器狗要跑要跳,還要扛東西,電機和感測器必須得靠譜。商湯這些年沒少投資電機和感測器公司,現在正好派上用場。他們自己制定了一套硬體設計規範,讓合作伙伴照著圖紙生產,自己則專心最佳化模型演算法。
這種模式跟手機行業的“安卓模式”有點像,安卓提供系統,手機廠商負責造硬體,大家分工合作。商湯提供演算法和標準,合作伙伴負責生產硬體,這樣既能保證機器狗的效能,又能提高生產效率,還能控制成本。
就這麼折騰下來,商湯的機器狗終於像樣了——視野開闊,不怕下雨,跑起來穩當,還能精準完成各種動作。再也不是那個一碰就倒、一淋就壞的“嬌氣包”了。
三、先從工廠和倉庫下手,家庭機器人還得再等等
機器人造出來了,總得有地方用吧?商湯心裡門兒清,具身智慧的最終落腳點,還是得看實際應用場景。步子不能邁太大,得一步一步來,他們給大曉機器人規劃了三個階段的目標,先易後難,一點都不著急。
短期目標:工廠和變電站的“巡檢員”
最先派上用場的,就是機器狗,主要負責工廠和變電站的巡檢工作。大家可以想想,工廠裡的生產線、變電站裡的裝置,都需要有人時不時去檢查,看看有沒有故障、有沒有安全隱患。以前都是人工巡檢,不僅耗時耗力,還特別危險,萬一碰到漏電、裝置故障,很容易出事兒。
而且人工巡檢效率也低,一個工人一天頂多跑兩三趟,還難免有疏漏。但機器狗不一樣,它可以24小時連軸轉,一天能完成多輪巡檢。商湯在智慧城市領域積累的空間地圖技術,正好能給機器狗導航,讓它在工廠和變電站裡精準穿梭,不會迷路,也不會撞到裝置。
機器狗身上裝著各種感測器,能實時監測裝置的溫度、電壓這些資料,一旦發現異常,馬上就會報警。這樣一來,不僅能提高巡檢效率,還能降低人工風險,工廠和變電站肯定樂意用。
中期目標:快遞前置倉的“搬運工”
等機器狗在工廠裡練熟了,下一步就可以去快遞倉庫幹活了,尤其是那些存放零食和日用品的前置倉。這些前置倉的特點是貨架高度適中,路線也比較固定,標準化程度很高,特別適合機器人來搬運貨物。
以前倉庫裡的貨物搬運,要麼靠人工,要麼靠叉車,人工搬運累得慌,叉車又比較笨重,靈活性不夠。但機器狗不一樣,它身材小巧,動作靈活,能在貨架之間穿梭自如,把貨物從這個貨架搬到那個貨架,或者搬到分揀臺上。
而且有了開悟世界模型3.0的加持,機器狗能精準識別貨物,不會拿錯,也不會損壞貨物。這樣一來,倉庫的搬運效率能大大提高,人力成本也能降下來。對快遞公司來說,這可是個好訊息,既能提高配送速度,又能省錢。
長期目標:走進家庭當“保姆”,但難題還很多
當然,最讓人期待的,還是機器人走進家庭,幫咱們做家務、照顧老人孩子。但這事兒,短期之內肯定實現不了,因為難題實在太多了。
首先就是安全問題。家裡不像工廠和倉庫,環境特別複雜,有老人、有小孩,還有各種傢俱電器。機器人萬一失控,碰倒了老人,或者撞壞了冰箱彩電,這責任誰來負?就拿最簡單的掃地機器人來說,現在還有可能卡住或者撞壞傢俱,更別說功能更復雜的家庭機器人了。
其次是人機互動的問題。機器人得能聽懂人話,還得能理解人的情緒。比如老人說“我渴了”,機器人得知道去倒杯水,還得知道水溫不能太高,不然會燙到老人。小孩說“我想玩積木”,機器人得能陪小孩一起玩,還得能保護小孩的安全。這些都需要機器人有很高的智慧,不是短時間內能做到的。
所以,商湯也不著急,先把工廠和倉庫的場景做紮實,等技術成熟了,再慢慢攻克家庭場景的難題。畢竟,飯得一口一口吃,路得一步一步走。
四、不是跟風,是技術積累到份兒上了
最後再說說,為啥說商湯搞大曉機器人不是跟風。從最早的手機攝像頭演算法,到後來的大模型,商湯這些年一直在圍繞“讓機器理解世界”這個核心目標發力。以前是讓機器“看”懂世界,現在是讓機器“做”遍世界,這是水到渠成的事兒。
AI行業最看重的就是技術積累,這就像蓋房子,地基不牢,樓蓋得越高越危險。商湯在視覺演算法和大模型上砸了這麼多年的錢,積累了這麼多的技術,現在這些技術都成了大曉機器人的堅實基礎。
現在的具身智慧賽道,就像幾年前的自動駕駛,各家公司都在找突破口。以前大家都盯著機器人的“大腦”,覺得只要大腦夠聰明就行,但後來發現,“小腦”也很重要,也就是機器人的運動控制能力。光有想法,手腳不聽使喚,那也白搭。
大曉機器人團隊現在就盯著“小腦”這塊硬骨頭啃,畢竟,只有手腳靈活了,機器人才能真正幹活。在具身智慧的浪潮裡,商湯算是找對了方向,他們的“以人為中心”的思路,讓機器人不再是實驗室裡的“花瓶”,而是能走進現實世界幹活的“工具”。
雖然現在下結論還太早,大曉機器人能不能成,還得看後續的落地效果。但至少,商湯已經找到了一個靠譜的突破口。如果未來機器狗和物流機器人真的能大規模應用,那整個行業的玩法可能都會變。說不定再過幾年,咱們去工廠參觀,看到的都是跑來跑去的機器狗;去快遞倉庫取件,看到的都是忙忙碌碌的機器人。到那時候,大家可能會想起年,商湯的大曉機器人,曾經在這個賽道上,邁出了關鍵的一步。