7月27日,騰訊 Robotics X 實驗室與福田實驗室聯合發布具身智能開放平臺 Tairos “鈦螺絲”,這是國內首個以模塊化的方式提供大模型、開發工具和數據服務的具身智能軟件平臺,通過“sdk/api”的方式面向機器人行業開放。
Tairos平臺包含模型算法和云服務兩大組成部分,模型層面包含了多模態感知模型、規劃大模型以及感知行動聯合大模型;云服務平臺則包含了仿真平臺、數據平臺以及開發工具等,平臺通過標準化接口調用及軟件開發工具包(SDK)的方式對外提供服務。
當日,騰訊 Robotics X 實驗室發布會現場,搭載了具身智能開放平臺Tairos的宇樹機器人G1走上臺前,配合騰訊首席科學家、Robotics X 實驗室主任、福田實驗室主任張正友一起來做產品介紹。
在演講的最后,張正友問身邊的G1機器人,“結束后晚上要不要去喝一杯?”
它一板一眼回答:“不了,太忙了,今天還要加班。”
當日下午,在接受鳳凰網科技在內的媒體采訪時,張正友也對此回答感到驚訝,“之前的彩排它不是這么說的,每一遍跑的(回答)都不一樣。”
這是騰訊Robotics X實驗室成立7年,實驗室負責人少有的接受對外公開采訪。他依舊堅定認為,養老場景是最適合做技術探索的場景,“為什么選養老,這是一個很難人機交互場景,我們是想用比較難的場景去切入做技術研發。”
“不用懷疑,機器人進家(這件事)有生之年肯定會發生的。”張正友說。
在這個時間節點,騰訊拿出了此前積累的技術成果,做成具身平臺開放對外。“與其說商業化,我們更樂于提產品化。商業化聽起來,是要賺錢。我們不是以賺錢為目的的。我們希望把自己變成一個穩定的產品,推動全行業發展。”
但他也強調,研發不能被產品化壓力帶著跑,并打趣道,“如果當年馬化騰先生讓我成立一個機器人實驗室,立馬做產品,我可能就不會來了。”
面對近來的人才流失,張正友坦誠,“確實現在外面吸引力很大,但我們跟初創公司不太一樣,非常支持年輕科研人員的前沿探索,這個(科研)環境,在中國是很難得的。”
面對行業內的“四足”和“雙足”路線之爭,張正友則強調,“我(之前)做機器狗,不是為了做機器狗,是為了長遠的理念。”
在他看來,未來具身智能的實現不一定只有純足式、輪式的形態。曾經,人類是為了適應原始環境進化成了“雙足”,而在當下的人居環境中,雙足的效率不一定最佳。僅考慮“人形”反而會限制機器人的未來發展可能。因此,騰訊探索足式人式一體化方案,把“輪”和“足”結合,應用到騰訊家居環境原型機器人“小五”上。
而相比于初創企業對具身智能行業“iPhone時刻將到來”的普遍樂觀,張正友顯得更加猶豫和謹慎。
“現在連距離所謂的‘大哥大’時代還有多遠都不好說……但在安卓、iPhone出現之前,難道BlackBerry(黑莓手機)的‘失敗’就是沒有價值的嗎?”
他希望,騰訊能夠通過發布Tairos平臺,加速行業進入“大哥大”時代。“無論是我們認為的養老場景,還是別家說的工業場景,無論怎么樣,都希望助力大家盡快提高量產數量,把成本降下來,技術穩定下來。”
“如果(現在)機器人零件,比如頭都掉了,還在跑,證明還不是真正的具身智能,但我相信,到明年的馬拉松賽事,機器人就可以自己跑了,不需要人在后面遙控了。”
以下是張正友采訪實錄,經過不改原意的刪改:
Q:早上演講時您最后提到,唐代智通大師留下的四句偈語:“三身元我體,四智本心明。身智融無礙,應物任隨形。” 2021年時,您說過說要翻譯道德經,后來有翻譯嗎?像這種東方的哲學,對于機器人理念的設計上會有一些啟發嗎?"
張正友:肯定會有啟發的。演講時我用了唐朝傅聰大師的一句話,身智融無礙,對吧?,F在可能我們經常會看到有些演示,比方說,跑步的時候頭掉了,這機器人還在跑,或者是手臂斷了,還上去抓這個東西——你可以很明顯感覺到,這不是具身智能。連自己自身的狀態都沒有感知的話,這機器人與我們想要的差很遠的。身體跟智能要緊密結合,要和諧融合都是很重要的工作。
以前我提過,虛擬世界和真實世界要無縫的緊密結合,這個觀點也有一點融合東方的思想。放在機器人,我們通過仿真訓練就知道,到底執行會不會比較完善。如果想象出來和真實執行差的比較遠,那么就要修正自己的規劃。
《道德經》我翻譯第四遍了,每翻譯一遍重新看一遍,都有不同的啟發。但我的目的不是為了出書,是為了提供自己不斷提升的過程。
Q:今天看Tairos 發布,想到曾經其他大廠也做過類似的平臺,想去支持車企,但最后在業界并沒有那么成功,那現在騰訊做開放平臺成功的可能性變大了嗎,有什么地方不一樣?
張正友:你這個擔憂非常真實。往好的方向想就像Windows——它要涉及很多不同廠家的PC機,如果沒有很好的兼容,到最后是不可能發展起來的。
我們從一開始就讓開發平臺跟好幾家機器人客戶廠家整體打磨,不是發布完就不管。今天你看到的小五機器人、越疆、帕西尼都搭載了平臺。
Q:騰訊在具身智能大模型和云服務業務上相比其他平臺的優勢是什么?
張正友:一個是模塊化,廠家可以選取他想要的模塊。比如,感受模塊,假如他自己的感知能力很強,就不需要我們這個模塊;另一個是我們平臺完整,包括左腦右腦小腦,同時允許接入第三方模型。但是這個模型需要經過具身智能特訓——我們有套流程:從開源基礎模型加上我們自己具身數據預訓練的模型,廠家只需要用自己的東西少量數據就能快速適配,整個流程非常順。
Q:騰訊說不做硬件,要做廠商的合作伙伴,最近收到合作伙伴主要需求是什么?現階段,精力和資源會著重放在哪些能力提升上?
張正友:我們跑過全國北京、上海、深圳、成都等六十幾家企業,發現中國大量機器人企業,硬件做得很好。騰訊在具身投入非常大,做了7年了,大家對我們做這個事是非常歡迎的。我們選高配合度種子企業深度打磨,7月平臺標準化后開始鋪量——這也是過往騰訊做產品的思路,一下子是不能鋪太多的。
騰訊的重點優勢就三個:模型能力(規劃/感知/行動聯合模型)、仿真環境、多模態感知。今天發布還是初版,后面隨著更多企業參與,平臺會打磨得更好。
Q:機器人落地目前最急需補足的技術是什么?
張正友:核心是對三維世界的可操作認知。現在很多“世界模型”建個咖啡杯3D模型,你可以在里面動來動去看起來很漂亮——但機器人是需要真實把它抓起來。他們建的模型是全部連在一起的,這和我們需要的可操作模型有根本區別。
規劃方面,大語言模型是通過文本理解世界,但很多文字是描述不清楚的。動物沒文字語言也能在3D世界活下來,證明非語言認知很重要。
觸覺傳感器從成立之初我們研究了7年,現在還沒達到真正標準化。
Q:騰訊 Robotics X 實驗室的商業化目標此前比較謹慎,之后態度會不會有所改變?
張正友:我們7年前成立時,就沒有任何商業化路徑。當時必須從頭做,既做硬件又做軟件,從2023年下半年開始,行業就有很大變化,很多機器人廠商出現。
現在形勢已經變化了。騰訊需要跟機器人硬件本體廠家一起,把具身智能技術,跟本體廠家一起去打磨,否則就是停留實驗室前沿探索。當然探索還會繼續,但有些能力希望跟本體廠家一起去打磨技術。
與其說商業化,其實更樂于提產品化。商業化聽起來是,要賺錢。我們不是以賺錢為目的的。我們希望變成一個比較穩定的產品,來賦能機器人行業。
Q:既然要做機器人廠商的合作伙伴,騰訊之后是不是不會再做機器人產品了?
張正友:我們從來不做產品,都是研究原型。“小五”也不是產品。
最早我們的機器人其實是更先進的,腿輪一體的探索移動形態創新——為什么非要用腿?平地上輪子效率高得多。后面做的調酒機器人,是驗證觸覺技術,養老機器人研發人機交互安全性。這些原型驗證完技術我們就繼續推進前沿,不會停在產品化和商業化。
現在Tairos 平臺發布后,還會繼續做一些反思性的研究性的硬件——因為硬件軟件完全脫節效果不好。
Q:你們選擇做什么,不做什么,決策邏輯是怎么樣的?
張正友:從我個人角度,還有更大目標在支撐著。為了實現未來的養老場景,我們要繼續推進機器人的智能和本體里的核心技術,比如初級測量器定制皮膚這些能力。
我加入騰訊的時候,規劃的是十年?,F在已經7年了,也許差不多3年后,就能實現。假如我一開始就只潛心在機器狗上,后面就沒精力研究其他了。既定目標是很宏偉的,要沿著這個目標繼續前行。
Q:從時間軸上,現在具身智能處在哪個階段?
張正友:這是一個探索的過程。比方說,以前BlackBerry(黑莓手機)是失敗了,但是沒有那個過程,后面怎么會出現像iPhone這些設計出來?對于我來講,本體的探索是需要要投入進去,必須要投入進去。
Q:怎么評價當下火熱的機器人賽事?
張正友:賽事還是一個很重要的推動力,能夠推動技術往前。就像大模型,大家都可以去嘗試。
但比如說,現在一些機器人腦袋掉了還得跑,說明這個技術是沒用的,它沒有感知能力,對吧?你就不會去關注某個廠家,僅僅是為了比賽而賽。從我們真正的技術研究角度和行業發展角度講,還是希望這些比賽提升整個具身賽道真正的能力,還是有幫助,但我們自己可能不太會參加。
現在馬拉松,我們看到的是人在后面遙控,因為感知模型不夠,只是這個技術還沒到時候。我相信可能明年就能做到了,機器人能自主跑起來。
Q:為什么不做雙足機器人?
張正友:我不是對雙足機器人有什么“仇恨”。雙足人行這個形態已經在那里了,你不需要花更大精力去思考,只是去控制它就行了,這是其中一個思路。另外一個思路就是有好幾個可能性。
雙足,是人在幾千萬年進化過程中,為了適應復雜環境進化出來的。但現在是人居環境,實際上雙足效率很低。我們想探索的,既有輪子又有腿,想看看有沒有更好的形態,適合人居環境。
假如我們人形機器人行作為標準,這其實是限制了我們對機器人的想象力。比如說,人不能進化出屏幕,但技術可以。如果僅用自然語言交互,會被速度限制。
假如機器人是一個屏幕,信息呈現在屏幕上,人類讀取信息的效率提升了三倍。那為什么一定要用語言去對話呢?
我不是簡單否認雙足形態,而是有很多其他形態可以去探索。
Q:成立7年,中間應該也有過一些階段性成果,現在這個時間點,是怎么判斷可以商業化了?
張正友:現在這個時間點跟行業發展有關系。上一個階段,大家都還是在做工業機器人。2023年開始,具身智能火熱,大量本體公司出現,能用上。更多是來自市場和產品的需求。
我們也不會放棄前沿技術,假如如果探索停半年,也許感知模型、規劃模型就落后了?,F在前進的大方向,跟我七年前的判斷,幾乎是沒有變化的。
當初也沒想那么多,只是在考慮研究前沿技術。研究人員不能被產品化引導,技術是不能被產品化引導的。7年前,如果馬化騰先生讓我來成立機器人實驗室,馬上做個產品,我就不會來了。
今天上臺簽約的廠商,很多也不是騰訊投資的,我們是要支持整個機器人行業發展。目前機器人行業離iPhone時刻還有很大的距離。怎么讓整個生態起來,是最重要的問題。
Q:您剛才提到,騰訊對實驗室的耐心還很多,但我們看到前兩年各大廠都在做AI lab,都陸續做不下去,你們會有擔憂嗎?怎么看當下一些人才的流失情況?
張正友:外面的吸引力很大,好處是仍然有很多同學留下來,更多新鮮企業補充進來。我們跟初創公司不太一樣,支持力度對年輕研究人員很大,希望深度探索。這個環境是很難得。
現在大部分做數據采集,做科研,做導覽。利用這個平臺,助力行業進入大哥大時代。應該是養老場景比較適合的。也有人認為是工業場景。不管是哪兒,場景要足夠大。
Q:做得早,或者做得晚都不一定是成功的,你們在具身智能中的節奏和戰略是什么樣的?
張正友:我之前做機器狗不是為了做機器狗,是為了長遠的理念,為了運動能力。不一定做足式或者輪式,我們是想探索新的方案,足式輪式一體化,是很大的創新。
腿和人結合,應用到機器人小五上。走樓梯,是足式。平地是人式的。我們要跳出一般的平常人的思考方式,去想有沒有更合理高效的一個技術方向。
我們做得很早,現在有些能力能夠支持行業發展,所以就開放出來,但現在還是初級階段,還有很長的路要走。
Q:怎么看待行業過熱的情況?
張正友:從技術角度講,更多的企業和研究單位參與進來,這都是好事情。行業就發展的會越來越快。但假如說,是不是有些企業會技術不夠成熟,到最后倒閉了,任何一個技術在發展過程中都有這個可能。