創(chuàng)澤機(jī)器人 |
CHUANGZE ROBOT |
三年前,人形機(jī)器人還處于陽春白雪的科研階段,這兩年發(fā)展迅猛。那么,人形機(jī)器人當(dāng)前面臨的問題是什么?突破的方向在哪里?未來的應(yīng)用在哪里?前不久,在上海2025人形機(jī)器人產(chǎn)業(yè)高質(zhì)量發(fā)展論壇上,地方共建人形機(jī)器人創(chuàng)新中心(簡稱“國地中心”)席科學(xué)家江磊介紹了他的看法,并提出與產(chǎn)業(yè)鏈共同打造出四位一體生態(tài)的觀點(diǎn)。
人形機(jī)器人在各大證券市場已經(jīng)有了概念股,從2024年1月開始,還是平平淡淡的發(fā)展,為什么到了8月,整個(gè)二J市場被急速拉動(dòng)?
先,一定是人形機(jī)器人行業(yè)找到了一個(gè)技術(shù)突破、可發(fā)力的對象。
第二,政策方面,今年一開年,要設(shè)立相應(yīng)的重大項(xiàng)目,原因可能是我們想緩解勞動(dòng)力缺口,以及應(yīng)對未來人口老齡化的挑戰(zhàn)。
第三,從產(chǎn)品端看,人形機(jī)器人迎來了GPT時(shí)刻。此時(shí)尤其令我們自豪的是,在這個(gè)高科技領(lǐng)域的起步階段,我國登上了世界舞臺(tái),已有一些有代表性的企業(yè)和樣機(jī)。
第四,從行業(yè)角度看,千行百業(yè)都在關(guān)注。據(jù)統(tǒng)計(jì),現(xiàn)在已有100家左右的整機(jī)公司,預(yù)計(jì)到今年年底會(huì)有200多家,還有數(shù)千家的核心零部件廠家,這構(gòu)成了一個(gè)大生態(tài)。汽車行業(yè)、手機(jī)行業(yè)、制造行業(yè)、互聯(lián)網(wǎng)、國央企都在投入。一個(gè)共性原因是:在一個(gè)行業(yè)處于發(fā)展的高峰期或瓶頸期,內(nèi)卷就開始出現(xiàn),因此這五大行業(yè)、企業(yè)都找到了發(fā)力點(diǎn):人形機(jī)器人,認(rèn)為是破解行業(yè)規(guī)律性周期性難題的一個(gè)主要?jiǎng)右颉庖彩侨绱,今年年初,蘋果、三星、現(xiàn)代等開始設(shè)立人形機(jī)器人的硬件團(tuán)隊(duì)。今年阿里也在張江模力社區(qū)(注:“國地中心”搭建)設(shè)立了智能機(jī)器人的硬件團(tuán)隊(duì)。
在此,“通用化”會(huì)成為一個(gè)經(jīng)濟(jì)活動(dòng)的名詞。過去人們會(huì)把通用化做成技術(shù),所以業(yè)界一直在爭論:是做專用機(jī)器人,還是做通用機(jī)器人?其實(shí)這種爭論沒有什么意義,因?yàn)榧夹g(shù)都是為場景服務(wù)的。所謂的場景驅(qū)動(dòng)就是有沒有市場,廠家的產(chǎn)品能不能找到市場、銷售出去。所以“通用化”更重要的是在一個(gè)新興市場,單品能否過10萬臺(tái)的門檻。今年人形機(jī)器人單品可能會(huì)過1萬臺(tái)的門檻,但更期待未來是百萬臺(tái)、百億臺(tái)的產(chǎn)業(yè)規(guī)模。目前10萬臺(tái)將是一個(gè)重要的門檻。另一個(gè)角度,如果做一個(gè)產(chǎn)品,單品要10萬臺(tái),它可用在哪些場景呢?這值得我們?nèi)ド钊胨伎,再從“通用化”來考慮產(chǎn)品定義和設(shè)計(jì)如何去做。
有一個(gè)高價(jià)值飛輪的理論。三年前,人形機(jī)器人是個(gè)萬億元的潛在賽道,因此發(fā)布了政策來加速促進(jìn)人形機(jī)器人的發(fā)展,使其對于公眾來說不再陌生,不經(jīng)意間,在電視節(jié)目或某個(gè)商場的轉(zhuǎn)角就能看到人形機(jī)器人,它正在形成一個(gè)巨大的產(chǎn)品市場。因此,今年是完成高價(jià)值飛輪的重要一年。那么能否實(shí)現(xiàn)規(guī)模和量產(chǎn)?高價(jià)值飛輪的核心驅(qū)動(dòng)力還是來自于顛覆性的技術(shù)。
為什么2024年8月人形機(jī)器人的二J市場會(huì)被急速拉升?因?yàn)轭嵏残约夹g(shù)起到了決定性的作用。
工信部提出了兩大革命:“機(jī)器人+革命”與“人工智能+革命”,它們對應(yīng)的都是新質(zhì)生產(chǎn)力。“機(jī)器人+”是新質(zhì)硬件生產(chǎn)力,“人工智能+”是新質(zhì)軟件生產(chǎn)力?梢,新質(zhì)生產(chǎn)力是軟硬一體化的典型代表。在這樣的一個(gè)產(chǎn)業(yè)、技術(shù)、行業(yè)、規(guī)模、政策里,其中的線索一定是技術(shù)驅(qū)動(dòng)了這次技術(shù)革命。
先,其背后的邏輯,以π0團(tuán)隊(duì)為代表,去年8月Physical Intelligence次發(fā)布了通用人形機(jī)器人的視覺-語言-動(dòng)作模型(VLA),F(xiàn)在VLA已經(jīng)成為一個(gè)事實(shí)標(biāo)準(zhǔn)。如果回到去年8月之前,相信90%的專家會(huì)認(rèn)為機(jī)器人的操作還不屬于預(yù)訓(xùn)練(注:語言/ChatGPT是大模型,是預(yù)訓(xùn)練),我們雙手的操作不是預(yù)訓(xùn)練,但是,從8月開始,π0團(tuán)隊(duì)發(fā)現(xiàn)它也是一個(gè)大規(guī)模預(yù)訓(xùn)練架構(gòu)。大算力大模型也是大力出奇跡的一個(gè)行業(yè),并被證明這種方式是可以的。
實(shí)際上,不僅π0發(fā)現(xiàn),國內(nèi)外同時(shí)十二個(gè)團(tuán)隊(duì)用10萬的數(shù)據(jù)集、30萬的數(shù)據(jù)集、現(xiàn)在用80萬的數(shù)據(jù)集激勵(lì)了以后,整個(gè)任務(wù)達(dá)成率也是直線上升。
我們堅(jiān)信規(guī)模法則與后訓(xùn)練將會(huì)促進(jìn)這一次人形機(jī)器人Z終的一個(gè)閉環(huán)。
當(dāng)然還有一部分—智駕,例如,特斯拉的FSD V12幫助印證,現(xiàn)在也轉(zhuǎn)向VLA。而之前做汽車的人是做端側(cè),發(fā)現(xiàn)VLA也很好用。
人們?nèi)绻私釼LA的誕生,其完全不是為汽車設(shè)計(jì)的,是為谷歌的一款類人形機(jī)器人的構(gòu)型設(shè)計(jì),結(jié)果沒想到VLA也撐起了智駕的半邊天。
當(dāng)然,還是要回到人形機(jī)器人,僅有VLA夠不夠?
去年Figure聯(lián)合OpenAI造出了Figure 01,可以看到大模型是在人形機(jī)器人的Z上層,是采用大腦、小腦+肢體的分層類人架構(gòu)來實(shí)現(xiàn)的。去年我國在“世界人工智能大會(huì)(WAIC)”上也推出了我國自己的大腦、小腦、驅(qū)動(dòng)架構(gòu),今年正進(jìn)一步完善。
人形機(jī)器人有沒有一個(gè)通用的完全端到端的大模型?現(xiàn)在VLA解決了上層的,下層有一個(gè)控制模型是屬于分層架構(gòu),但能不能用一個(gè)分層實(shí)現(xiàn)完全端到端?有一篇論文支持了這樣的觀點(diǎn)。因此,三年前,語言進(jìn)入了大模型(例如ChatGPT),去年雙手操作進(jìn)入大模型(例如VLA),現(xiàn)在的問題是:下肢行走以及全身運(yùn)動(dòng)是不是一個(gè)大模型?堅(jiān)信將來會(huì)有一個(gè)大模型,能夠讓人形機(jī)器人、四足機(jī)器人以及汽車來實(shí)現(xiàn)統(tǒng)一的駕駛。
人形機(jī)器人行業(yè)目前有四類:
汽車智駕的具身模型;
機(jī)器人上肢操作/VLA;
人形分層策略;
芯片/GPU。
整個(gè)具身智能產(chǎn)業(yè)正在爆發(fā),所有路徑都需要大數(shù)據(jù),所以在去年“國地中心”組建了訓(xùn)練場來推動(dòng)這件事。
“國地中心”的麒麟具身智能訓(xùn)練場有五項(xiàng)功能,除了收集數(shù)據(jù),訓(xùn)練場的另外一個(gè)作用是對現(xiàn)在的大模型進(jìn)行檢測與評定,提出大模型的benchmark,例如,做一個(gè)什么樣的大模型更適合人形機(jī)器人?現(xiàn)在需要一個(gè)行業(yè)的基準(zhǔn)線。
目前人形機(jī)器人在跑得快、拿得準(zhǔn)、訓(xùn)得好、通用化方面都有代表性公司。Z近業(yè)界在爭論:是不是機(jī)器人都需要走跑跳?是不是應(yīng)該進(jìn)廠打工?實(shí)際上,目前有四類人在研究,跑得快的人不做抓取,做抓取的不做跑得快,做訓(xùn)練的人大多數(shù)都是人工智能的人,做“通用化”的人是做基礎(chǔ)設(shè)施的。高動(dòng)態(tài)的硬件平臺(tái)、準(zhǔn)確抓取的具身智能、訓(xùn)練的實(shí)訓(xùn)場、通用泛化的數(shù)據(jù)集—這四件事,哪怕有一件事做不好,人形機(jī)器人的軟硬件的終極難題就落不了地,所以我們需要要發(fā)展生態(tài)。
回到發(fā)展的起點(diǎn):人形機(jī)器人未來一定是進(jìn)廠打工以及為我們養(yǎng)老。例如養(yǎng)老,還有八
項(xiàng)卡脖子技術(shù)沒有打通。人們面對未來的通用化,一定不是針對八個(gè)問題建立八個(gè)模型,甚至建立幾百個(gè)模型來解決,人們希望構(gòu)造一個(gè)完全端到端的模型,來同時(shí)解決八項(xiàng)卡脖子技術(shù),這樣才能實(shí)現(xiàn)Z終通用化的夢想。
江磊老師有個(gè)激進(jìn)的預(yù)測:做硬件平臺(tái)的得去做小的機(jī)器人,這樣迭代的速度更快。做具身智能現(xiàn)在很火,但是千萬不要只做操作,行走大模型已成為今年國際競爭的熱點(diǎn)!皣刂行摹钡茸鰧(shí)訓(xùn)場的人一定要去做自己的世界模型,以及做數(shù)據(jù)集的人要用開源的方式來完成整個(gè)生態(tài)的構(gòu)建。
人形機(jī)器人從當(dāng)前的角度來看,四位一體的生態(tài)還沒有完全建立。“國地中心”希望跟業(yè)界共同打造出我國的四位一體生態(tài)。
今年人形機(jī)器人是可以量產(chǎn)的,但真正的大規(guī)模的應(yīng)用還沒到來。我們加速建立四位一體的生態(tài),才能加速人形機(jī)器人產(chǎn)業(yè)的到來。
![]() |
機(jī)器人底盤 Disinfection Robot 消毒機(jī)器人 講解機(jī)器人 迎賓機(jī)器人 移動(dòng)機(jī)器人底盤 商用機(jī)器人 智能垃圾站 智能服務(wù)機(jī)器人 大屏機(jī)器人 霧化消毒機(jī)器人 展廳機(jī)器人 服務(wù)機(jī)器人底盤 核酸采樣機(jī)器人 智能配送機(jī)器人 導(dǎo)覽機(jī)器人 |