智元機器人的生態系統又落下關鍵“棋子”。
4月16日,智元旗下公司覓蜂科技相繼發布一站式物理AI數據服務平臺、MEgo系列無本體采集硬件,同時宣布將在2026年實現千萬小時級數據產能。
在此之前,行業內多家企業也在密集布局數據基建。目前,具身智能被視為繼汽車產業之后下一個萬億級賽道,數據則是推動具身智能從實驗室走向產業化階段的關鍵。這意味著,誰率先擁有高質量數據,誰可能就占據了模型訓練上的先發優勢。
破解“數據荒漠”難題
和從互聯網上獲取海量信息訓練的大語言模型不同,具身智能大模型訓練所需的數據來自于和物理世界交互。
而具身智能數據存在標準缺失、質量參差、供需錯配等核心痛點。行業人士普遍認為,高質量數據有高保真、多樣性、可泛化等特點。不過,這類數據獲取難度高、比較稀缺。
針對行業的“數據荒漠”問題,覓蜂科技發布了物理AI數據服務平臺以及MEgo系列無本體數據采集硬件。服務平臺專注打造具身智能數據的平臺型供給基礎設施,提供真機數據、仿真數據以及人類演示數據,實現數據體系化、標準化、規模化供給。MEgo系列硬件則包括采集夾爪、頭戴式采集設備及數據治理引擎,支持輕量化采集,大幅降低數據獲取門檻與成本。
據了解,無本體數據采集是一種不依賴特定機器人硬件的數據獲取方式,也是行業內的新范式。這一采集方式主要是讓人類操作員通過佩戴輕量化的傳感器設備直接在真實環境中完成任務,系統同步記錄操作軌跡、視覺圖像和力覺信息,生成可供不同機器人學習的標準化數據。

姚卯青介紹,現階段全世界的高質量數據匯聚在一起,可能也只有50萬小時的規模。他表示,目前行業內數據需求旺盛,數據使用方以走在前沿的大模型公司、具身智能頭部公司以及初創公司為主,尤其是選擇世界模型路線的公司。
這一情況也決定了覓蜂科技服務的商業模式是TO B方向。
“目前我們公開的數據服務平臺更像是商品展示的櫥窗,讓大家能夠了解有哪些樣本數據。”姚卯青在接受媒體采訪時介紹,他們會根據客戶需求交付定制產品,“不同客戶對數據的精細程度不一,有的可能只需要家庭、超市等宏觀場景,有的可能要具體的動作流程。”
根據客戶需求、場景難度和預算情況,具身智能數據價格不一。姚卯青以國內市場為例,目前真機數據價格水平大約在每小時500元至1000元人民幣區間。
運營方面,他還透露稱,覓蜂科技擁有自營設備和人力,同時也采取委派訂單的形式讓合作伙伴采集管理數據,整體上會偏向輕資產。此外,覓蜂科技還有一個重要優勢,即智元本身有比較強的模型能力,經歷過幾輪迭代后,清楚如何采集到高質量的數據。
姚卯青希望,覓蜂科技將發揮平臺引領作用,讓高質量物理AI數據像水電一樣即取即用,為具身智能規模化落地筑牢數據根基。
多家企業下場加速產業規模化爆發
依托全流程質檢體系、全球化采集網絡,覓蜂科技計劃2026年將實現千萬小時級數據產能。
不過,面對目前的數據缺口,千萬小時的數據產能遠遠不夠,不足以催生具身智能的“ChatGPT時刻”。
在發布會現場的圓桌論壇分享中,多位嘉賓一致認為,AGI時代的到來建立在龐大的數據量級上,需要多方共同努力。
為推動產業共贏,覓蜂科技聯合上電科、國家數據標委會、工信部賽迪研究院共同發起蜂巢數據共創行動。北京人形機器人創新中心、上海國地中心、靈初智能、帕西尼感知科技、大曉機器人、無界智航、清智嘉創、艾歐智能、流瀾數智、Mr. Robot等數十家海內外機構成為首批響應單位。
蜂巢數據共創行動的目標是,在2030年達成百億小時級數據產能,共建全球最大物理AI數據生態,加速具身智能產業規模化爆發。
2026年,也被廣泛認為是具身智能數據元年。第一財經記者注意到,除了覓蜂科技,今年開始行業內已經有多家企業布局具身智能數據基建,數據軍備競賽開啟。
比如,今年3月,京東正式宣布將依托超級供應鏈核心優勢,建成全球規模最大、場景最全的具身智能數據采集中心,兩年內積累超1000萬小時優質數據;4月16日當天,京東還宣布在全球首推覆蓋全鏈路的具身智能數據基礎設施,自研超高清采集終端JoyEgoCam、具身大模型JoyAI-RA、具身智能數據交易平臺等亮相。
鹿明機器人也計劃今年在多個城市投放1萬臺背包版FastUMI Pro,在工業、家庭、酒店、餐館、商場、辦公等六大真實場景開展數據采集,目標直指百萬小時級數據產能。
多位嘉賓提到,接下來具身智能的核心競爭是數據采集與轉化效率的競爭,未來行業將走向標準統一、供需協同、真機與仿真互補的平臺化格局。
“數據將和算力一樣成為基礎性的生產資料,會形成一定的投資回報周期。”在姚卯青看來,數據的商業化閉環或跑在機器人本體、落地場景的前面。