在位於上海張江的國家地方共建人形機器人創新中心,記者看到更多機器人在努力學習人類本領:它們有的在學習高負載狀態下穩定快速地行走,有的在練習拿飲料、餅幹等不同形狀和重量的物品……
“歸根結底,訓練場是數據生產和數據規模化的場地。”劉宇飛表示,訓練場分為感、存、算、學、用五個部分。“感”和“存”主要用來做雲端數據的采集,包括要操作的數據、音頻數據、自然語言、運動捕捉等。“算”和“學”是指機器人的技能模仿學習和強化學習,主要是做單臂、雙臂以及全身行為的運動訓練。“用”則是在工業生產線及服務等場景裡實現人形機器人最新的模擬和應用。
劉宇飛介紹,訓練場數據的生產方法包括三個階段:
第一步是打造單臂的單技能學習與作業對象環境的泛化能力。
第二步是基於協作臂把這套技術路線遷移到“青龍”的上肢。
“青龍”的上肢單臂擁有7自由度+6自由度的靈巧手,協作臂是單臂6自由度+夾爪;為了使靈巧手擁有更廣的作業空間,沒有加入手腕相機。遷移時,我們對采集數據實時優化,在時間上嚴格對齊動作軌跡和圖像,以達到和三相機(1頭部+2手腕)同樣的學習效果。
第三步則是生產大規模、低成本的人類作業視頻。
訓練場不僅關注“小腦”模型的訓練,還涉及“大腦”模型,如環境感知、行為控制、人機交互、雲端網聯等能力的訓練。
“2024年,我們會在上海打造100+人形機器人的產品、100+人形機器人的訓練場。到2027年,我們期待能夠在多個城市、面向各類場景,搭建1000+人形機器人訓練場來服務整個人形機器人生態。”劉宇飛說。 |