一级A片线上/亚洲无人区电影完整版小视频/妻孝(改编版+续)/欧美涩涩

   中國金融網(wǎng) 加入收藏    設(shè)為首頁
首頁
國內(nèi)資訊社會財經(jīng)科技教育時尚娛樂房產(chǎn)家居汽車母嬰健康商業(yè)區(qū)塊鏈生活企業(yè)傳媒區(qū)域經(jīng)濟旅游體育
您現(xiàn)在的位置:首頁 > 聚焦 > 正文
Figure亮出底牌了
2025-02-23 07:04      來源:投資界      編輯:余梓陽      閱讀量:5067   

2月21日凌晨,Brett Adcock在X上發(fā)布了Figure“歷史上最重大的人工智能更新”——Helix。

這是Figure與OpenAI終止戰(zhàn)略合作后核心技術(shù)成果的首次展示,半個月前,Brett Adcock即預(yù)告過這項“人形機器人上前所未有的技術(shù)”。

Helix是一種用于通用人形機器人控制的“視覺-語言-動作” 模型,能夠?qū)⒏兄⒄Z言理解和學(xué)習(xí)控制統(tǒng)一起來,這意味著對機器人技術(shù)領(lǐng)域多項長期挑戰(zhàn)的克服。

在官方發(fā)布的視頻中,實驗人完全使用語言交流控制,從紙袋中拿出了機器人*次見的物品,要求機器人通過思考,把眼睛所看到的東西歸置到它們應(yīng)該在的位置,并且要求兩個機器人共同協(xié)作去放好。

隨后,從視頻中看來,兩個機器人通過識別、推理,機器人分別打開了抽屜柜和冰箱,機器人A將密封物品放進了抽屜柜,機器人B將需要保鮮的物品放進了冰箱。接著,機器人A又將看起來需要保鮮的食物遞給機器人B,機器人B接過食物,看了看機器人A,又看了看手中的食物,轉(zhuǎn)手絲滑地放進了冰箱。稍后還有機器人B將物品交給機器人A歸置到抽屜柜以及協(xié)作將蘋果放進左下角黑色圓盤的操作。

也就是說,Helix 是*款對整個人形上身進行高速率連續(xù)控制的 VLA,可以同時在兩個機器人上運行,使它們能夠使用從未見過的物品解決共享的、遠程操作任務(wù),配備了 Helix 的 Figure 機器人只需按照自然語言提示,就能拿起幾乎任何小型家居物品,包括數(shù)千種它們從未遇到過的物品。

并且,與之前的方法不同,Helix 使用一組神經(jīng)網(wǎng)絡(luò)權(quán)重來學(xué)習(xí)所有行為,而無需任何針對特定任務(wù)的微調(diào)。由于是*款完全在嵌入式低功耗 GPU 上運行的 VLA,它還能夠迅速實現(xiàn)商業(yè)化。

事實上,去年1月,F(xiàn)igure和寶馬就建立了合作關(guān)系,寶馬在其位于南卡羅來納州的工廠部署了Figure機器人,人們對人形機器人進入家庭解放雙手的期待不斷高漲。

聽起來簡單,但卻是機器人技術(shù)面臨的一大挑戰(zhàn)。與受控的工業(yè)環(huán)境不同,家里堆滿了無數(shù)的物品——精致的玻璃器皿、皺巴巴的衣服、散落的玩具——每件物品都有不可預(yù)測的形狀、大小、顏色和紋理。為了讓機器人在家庭中發(fā)揮作用,它們需要能夠按需產(chǎn)生智能的新行為,尤其是對它們從未見過的物體。

對于這個難題,以往的機器人技術(shù)有兩種解決方案:要么通過N小時的博士級專家手動編程來教機器人一種新行為,要么是N千次演示。然而,家庭問題的樣本變化多端,這兩種方法的成本都太高了。

Figure大方介紹了自己的模型思考原點。即:如果能簡單地將視覺語言模型 中捕獲的豐富語義知識直接轉(zhuǎn)化為機器人動作,這種新功能將從根本上改變機器人的擴展軌跡(如下圖所示),曾經(jīng)需要數(shù)百次演示的新技能只需用自然語言與機器人交談即可立即獲得。

不過,關(guān)鍵問題在于:如何從 VLM 中提取所有這些常識性知識并將其轉(zhuǎn)化為可泛化的機器人控制?這就涉及到了Figure的突破——Helix。

過去的方法面臨著一個根本性的權(quán)衡:VLM 主干是通用的,但速度不快,而機器人視覺運動策略是快的,但不通用。Helix 通過兩個互補的系統(tǒng)解決了這一權(quán)衡,即“系統(tǒng) 1、系統(tǒng) 2”VLA 模型,這兩個系統(tǒng)經(jīng)過端到端的訓(xùn)練,可以進行通信:

系統(tǒng) 2 :一個機載互聯(lián)網(wǎng)預(yù)訓(xùn)練的 VLM,以 7-9 Hz 的頻率運行,用于場景理解和語言理解,從而實現(xiàn)跨對象和上下文的廣泛概括。

系統(tǒng) 1 :一種快速反應(yīng)的視覺運動策略,將 S2 產(chǎn)生的潛在語義表征轉(zhuǎn)化為 200 Hz 的精確連續(xù)機器人動作。

這種解耦架構(gòu)允許每個系統(tǒng)在其*時間尺度上運行。S2 可以“慢慢思考”高級目標(biāo),而 S1 可以“快速思考”以實時執(zhí)行和調(diào)整動作。例如,在協(xié)作行為期間,S1 可以快速適應(yīng)伙伴機器人不斷變化的動作,同時保持 S2 的語義目標(biāo)。

總結(jié)Helix 技術(shù)上的創(chuàng)新點就是:

速度和泛化:Helix 匹配專門的單任務(wù)行為克隆策略的速度,同時將零樣本推廣到數(shù)千個新穎的測試對象。

可擴展性:Helix 直接輸出高維動作空間的連續(xù)控制,避免了先前 VLA 方法中使用的復(fù)雜動作標(biāo)記方案,這些方案在低維控制設(shè)置中已取得一些成功,但在高維人形控制中面臨擴展挑戰(zhàn)。

架構(gòu)簡單:Helix 使用標(biāo)準(zhǔn)架構(gòu) - 用于系統(tǒng) 2 的開源、開放權(quán)重 VLM 和用于 S1 的簡單的基于變壓器的視覺運動策略。

關(guān)注點分離:將 S1 和 S2 解耦,我們可以分別在每個系統(tǒng)上進行迭代,而不受尋找統(tǒng)一的觀察空間或動作表示的限制。

具體來說,Helix 能夠控制從單個手指運動到末端執(zhí)行器軌跡、頭部注視和軀干姿勢等一切。視頻演示中,機器人用頭部平穩(wěn)地跟蹤雙手,同時調(diào)整軀干以獲得*觸及范圍,同時保持精確的手指控制以進行抓握。

從機器人技術(shù)更迭歷史看,在如此高維的動作空間中實現(xiàn)這種精度水平被認為是*挑戰(zhàn)性的,即使對于單個已知任務(wù)也相當(dāng)困難,因為一般來說,當(dāng)頭部和軀干移動時,它們會改變機器人可以觸及的范圍和可以看到的范圍,從而產(chǎn)生反饋循環(huán),而這種反饋循環(huán)在過去會導(dǎo)致不穩(wěn)定。之前沒有 VLA 系統(tǒng)能夠展示這種程度的實時協(xié)調(diào),同時保持跨任務(wù)和對象泛化的能力。

兩個 Figure 機器人之間的協(xié)作零樣本雜貨存儲的過程中,機器人成功地操作了全新的雜貨,展示了對各種形狀、大小和材料的穩(wěn)健泛化。此外,兩個機器人都使用相同的 Helix 模型權(quán)重進行操作,無需進行針對機器人的訓(xùn)練或明確的角色分配。它們通過自然語言提示實現(xiàn)協(xié)調(diào),例如“將一袋餅干遞給你右邊的機器人”或“從你左邊的機器人那里接過一袋餅干并將其放在打開的抽屜里”。

并且,通過簡單的“拾起 ”命令拾起任何小型家用物品。在系統(tǒng)測試中,機器人成功處理了雜亂無章的數(shù)千件新物品(從玻璃器皿和玩具到工具和衣物),無需任何事先演示或自定義編程。

尤其值得注意的是,Helix 一定程度上彌補了互聯(lián)網(wǎng)規(guī)模語言理解與精確機器人控制之間的差距。例如,當(dāng)被要求“撿起沙漠物品”時,Helix 不僅能識別出玩具仙人掌符合這一抽象概念,還能選擇最近的手并執(zhí)行安全抓住它所需的精確運動命令。

不僅如此,從訓(xùn)練成本來看,F(xiàn)igure總共使用約 500 小時的高質(zhì)量監(jiān)督數(shù)據(jù)來訓(xùn)練 Helix,這僅僅是之前收集的 VLA 數(shù)據(jù)集的一小部分,并且不依賴于多機器人化身收集或多個訓(xùn)練階段。而且,Helix 僅使用一個統(tǒng)一的模型就實現(xiàn)了不同任務(wù)的強大性能。僅使用一組神經(jīng)網(wǎng)絡(luò)權(quán)重(系統(tǒng) 2 為 7B,系統(tǒng) 1 為 80M),Helix 就可以在各種容器中拾取和放置物品、操作抽屜和冰箱、協(xié)調(diào)靈巧的多機器人交接,并操縱數(shù)千個新物體。

OODA首席技術(shù)官Bob Gourley對Helix 贊不絕口。

Gab AI的CEO Andrew Torba更是將 Helix 和 Grok3的發(fā)布相提并論,認為“未來就在這里”。

Helix的發(fā)布很快吸引了投資人的關(guān)注,香蕉資本的Turner Novak 隨即在推特發(fā)文問:“多久之后Figure機器人才能實現(xiàn)自我建造?”

Brett Adcock也很快作出了回應(yīng),表示今年即將實現(xiàn)大批量生產(chǎn),用機器人制造機器人,認為這將是“世界上最重要的資產(chǎn)”。

Figure 顯然在擴展人形機器人行為方面邁出了變革性的一步。

不過,F(xiàn)igure相當(dāng)謙虛:“這些早期成果確實令人興奮,但我們認為它們只是觸及了可能性的表面。我們迫切希望看到當(dāng)我們將 Helix 擴大 1,000 倍甚至更多時會發(fā)生什么。”

讓我們共同期待。

鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場無關(guān)。僅供讀者參考,并請自行核實相關(guān)內(nèi)容。

 
上一篇: 重慶2025年春運發(fā)送旅客2968.66萬人次
下一篇:最后一頁
 
     欄目排行
  1. 重慶2025年春運發(fā)送旅客2968.66
  2. 第七屆中國國際進口博覽會2024長三角G
  3. 江蘇全省弱雨雪再次上線下周開啟冰凍模式
  4. 共筑全齡友好城市未來2024“上海-東京
  5. 廣湛高鐵珠三角樞紐機場站建設(shè)加速,“軌道
  6. 當(dāng)中國住房租賃市場開始吸引優(yōu)質(zhì)外資長期投
  7. 反內(nèi)卷、去庫存,制造業(yè)企業(yè)密集招聘銷售員
  8. 全民智駕加配不加價比亞迪王朝全系智駕版北
  9. 中汽研科技:攜手坪山,共創(chuàng)大灣區(qū)智能網(wǎng)聯(lián)
  10. 智能化下半場比亞迪“出牌”
     欄目推薦
二手房“帶押過戶”啟動滿月 成功嘗鮮者寥寥無幾二手房“帶押過戶”啟動滿月 成功嘗鮮者寥寥無幾
2022年營收78.61億,湯臣倍健迎來VDS行業(yè)新2022年營收78.61億,湯臣倍健迎來VDS行業(yè)新周期
大興國際氫能示范區(qū)兼顧產(chǎn)業(yè)發(fā)展和配套服務(wù)打造員工理想大興國際氫能示范區(qū)兼顧產(chǎn)業(yè)發(fā)展和配套服務(wù)打造員工理想生活藍本
迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡迪麗熱巴穿軍綠色也好美!和吳磊同框絲毫沒有年齡
綠色塞罕壩 不朽的奇跡綠色塞罕壩 不朽的奇跡