• 正文
  • 推薦器件
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

Eureka!NVIDIA 研究突破為機器人學(xué)習(xí)注入新動力

2023/10/24
2615
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

AI 智能體利用 LLM 自動生成獎勵算法,訓(xùn)練機器人完成復(fù)雜任務(wù)。

NVIDIA Research 開發(fā)的一款名為 Eureka 的新型 AI 智能體可以教機器人復(fù)雜的技能,它教會了機器人手快速轉(zhuǎn)筆,并且第一次轉(zhuǎn)得像人類一樣好。

上面視頻中所展示的令人驚嘆的“魔術(shù)”是機器人通過 Eureka 學(xué)會熟練完成的近 30 項任務(wù)之一,Eureka 可以自動編寫?yīng)剟钏惴▉碛?xùn)練機器人。

Eureka 還教會了機器人完成打開抽屜和柜子、拋接球、操作剪刀等任務(wù)。

于 10 月 20 日發(fā)布的這一 Eureka 研究包含一篇論文和該項目的 AI 算法,開發(fā)者可以使用 NVIDIA Isaac Gym(一款用于強化學(xué)習(xí)研究的物理模擬參考應(yīng)用)進行實驗。Isaac Gym 基于 NVIDIA Omniverse 而構(gòu)建,后者是一個用于基于 OpenUSD 框架構(gòu)建 3D 工具和應(yīng)用的開發(fā)平臺。Eureka 自身是由 GPT-4 大型語言模型驅(qū)動的。

NVIDIA AI 研究高級總監(jiān)、Eureka 論文作者之一的 Anima Anandkumar 表示:“在過去十年,強化學(xué)習(xí)取得了空前成功,但依然面臨許多挑戰(zhàn),比如獎勵設(shè)計需要不斷試錯才能完成。Eureka 是朝著開發(fā)將生成式和強化學(xué)習(xí)方法結(jié)合以解決這些艱巨的任務(wù)的新算法邁出的第一步。”

相關(guān)精彩視頻已在NVIDIA中國西瓜視頻賬號發(fā)布: NVIDIA Research 最新研究成果:Eureka 用 LLM 訓(xùn)練機器人靈巧操作

AI訓(xùn)練機器人

據(jù)該論文介紹,Eureka 生成的獎勵程序(可讓機器人進行試錯學(xué)習(xí))在超過 80% 的任務(wù)上優(yōu)于人類專家編寫的程序,這使得機器人的平均性能提高了 50% 以上。

Eureka 教機械臂打開一個抽屜。

該 AI 智能體使用 GPT-4 LLM 和生成式 AI 編寫軟件代碼,為機器人進行強化學(xué)習(xí)提供獎勵。它不需要任何特定任務(wù)提示或預(yù)定義的獎勵模板,并且能夠隨時結(jié)合人類的反饋改進其獎勵,使結(jié)果更加精準地符合開發(fā)者的愿望。

利用 Isaac Gym 中的 GPU 加速模擬,Eureka 能夠快速評估大批獎勵候選者的質(zhì)量,從而提高訓(xùn)練效率。

Eureka 隨后會基于訓(xùn)練結(jié)果匯總關(guān)鍵統(tǒng)計數(shù)據(jù),并指導(dǎo) LLM 改進其獎勵函數(shù)的生成。通過這種方式,AI 可以自我完善。Eureka 教會了各類機器人,包括四足機器人、雙足機器人、四旋翼機器人、靈巧手、協(xié)作機器人臂等,來完成不同類型的任務(wù)。

該研究論文對 20 個 Eureka 訓(xùn)練任務(wù)進行了深入評估,這些任務(wù)基于開源的靈巧性基準,要求機器人手展示一系列復(fù)雜的雙手任務(wù)。

這些來自九個 Isaac Gym 環(huán)境的測試結(jié)果通過使用 NVIDIA Omniverse 生成的可視化進行了展示。

類人型機器人通過 Eureka 學(xué)習(xí)跑步步態(tài)。

該項目的貢獻者之一、NVIDIA 高級研究科學(xué)家 Linxi “Jim” Fan 表示:“Eureka 是一個獨特的組合,將大型語言模型與 NVIDIA GPU 加速的模擬技術(shù)相結(jié)合,可以實現(xiàn)靈巧的機器人控制,并且為藝術(shù)家提供了一種制作物理逼真動畫的新方法?!?/p>

除了 NVIDIA Research 最近取得的進展(比如使用 GPT-4 構(gòu)建的能夠自主玩 《我的世界》的 AI 智能體 Voyager)之外,這項突破性的研究成果也必將讓開發(fā)者們腦洞大開。

NVIDIA Research 由全球數(shù)百名科學(xué)家和工程師組成,團隊專注于 AI、計算機圖形學(xué)、計算機視覺、自動駕駛汽車、機器人學(xué)等領(lǐng)域的研究。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
ATMEGA64A-AU 1 Atmel Corporation RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM HEIGHT, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64

ECAD模型

下載ECAD模型
$4.99 查看
ATMEGA8515L-8AU 1 Microchip Technology Inc IC MCU 8BIT 8KB FLASH 44TQFP

ECAD模型

下載ECAD模型
$4.23 查看
ATSAM4S16BA-AU 1 Atmel Corporation RISC Microcontroller, 32-Bit, FLASH, CORTEX-M4 CPU, 120MHz, CMOS, PQFP64, LQFP-64

ECAD模型

下載ECAD模型
$7.22 查看
英偉達

英偉達

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計算解決方案提供支持。收起

查看更多

相關(guān)推薦