민첩성 로봇 공학은 전신 제어 기초 모델을 훈련시키는 방법을 설명합니다.

the robot report staff

3시간 ago

민첩성 로봇 공학은 여기에 표시된 숫자 인 Humanoid에 대한 전신 제어 기초 모델을 개발했습니다.

민첩성 로봇 공학은 숫자 휴머노이드를위한 전신 제어 기초 모델을 개발했습니다. 출처 : 민첩성 로봇 공학

최근의 민첩성 로봇 블로봇 블로그 게시물에 따르면 Humanoid Robot의 가장 중요한 장점은 고도로 제한된 환경에서 다양한 작업을 수행하는 능력입니다. 건축 세계는 사람들을 염두에두고 설계되었으며 일반적인 기능과 일치 할 수있는 기계가 가장 가치가 있습니다.

물론 그렇다고해서는 안됩니다 휴머노이드 로봇은 우리와 똑같이보아야합니다 회사 가지다 이전에 덮여.

당면한 과제는 비교적 명확하지만 작업을 수행하는 것은 다양한 과제를 제기합니다. 로봇은 균형을 유지하고, 매끄럽게 움직이고, 환경 교란에 강력해야하며, 높은 수준의 정밀도로 도달, 파악하고 조작하는 동안 모든 환경 장애에 강력해야합니다. 무엇보다도 로봇은 결코 떨어지지 않아야합니다.

민첩성 로봇 공학은 숫자를 ‘모터 피질’에 제공합니다.

이를 위해 Agility Robotics는 다양한 작업을 수행하면서 안전하고 안정적으로 유지하기 위해 숫자 Humanoid Robot의 전신 제어 기초 모델을 개발했습니다. 그것은 인간 뇌의 운동 피질과 매우 유사하며, 자발적인 움직임과 미세 운동 기술을 통제하기 위해 뇌의 다른 부분 (숫자의 경우 다른 수준의 민첩성 제어 계층)에서 신호를 가져옵니다.

이 모델은 1 백만 미만의 매개 변수를 가진 비교적 작은 LSTM (긴 단기 메모리) 신경망으로 Nvidia의 Isaac Sim 물리학 모의 실험 장치 3-4 일 동안 수십 년 동안 시뮬레이션 된 시간 동안.

Digit의 모터 피질은 순전히 시뮬레이션에서 배우고 영점을 현실 세계로 전송합니다. 팔과 몸통에 대한 조밀 한 자유 공간 위치 및 방향 목표로 인해 걸어 다니고 집중하고 무거운 물체를 집어 들고 배치하는 등 다양한 목표를 달성 할 수 있습니다. 다운 스트림 Dexterous 조작 기술을 배울 수 있습니다 위에 모터 피질 및 유사하게 큰 언어 모델 (LLM)을 사용하여 복잡한 동작을 조정합니다.

민첩성 로봇 공학은 다양한 방법을 사용하여 다양한 작업 세트를 달성 할 수 있습니다.

3 월 에이 회사는이 작업의 초기 버전을 배치했습니다. nvidia‘에스 GTC 식료품의 숫자 쇼핑을 보여주는 행사. 이 데모의 경우 정책은 개방형 대사 객체 탐지기의 객체 감지에 의해 촉발되었고 3D로 들어 올렸고, 상태 기계 계획 루프를 통해 실행을 관리했습니다.

Digit은 Nvidia GTC에서 식료품 처리를 보여줍니다. 출처 : 민첩성 로봇 공학

이것은 복잡한 조작 계획을 실행하는 동안에도 교란에 더 강력한 숫자를 만드는 중요한 단계라고 민첩성은 말했다. 이 회사는 또한 Gemini Research Preview를 사용하여 모터 피질을 프롬프트 할 수있었습니다.

컨트롤러는 또한 매우 무거운 물체를 선택하는 데 강력합니다.

출처 : 민첩성 로봇 공학

왜 어려운가요?

유용한 작업을 수행하려면 로봇은 세계의 최종 이펙터를 강력하게 위치시키고 움직일 수 있어야한다고 민첩성 로봇은 말했다. 고정 기반 로봇의 경우, 이것은 잘 이해 된 문제입니다. 역 운동학 (IK) 또는 역 동적 (ID)과 같은 모델 기반 알고리즘을 사용하는 간단한 컨트롤러는 수십 년 동안 큰 영향을 미치는 데 널리 사용되어 왔습니다.

그러한 시스템의 사용자의 관점에서 볼 때, 하나는 최종 이펙터의 원하는 포즈 만 제공해야하며, 고정베이스 로봇은 해당 대상 포즈와 일치하도록 빠르게 움직일 것입니다.

민첩성은 인간형 로봇에 대해 동일한 인터페이스를 만들고 싶다고 말했다. 하나는 로봇이 단순히 최종 이펙터의 원하는 움직임에 의해 정보를 제공하고 로봇은 그 목표를 달성하기 위해 빠르고 효율적으로 위치한다.

불행히도,이 기능은 다리 로봇에서 그렇게 사소하지 않다고 말했다. 의 물리학 다리 운동에는 두 가지 모드가 있습니다. 하나는 다리가 공기를 통해 자유롭게 흔들리는 곳과 다리가 땅에 심어지면 나머지 로봇에 힘을 적용 할 때. 이 두 세트의 물리학은 로봇이 발을 배치하거나 발을 들어 올릴 때 발생하는 ‘연락처’를 만들거나 깨는 개념으로 분리됩니다.

이 복잡성은 계산 비용이 많으며 제어 및 계획 문제를 더 쉽게하기 위해 거의 항상 가정이 사용됩니다. 일반적으로 만들어진 가정 중 하나는 로봇의 다리가지면과 접촉하는 동안 엔드 이펙터 세계에서 목표에 도달하거나 대상을 조작하고 있습니다. 기본적으로 다리가 고정 된 플랫폼을 고정 된 플랫폼으로 바꿉니다.

이것은 인간형 로봇 공학 분야가 최근에 즐겼던 많은 인상적인 발전의 기초 인 강력한 휴리스틱이지만, 현대 로봇의 성능에 대한 근본적인 한계라고 Agility Robotics는 썼다. 로봇이 발 배치를 동적으로 조정하는 것을 방지하면 조작 작업 공간이 제한되고 작업 과정에서 발생할 수있는 교란력에 지능적이고 자연스럽게 반응하는 것을 방지합니다.

보다 이상적인 인터페이스는 로봇이 단순히 사용자가 원하는 손 동작을 추적하는 동안 필요한 경우 자체적으로 단계를 밟고 환경과의 충돌을 피하고 실제로 넘어지지 않도록 노력하는 인터페이스입니다. 동적으로 실현 가능한 전신 모션 계획을 실시간으로 생성하기가 어렵 기 때문에 역사적으로 적어도 최근까지 인간형 로봇에 대해 이러한 종류의 인터페이스가 다루기 어려워졌습니다.

강화 학습을 입력하십시오

Deep Inforcement Learning (RL)은 휴머노이드 로봇의 지배적 인 제어 패러다임으로 빠르게 떠오르고 있습니다. 컨트롤러에서 로봇의 하이브리드 역학의 움직임 방정식을 명시 적으로 모델링하거나 전체 시스템의 접촉 상태에 대한 단순화 가정을하는 대신 물리 시뮬레이터에서 신경망을 훈련하여 전신 모션을 추적하기 위해 컨트롤러 역할을 수행 할 수 있습니다.

Humanoid 전신 제어에 대한 최근의 결과는 인상적이고 역동적이며보다 전통적인 모델 기반 제어 방법을 사용하는 것보다 하드웨어 작업을 수행하는 데 훨씬 적은 전문 지식과 노력이 필요합니다. 그러나이 작업의 대부분은 춤과 같은 역동적 인 전신 운동에 중점을두고 모바일 조작에 필요한 정확한 추적을 달성하지 못합니다.

민첩성 로봇 공학은 숫자가 무거운 물건을 들어 올리고 조종 할 수 있도록 양손과 발로 환경에 힘을 적용하는 능력에 중점을두고 있습니다.

컨트롤러는 작업 공간을 커버해야합니다

RL이있는 휴머노이드 로봇을위한 대부분의 기존 작업 교육 전신 컨트롤러 (예 : GMT 또는 트위스트) 인간 모션 캡처 데이터와 같은 크고 오프라인 데이터 세트 사용 쌓다 또는 lafan1 전신 제어 네트워크를 훈련시키기 위해. 이로 인해 엄청나게 인상적이고 생생한 결과가 발생했지만 이러한 궤적 분포는 종종 원하는 조작 작업 공간을 다루지 않으며 민첩성 로봇 공학을 관찰했습니다.

필연적으로,이 오프라인 데이터 세트의 핸드 포즈 목표는 작업 공간의 잘 표현 된 일부 영역을 조밀하게 다룰 것이며, 작업 공간 또는 기타 주요 지역의 극한이 드문 드문 채워집니다. 그러나 민첩성은 손 목표의 훈련 분포가 전체 작업 공간을 균일하게 다루는 것이 중요하다고 주장했다.

모터 피질이 정밀도와 신뢰성이 높은 작업 공간의 모든 지점에 도달 할 수 있도록 Agility는 임의의 샘플링 체계를 사용하여 작업 공간에서 균일하게 위치와 방향을 선택하고 해당 지점 사이에 임의의 번역 및 회전 운동 속도를 생성하여 양손과 토르 토를 생성합니다. 현재 핸드 포즈와 대상 핸드 포즈 사이의 번역 및 회전 오차를 고려하는 보상 용어를 사용하여 모터 피질이 그 지점에 도달하도록 훈련합니다.

민첩성 로봇 공학은 전신 컨트롤러 모델을 사용하여 숫자를 훈련합니다. 출처 : 민첩성 로봇 공학

위치> 속도

민첩성 로봇 공학은 다양한 방식으로 세상과 정확하게 상호 작용할 수있는 강화 학습 정책을 훈련시키기 위해 로봇이 세계의 특정 위치로 걸어 가서 그곳에 머물기를 원한다고 말했다.

그러나 레깅스 로봇에 RL을 적용하는 것에 대한 대부분의 문헌은 속도 기반에서와 같이 루트 위치 (“이 지점으로 이동”)가 아닌 대상 루트 속도 (“이 속도와 방향 일치”)를 추적하도록 신경망을 훈련시킵니다. 회전하다,,, 아모르,,, 매,,, 전 -몸 그리고 Exbody2,,, 휴먼 플러스,,, GMT,,, R2S2,,, MHC 위치 캡슐화 가능성 클론,,, OMNIH2O 그리고 호버.

운동의 목적을위한 위치보다는 속도를 추적하는 훈련 컨트롤러는 훨씬 더 풍부하고 용서하는 보상 신호를 제공하므로 종종 실용적인 선택이라고 민첩성은 말했다. 또한, 테스트 시간에 하드웨어의 루트 위치를 추적하려면 부유 식베이스 포즈 추정기의 구현과 같은 일종의 Odometry가 필요합니다.

그러나, 대상 위치가 아닌 대상 속도에 조절되는 운동 컨트롤러는 더 높은 수준의 플래너 객체 또는 사람 텔레오퍼레이터가 있어야 위치 드리프트 또는 위치 오류를 설명하기위한 일정한 지침을 제공해야합니다. 이상적으로, 사용자는 컨트롤러에게 여유 공간에 있어야하는 위치를 알려주고, 밀려나거나 교란 된 경우에도 자연스럽게 해당 위치로 돌아갑니다.

작업 공간에서 프롬프하는 것이 구성 공간보다 낫습니다

또 다른 문제는 이전 작업에서 상체 대상 세트 포인트가 종종 관절 공간에서 매개 변수화된다는 것입니다. 즉, 전신 컨트롤러를 실제로 사용하려면 모션 캡처 슈트와 인간 구성 공간에서 로봇 구성 공간으로의 매핑이 필요하거나 상체 모션 계획을 생성하기위한 플래너 또는 모델이 필요하다는 점을 의미합니다.

이들은 상위 수준의 계획 계층, 인간 원격 장치 또는 LLM에 로봇의 운동 학적 상태 모델이 필요하기 때문에 심각한 한계라고 언급했습니다. 다운 스트림 스크립팅에 훨씬 더 편리 할 것입니다. 원격 수술인터페이스가 단순히 자유 공간 위치 및 방향 인 경우 컨트롤러 위에 구축되는 동작 클로닝.

이것은 또한 사용 된 표현에 훨씬 더 가까이 있다는 장점이 있습니다. 최첨단 모방 학습 방법그리고 우리는 객체 위치를 직접 예측할 수 있음을 의미합니다. Gemini와 같은 모델을 사용합니다 실행 정책을 제공합니다.

행동에 대한 민첩성 로봇 층

민첩성 로봇 공학은 인간 환경에서 유용한 작업을 수행 할 수있는 지능형 휴머노이드 로봇을 적극적으로 구축하고 배포하고 있다고 말했다. Digit의 “모터 피질”은 이것의 일부라고 회사는 말했다. 그것은 “항상 켜짐”으로 기능합니다. 안전 로봇의 반응적이고 직관적 인 제어를 가능하게하는 층.

“우리는이 하위 수준의 모터 피질 위에 복잡한 행동을 구축 할 수 있습니다. “우리는 이것이 실제 휴머노이드 로봇을위한 안전하고 강력한 모션 파운데이션 모델을 향한 첫 번째 단계라고 생각합니다.”

이 주제에 대해 자세히 알아 보려면 오레곤 주립 대학의 동적 로봇 공학 및 인공 지능 연구소의 공동 책임자 인 Alan Fern 박사 의이 기사를 확인하십시오. ]신흥 휴머노이드 모터 피질 : RL 훈련 컨트롤러의 재고.”

편집자 노트 : 이 게시물은 민첩성 로봇 공학에서 신디케이트됩니다. 블로그 허가로.

Pras VelagapudiAgility Robotics의 최고 기술 책임자는“첫 번째 휴머노이드 배치에서 배운 교훈” 에 Robobusiness 2025. 상업용 로봇 개발자 및 공급 업체를위한 최고의 이벤트는 캘리포니아 산타 클라라에서 10 월 15 일과 16 일에 진행될 예정이며, 휴머노이드, 물리적 AI에 대한 트랙을 특징으로하며 기술, 디자인 및 개발, 필드 로봇 공학 및 비즈니스를 가능하게합니다. 등록이 시작되었습니다.

게시물 민첩성 로봇 공학은 전신 제어 기초 모델을 훈련시키는 방법을 설명합니다. 먼저 나타났습니다 로봇 보고서.