
비타 제로의 개요, 제로 샷 Visuotactile 포즈 추정 프레임 워크. | 크레딧 : 아마존 로봇 공학
객체 6D 포즈 추정은 로봇 공학, 특히 다양한 조작 작업에서 중요한 도전입니다. 시각 및 촉각 (visuotactile) 정보를 결합한 사전 연구는 약속을 보여 주었지만, Amazon Robotics는 이러한 접근법이 종종 가상성 데이터의 가용성이 제한되어 있기 때문에 일반화로 어려움을 겪고 있다고 말했다.
Amazon Robotics는 최근 Zero-Shot Visuotactile 포즈 추정 프레임 워크 인 Vita-Zero를 소개했습니다. Amazon Robotics는 주요 혁신은 시각적 모델을 백본으로 활용하고 촉각 및 고유 한 관찰에서 파생 된 물리적 제약 조건을 기반으로 타당성 검사 및 테스트 시간 최적화를 수행하는 데 있다고 말했다. 구체적으로,이 접근법은 촉각 센서가 매력을 유발하고 독점 인식을 반발력을 생성하는 스프링-질량 시스템으로 그립퍼-객체 상호 작용을 모델링합니다.
Amazon Robotics는 실제 로봇 설정에 대한 실험을 통해 프레임 워크를 검증하여 대표적인 시각적 백본 및 조작 시나리오의 효과를 입증, 객체 선택 및 이중 핸드 오버를 보여줍니다. Amazon은 시각적 모델과 비교할 때 접근 방식이 핸드 객체 자세를 추적하면서 일부 과감한 실패 모드를 극복했다고 말했다.
실험에서 연구원들은이 접근법이 ADD-S의 곡선 (AUC)에서 평균 55%의 증가와 ADD에서 60%의 평균 55% 증가한 것으로 밝혀졌으며, 기초에 비해 80% 더 낮은 위치 오차가 나타났습니다. 이 팀은 또한 다양한 손실 기능, 정제 알고리즘 및 최적화 초기화 기술을 포함한 다양한 설계 선택의 영향을 평가하기 위해 광범위한 절제 연구를 수행했다고 밝혔다. 향후 작업을 위해, 우리는 더 많은 객체 모양을 평가하고 포즈 추정기를 조작 정책에 통합하여 조작 작업의 전반적인 성능에 미치는 영향을 평가할 계획입니다.
Vita-Zero의 획기적인 접근 방식 뒤에있는 자세한 내용을 잠금 해제하려면 아래 논문을 다운로드하십시오. 스프링-질량 visuotactile 상호 작용 모델에 대해 제로 샷 적응성을 증명하는 실험 결과에 대해 배울 것입니다. 로봇 인식과 조작의 미래에 관심이 있다면 Vita-Zero가 Visuotactile 인공 지능에서 가능한 것의 경계를 어떻게 밀어 넣는지 확인하십시오.
게시물 Amazon Robotics의 Vita-Zero는 주요 로봇 공학 도전을 해결합니다 먼저 나타났습니다 로봇 보고서.