Google DeepMind는 최근 자사가 만든 두 가지 인공 지능 시스템인 ALOHA Unleashed와 DemoStart에 대한 통찰력을 제공했습니다. 회사는 이 두 시스템 모두 로봇이 민첩한 움직임이 필요한 복잡한 작업을 수행하도록 돕는 것을 목표로 한다고 말했습니다.
민첩성은 획득하기 매우 어려운 기술입니다. 신발 끈을 묶거나 나사를 조이는 것처럼 우리가 매일 두 번 생각하지 않고 하는 작업이 많이 있는데, 로봇이 안정적으로 수행하려면 몇 주가 걸릴 수 있습니다.
DeepMind 팀은 로봇이 사람들의 삶에 더 유용하려면 역동적인 환경에서 물리적 물체와 더 잘 접촉해야 한다고 주장했습니다.
알파벳 단위‘에스 알로하 해방 로봇이 복잡하고 새로운 양팔 조작 작업을 수행하는 방법을 배우도록 돕는 것을 목표로 합니다. DemoStart는 시뮬레이션을 사용하여 손가락이 여러 개인 로봇 손의 실제 성능을 향상시킵니다.
딥마인드는 로봇이 인간의 시연으로부터 학습하고 이미지를 행동으로 변환할 수 있도록 지원함으로써 로봇이 다양한 유용한 작업을 수행할 수 있는 길을 닦고 있다고 말했습니다.
ALOHA Unleashed는 두 개의 로봇 팔로 조작이 가능합니다.
지금까지 대부분의 첨단 AI 로봇은 한쪽 팔만 사용해 물체를 집고 배치할 수 있었습니다. Google DeepMind에 따르면 ALOHA Unleashed는 양팔 조작에서 높은 수준의 민첩성을 달성했습니다.
연구원들은 이 새로운 방법을 통해 구글의 로봇이 신발 끈 묶기, 셔츠 걸기, 다른 로봇 수리하기, 기어 삽입하기 등을 학습했다고 밝혔습니다. 깨끗한 부엌.
ALOHA Unleashed는 DeepMind를 기반으로 구축되었습니다. 알로하 2 양손잡이용 오리지널 ALOHA 저가형 오픈 소스 하드웨어를 기반으로 한 플랫폼 원격조종 ~에서 스탠포드 대학. ALOHA 2는 훈련 및 데이터 수집 목적으로 원격 조작이 가능한 두 손을 갖고 있기 때문에 이전 시스템보다 더 민첩합니다. 또한 로봇은 더 적은 수의 시연을 통해 새로운 작업을 수행하는 방법을 배울 수 있습니다.
구글도 말했다 로봇 하드웨어의 인체공학적 측면을 개선하고 최신 시스템의 학습 프로세스를 향상시켰습니다. 먼저 신발끈 묶기, 티셔츠 걸기 등 어려운 작업을 수행하는 등 로봇의 행동을 원격으로 조종해 실증 데이터를 수집했다.
다음으로 Imagen 모델이 이미지를 생성하는 방식과 유사하게 무작위 노이즈로부터 로봇 동작을 예측하는 확산 방법을 적용했습니다. 이는 로봇이 데이터로부터 학습하는 데 도움이 되므로 동일한 작업을 자체적으로 수행할 수 있다고 DeepMind는 말했습니다.
DeepMind는 강화 학습을 사용하여 손재주를 가르칩니다.
능숙한 로봇 손을 제어하는 것은 복잡한 작업입니다. 손가락, 관절, 센서가 추가될 때마다 더욱 복잡해집니다. 이는 Google DeepMind가 DemoStart를 통해 해결하고자 하는 과제입니다. 새 종이. DemoStart는 강화 학습 알고리즘을 사용하여 새로운 로봇이 시뮬레이션에서 능숙한 동작을 습득하도록 돕습니다.
이러한 학습된 동작은 여러 손가락이 있는 손과 같은 복잡한 환경에 특히 유용할 수 있습니다. DemoStart는 쉬운 상태부터 학습을 시작하고, 시간이 지남에 따라 연구원들은 작업을 최대한 숙달할 때까지 더 복잡한 상태를 추가합니다.
DeepMind는 이 시스템이 시뮬레이션에서 작업을 해결하는 방법을 배우는 데 필요한 시뮬레이션 데모가 동일한 목적을 위해 실제 사례에서 학습할 때 일반적으로 필요한 것보다 100배 더 적다고 말했습니다.
훈련 후, 연구 로봇은 다양한 시뮬레이션 작업에서 98% 이상의 성공률을 달성했습니다. 여기에는 특정 색상이 표시된 큐브 방향 조정, 너트와 볼트 조이기, 도구 정리 등이 포함됩니다.
실제 설정에서는 큐브 방향 조정 및 들어올리기에서 97%의 성공률을 달성했으며, 높은 손가락 조정과 정밀도가 필요한 플러그 소켓 삽입 작업에서 64%의 성공률을 달성했습니다.
시뮬레이션 교육은 이점과 과제를 제공합니다.
Google은 DemoStart를 다음과 같이 개발했다고 밝혔습니다. 무주코오픈 소스 물리 시뮬레이터. 다양한 업무를 마스터한 후 시뮬레이션 도메인 무작위화와 같은 시뮬레이션과 실제 간극을 줄이기 위한 표준 기술을 사용하여 거의 제로샷을 물리적 세계로 전송할 수 있었습니다.
시뮬레이션의 로봇 학습은 실제 물리적 실험을 실행하는 데 필요한 비용과 시간을 줄일 수 있습니다. Google은 이러한 시뮬레이션을 설계하는 것이 어렵고 항상 실제 성능으로 성공적으로 변환되는 것은 아니라고 말했습니다.
강화학습을 결합하여 학습 몇 가지 시연을 통해 DemoStart의 점진적인 학습은 시뮬레이션과 실제 간의 격차를 해소하는 커리큘럼을 자동으로 생성하여 시뮬레이션의 지식을 물리적 로봇으로 더 쉽게 전달하고 물리적 실험을 실행하는 데 필요한 비용과 시간을 줄입니다.
집중적인 실험을 통해 더욱 발전된 로봇 학습을 가능하게 하기 위해 Google은 DEX-EE라는 세 손가락 로봇 손에서 이 새로운 접근 방식을 테스트했습니다. 섀도우 로봇.
구글은 로봇이 사람처럼 쉽고 정확하게 물체를 파악하고 다룰 수 있게 되기까지는 아직 갈 길이 멀지만 상당한 진전을 이루고 있다고 밝혔습니다.
게시물 Google DeepMind는 로봇 민첩성의 최신 발전에 대해 논의합니다. 처음 등장한 로봇 보고서.