AI 뉴스허브

UC Berkeley의 AI 기반 로봇은 Jenga Whipping을 배웁니다

UC Berkeley의 AI 기반 로봇은 Jenga Whipping을 배웁니다

UC Berkeley에서 연구원 Sergey Levine의 로봇 AI 및 Learning Lab 39 개의 Jenga 블록의 탑이 완벽하게 쌓인 테이블이 눈에 띄었습니다. 그런 다음 흰색과 검은 색 로봇이있는 단일 사지가 구멍을 뚫은 기린처럼 두 배가되어 탑을 향해 확대되어 검은 가죽 채찍을 휘두 릅니다. 물리학의 기적처럼 캐주얼 한 시청자에게 보일 수있는 것을 통해 채찍은 정확하게 올바른 지점에 닿았습니다.

“Jenga Whipping”으로 알려진이 과제는 손재주와 반사를 가진 사람들이 그것을 끌어 내기 위해 추구하는 취미입니다. 이제 소설의 AI 구동 훈련 방법 덕분에 로봇이 마스터했습니다. 이 교육 프로토콜은 인간의 시연 및 피드백, 자체의 실제 시도뿐만 아니라 실제 시도로부터 학습함으로써 로봇에게 100% 성공률로 Jenga Whipping과 같은 복잡한 작업을 수행하는 방법을 가르칩니다. 또한 로봇은 인상적인 속도로 가르치면서 1 ~ 2 시간 이내에 컴퓨터 마더 보드를 완벽하게 조립하고 선반을 만드는 방법을 배울 수 있습니다.

AI에 의해 연료를 공급받은 로봇 학습 분야는 컨베이어 벨트의 특정 장소에서 물체를 반복적으로 선택하는 것과 같이 단일 동작과는 달리 예측할 수 없거나 복잡한 기계 활동을 가르치는 방법에 대한 도전을 깨뜨려고 노력했습니다. 이 quandary를 해결하기 위해 Levine의 실험실은 “강화 학습”이라고 불리는 것을 제로화했습니다.

박사후 연구원 인 Jianlan Luo는 강화 학습에서 로봇이 현실 세계에서 과제를 시도하고 카메라의 피드백을 사용하여 실수를 통해 결국 그 기술을 숙달한다고 설명했습니다. 팀이 2024 년 초이 접근법을 사용하여 새로운 소프트웨어 제품군을 처음 발표했을 때, Luo는 다른 사람들이 오픈 소스 소프트웨어를 스스로 사용하여 성공적으로 성공을 거부 할 수 있다고 마음에 들었습니다.

올 가을, Levine, Luo, Charles Xu, Zheyuan Hu 및 Jeffrey Wu의 연구팀 기술 보고서를 발표했습니다 가장 최근의 시스템에 대해 Jenga 채찍질을 한 시스템. 이 새롭고 개선 된 버전은 인간의 개입에 추가되었습니다. 로봇을 제어하는 ​​특수 마우스를 사용하면 사람이 로봇의 코스를 교정 할 수 있으며 이러한 수정 사항은 로봇의 속담 메모리 뱅크에 통합 될 수 있습니다. Robot은 강화 학습이라는 AI 방법을 사용하여 작업을 더 잘 수행하기 위해 모든 시도 (지원 및 보조, 성공 및 실패)의 합을 분석합니다. 루오는 인간이 로봇이 경험을 통해 배운 것처럼 점점 더 적게 개입해야한다고 말했다. “나는 처음 30% 나 무언가를 위해 로봇을 보모해야했고, 점차적으로 나는 실제로주의를 덜 주었다”고 그는 말했다.


2025 Robotics Summit Registration의 사이트 광고.컨퍼런스 패스에 40%를 절약하려면 오늘 등록하십시오!


이 실험실은 로봇 시스템을 Jenga Whipping을 넘어 복잡한 작업의 건틀릿을 통해 배치했습니다. 로봇은 팬에 알을 뒤집었다. 한쪽 팔에서 다른 팔로 물체를 전달했습니다. 마더 보드, 자동차 대시 보드 및 타이밍 벨트를 조립했습니다. 연구원들은 이러한 도전이 다양했기 때문에 이러한 도전을 선택했으며 루오의 말에 따르면“복잡한 실제 세계에서 로봇 과제를 수행 할 때 모든 종류의 불확실성”을 나타 냈습니다.

타이밍 벨트 작업은 어려움 측면에서 눈에 띄었습니다. 로봇이 타이밍 벨트와 상호 작용할 때마다 – 두 개의 페그 위로 플로피 목걸이 체인을 조작하려고한다고 상상해보십시오. 그 변화를 예상하고 반응해야했습니다.

Jenga Whipping은 다른 종류의 도전을 구성합니다. 모델을 모델링하기 어려운 물리학과 관련이 있으므로 시뮬레이션 만 사용하여 로봇을 훈련시키는 것이 덜 효율적입니다. 실제 경험은 중요했습니다.

연구원들은 또한 사고를 준비하여 로봇의 적응성을 테스트했습니다. 그들은 그립퍼를 열도록 강제로 개체를 떨어 뜨리거나 로봇이 마이크로 칩을 설치하려고 시도하면서 실험실 환경 밖에서 발생할 수있는 변화하는 상황에 반응하도록 훈련했습니다.

훈련이 끝나면 로봇은 이러한 작업을 100% 올바르게 실행할 수 있습니다. 연구원들은 결과가 동일한 양의 데모 데이터에 대해 훈련 된 행동 클로닝으로 알려진 일반적인 “내 행동을 복사”하는 방법과 비교했습니다. 그들의 새로운 시스템은 로봇을 더 빠르고 정확하게 만들었습니다. 로봇 역량의 기준은 매우 높기 때문에 이러한 메트릭은 중요하다고 말했다. 일반 소비자와 산업 주의자 모두는 일관되지 않은 로봇을 사고 싶지 않습니다. Luo는 특히 전자 제품, 자동차 및 항공 우주 부품에 자주 사용되는 것과 같은 “주문 제작”제조 공정은 다양한 작업을 안정적으로 적응할 수있는 로봇의 혜택을받을 수 있다고 강조했습니다.

로봇이 처음으로 Jenga Whipping Challenge를 정복했을 때“정말 충격을 주었다”고 Luo는 말했다. “Jenga 과제는 대부분의 인간에게 매우 어렵습니다. 나는 내 손에 채찍으로 그것을 시도했다. 성공률이 0%있었습니다.” 그리고 그는 인간의 젠가 채찍에 쌓인 경우에도 로봇은 결국 피곤한 근육이 없기 때문에 인간보다 성능이 뛰어날 것입니다.

Levine Lab의 새로운 학습 시스템은 Robotics Innovation의 광범위한 트렌드의 일부입니다. 지난 2 년 동안 더 큰 분야는 산업 투자와 AI에 의해 추진되는 도약과 경계로 이동하여 엔지니어들에게 로봇이 관찰 될 수있는 성능 데이터 또는 이미지 입력을 분석 할 수있는 터보 차저 도구를 제공합니다. 버클리 교수와 연구원들은이 혁신의 상승의 일부입니다. 상당한 벤처 자금을 받거나 공개 된 다양한 최첨단 로봇 회사에는 캠퍼스 관계가 있습니다.

Levine은 Robotics Company Physical Intelligence를 공동 설립했습니다 (PI)는 현재 다양한 로봇에서 작동 할 수있는 소프트웨어를 만드는 데 대한 진전으로 20 억 달러의 가치가 있습니다. 최신 자금 조달 라운드에서 PI는 투자자로부터 4 억 달러를 모금했습니다Jeff Bezos와 Openai를 포함하여. 2018 년 Ken Goldberg 교수 및 기타 버클리 연구자들은 Ambi Robotics약 6,700 만 달러를 모금했습니다. 이 회사는 AI 시뮬레이션을 통해 훈련 된 로봇을 다른 컨테이너로 파악하고 분류하여 전자 상거래 비즈니스에 없어서는 안될 로봇을 만듭니다.

버클리 인공 지능 연구소의 이사 인 Pieter Abbeel은 AI Robotics 스타트 업을 공동 제작했습니다. 공분산그 모델과 뇌 신뢰는 그랬습니다 작년 아마존에 입대했습니다. 기계 공학 교수 인 Homayoon Kazerooni는 공개적으로 거래되는 회사 인 Ekso Bionics를 설립하여 이동성이 제한된 사람들이 사용하기 위해 로봇“외골격”을 만듭니다.

Luo의 연구에 관해서는, 그는 그의 팀과 다른 연구자들이 그것을 밀어 넣을 수있는 곳을 보게되어 기쁩니다. 그는 다음 단계는 기본 객체 조작 기능으로 시스템을 사전 훈련하여 처음부터 배울 필요가없고 대신 더 복잡한 기술을 습득하기까지 직접 진행하는 것입니다. 이 실험실은 또한 다른 연구자들이 사용하고 구축 할 수 있도록 연구 오픈 소스를 만들기로 결정했습니다.

Luo는“이 프로젝트의 주요 목표는 기술을 iPhone처럼 접근 가능하고 사용자 친화적으로 만드는 것입니다. “나는 그것을 사용할 수있는 사람들이 많을수록 더 큰 영향을 줄 수 있다고 굳게 믿습니다.”

편집자 주 : 이 기사는 재 게시되었습니다 UC 버클리 뉴스.

게시물 UC Berkeley의 AI 기반 로봇은 Jenga Whipping을 배웁니다 먼저 나타났습니다 로봇 보고서.

Exit mobile version