로봇 분야는 오랫동안 중요한 과제에 직면해 왔습니다. 로봇이 역동적이고 실제적인 환경에서 효과적으로 기능하도록 훈련하는 것입니다. 로봇은 조립 라인과 같은 구조화된 환경에서는 뛰어나지만, 예측할 수 없는 가정과 공공 공간을 탐색하도록 가르치는 것은 어려운 과제임이 입증되었습니다. 가장 큰 장애물은? 이러한 기계를 훈련하는 데 필요한 다양한 실제 데이터가 부족하다는 것입니다.
에서 새로운 개발 워싱턴 대학의 연구자들은 로봇이 복잡한 현실 세계 시나리오에 대해 훈련되는 방식을 잠재적으로 바꿀 수 있는 두 가지 혁신적인 AI 시스템을 공개했습니다. 이 시스템은 비디오 및 사진 데이터의 힘을 활용하여 로봇 훈련을 위한 현실적인 시뮬레이션을 만듭니다.
RialTo: 로봇 훈련을 위한 디지털 트윈 생성
RialTo라는 이름의 첫 번째 시스템은 로봇을 위한 훈련 환경을 만드는 새로운 접근 방식을 도입합니다. RialTo를 사용하면 사용자는 스마트폰만 사용하여 물리적 공간의 가상 복제본인 “디지털 트윈”을 생성할 수 있습니다.
워싱턴 대학교 폴 G. 앨런 컴퓨터 과학 및 공학 대학의 조교수이자 이 연구의 공동 수석 저자인 아비섹 굽타 박사는 이 과정을 다음과 같이 설명합니다. “사용자는 스마트폰으로 공간을 빠르게 스캔하여 그 기하학을 기록할 수 있습니다. 그런 다음 RialTo는 그 공간의 ‘디지털 트윈’ 시뮬레이션을 만듭니다.”
이 디지털 트윈은 단순히 정적 3D 모델이 아닙니다. 사용자는 시뮬레이션과 상호 작용하여 공간의 다양한 객체가 어떻게 기능하는지 정의할 수 있습니다. 예를 들어 서랍이 열리는 방식이나 가전제품이 작동하는 방식을 보여줄 수 있습니다. 이러한 상호 작용성은 로봇 훈련에 필수적입니다.
디지털 트윈이 생성되면 가상 로봇은 이 시뮬레이션 환경에서 반복적으로 작업을 연습할 수 있습니다. 강화 학습이라는 프로세스를 통해 로봇은 잠재적인 중단이나 환경의 변화를 고려하더라도 작업을 효과적으로 수행하는 방법을 배웁니다.
RialTo의 장점은 이 가상 학습을 물리적 세계로 옮길 수 있는 능력에 있습니다. Gupta는 “그러면 로봇이 그 학습을 물리적 환경으로 옮길 수 있는데, 실제 주방에서 훈련된 로봇만큼이나 정확합니다.”라고 말합니다.
URDFormer: 인터넷 이미지에서 시뮬레이션 생성
RialTo가 특정 환경에 대한 매우 정확한 시뮬레이션을 만드는 데 중점을 두는 반면, 두 번째 시스템인 URDFormer는 더 광범위한 접근 방식을 취합니다. URDFormer는 광범위한 일반 시뮬레이션을 빠르고 비용 효율적으로 생성하는 것을 목표로 합니다.
워싱턴 대학교 박사과정 학생이자 URDFormer 연구의 주저자인 조이 첸은 이 시스템의 독특한 접근 방식을 다음과 같이 설명합니다. “URDFormer는 인터넷에서 이미지를 스캔하여 예를 들어 주방 서랍과 캐비닛이 어떻게 움직일지에 대한 기존 모델과 페어링합니다. 그런 다음 초기 실제 이미지에서 시뮬레이션을 예측합니다.”
이 방법을 통해 연구자는 수백 개의 다양한 시뮬레이션 환경을 빠르게 생성할 수 있습니다. 이러한 시뮬레이션은 RialTo에서 만든 시뮬레이션만큼 정확하지는 않지만, 규모라는 중요한 이점을 제공합니다. 광범위한 시나리오에서 로봇을 훈련할 수 있는 능력은 다양한 실제 상황에 대한 적응력을 크게 향상시킬 수 있습니다.
첸은 특히 가정 환경에서 이 접근 방식의 중요성을 강조합니다. “가정은 독특하고 끊임없이 변화합니다. 다양한 사물, 작업, 평면도, 사람들이 그 안을 이동합니다. 이것이 AI가 로봇 공학자에게 정말 유용한 부분입니다.”
인터넷 이미지를 활용하여 이러한 시뮬레이션을 생성함으로써 URDFormer는 훈련 환경을 생성하는 데 필요한 비용과 시간을 획기적으로 줄입니다. 이를 통해 다양한 실제 환경에서 기능할 수 있는 로봇의 개발을 가속화할 수 있습니다.
로봇 훈련의 민주화
RialTo와 URDFormer의 도입은 로봇 훈련을 민주화하는 데 있어 중요한 도약을 나타냅니다. 이러한 시스템은 로봇을 실제 환경에 맞게 준비하는 데 드는 비용을 획기적으로 줄여 연구자, 개발자, 심지어 최종 사용자에게도 기술을 더 쉽게 접근할 수 있게 할 잠재력이 있습니다.
Gupta 박사는 이 기술의 민주화 잠재력을 강조합니다. “휴대폰으로 스캔하기만 하면 집에서 로봇을 작동시킬 수 있다면, 그것은 기술을 민주화하는 것입니다.” 이러한 접근성은 가정용 로봇의 개발과 채택을 가속화하여 가정용 로봇이 스마트폰만큼 흔한 미래에 더 가까이 다가갈 수 있습니다.
홈 로봇에 대한 의미는 특히 흥미롭습니다. 가정은 다양하고 끊임없이 변화하는 특성으로 인해 로봇에게 가장 어려운 환경 중 하나이기 때문에 이러한 새로운 훈련 방법은 게임 체인저가 될 수 있습니다. 로봇이 개별 가정 레이아웃과 일상에 대해 학습하고 적응할 수 있도록 함으로써 광범위한 작업을 수행할 수 있는 진정으로 도움이 되는 새로운 세대의 가정 조수를 볼 수 있습니다.
보완적 접근 방식: 사전 훈련 및 특정 배포
RialTo와 URDFormer는 로봇 훈련의 과제에 다른 각도에서 접근하지만, 서로 배타적이지는 않습니다. 사실, 이 시스템은 함께 작동하여 로봇에 대한 보다 포괄적인 훈련 체계를 제공할 수 있습니다.
“두 가지 접근 방식은 서로 보완할 수 있습니다.” Gupta 박사가 설명합니다. “URDFormer는 수백 가지 시나리오에 대한 사전 훈련에 정말 유용합니다. RialTo는 이미 로봇을 사전 훈련했고 이제 누군가의 집에 배치하여 95% 정도 성공하도록 하려는 경우에 특히 유용합니다.”
이 보완적 접근 방식은 2단계 훈련 프로세스를 허용합니다. 첫째, 로봇은 URDFormer의 빠르게 생성된 시뮬레이션을 사용하여 다양한 시나리오에 노출될 수 있습니다. 이 광범위한 노출은 로봇이 다양한 환경과 작업에 대한 일반적인 이해를 개발하는 데 도움이 됩니다. 그런 다음 특정 배포의 경우 RialTo를 사용하여 로봇이 작동할 정확한 환경에 대한 매우 정확한 시뮬레이션을 만들어 기술을 미세 조정할 수 있습니다.
앞으로 연구자들은 이러한 훈련 방법을 더욱 개선할 방법을 모색하고 있습니다. Gupta 박사는 미래 연구 방향을 언급합니다. “앞으로 RialTo 팀은 사람들의 집에 시스템을 배치하고 싶어합니다(대부분 실험실에서 테스트되었습니다).” 이 실제 테스트는 시스템을 개선하고 다양한 가정 환경에서 효과를 보장하는 데 중요할 것입니다.
도전과 미래 전망
유망한 발전에도 불구하고 로봇 훈련 분야에는 여전히 과제가 남아 있습니다. 연구자들이 씨름하는 핵심 문제 중 하나는 실제 세계와 시뮬레이션 데이터를 효과적으로 결합하는 방법입니다.
Gupta 박사는 이러한 과제를 인정합니다. “우리는 여전히 실제 세계에서 직접 수집한 데이터(비용이 많이 들지만)와 시뮬레이션에서 수집한 데이터(비용은 적게 들지만 약간 틀림)를 결합하는 가장 좋은 방법을 알아내야 합니다.” 목표는 시뮬레이션의 비용 효율성을 활용하면서 실제 세계 데이터가 제공하는 정확성을 유지하는 최적의 균형을 찾는 것입니다.
로봇 산업에 미치는 잠재적 영향은 상당합니다. 이러한 새로운 훈련 방법은 보다 유능하고 적응력이 뛰어난 로봇의 개발을 가속화하여 가정 지원부터 의료 및 그 이상의 분야에서 획기적인 진전을 이룰 수 있습니다.
게다가 이러한 훈련 방법이 더욱 정교해지고 접근 가능해짐에 따라 로봇 산업에서 변화를 볼 수 있습니다. 소규모 회사와 개인 개발자조차도 정교한 로봇을 훈련할 수 있는 도구를 갖게 되어 혁신적인 로봇 응용 분야의 붐을 일으킬 가능성이 있습니다.
미래의 전망은 흥미진진하며, 잠재적인 응용 분야는 현재의 사용 사례를 훨씬 넘어 확장됩니다. 로봇이 실제 환경을 탐색하고 상호 작용하는 데 더 능숙해짐에 따라, 우리는 로봇이 집, 사무실, 병원 및 공공 장소에서 점점 더 복잡한 작업을 수행하는 것을 볼 수 있습니다.
게시물 새로운 AI 시스템은 로봇의 실제 세계 공간 적응을 혁신합니다. 처음 등장 유나이트.AI.