로봇은 사람과는 매우 다르게 주변 세계를 인식합니다.
우리가 길을 걸을 때, 우리는 지나가는 차, 잠재적 위험, 길을 가로막는 장애물 등 주의해야 할 것과 멀리서 걷는 보행자처럼 주의해야 할 것을 알고 있습니다. 반면 로봇은 주변 환경에 대한 모든 정보를 동등하게 중요하게 여깁니다. 무인자동차예를 들어, 주변 사물에 대한 데이터를 관련성 여부와 관계없이 지속적으로 분석해야 합니다. 이를 통해 운전자와 보행자는 안전하게 보호되지만 많은 에너지와 컴퓨팅 파워가 소모됩니다. 로봇에게 무엇을 우선시해야 하고 무엇을 안전하게 무시할 수 있는지 가르쳐서 이를 줄일 수 있는 방법이 있다면 어떨까요?
이것이 네덜란드 에인트호번 공과대학의 교수인 르네 반 드 몰렌그라프트가 옹호하는 연구 분야인 “게으른 로봇”의 기본 원리입니다. 그는 모든 종류의 로봇에게 데이터를 “게으르게” 다루는 법을 가르치면 인간을 포함한 실제 환경에서 사물과 더 잘 상호 작용하는 기계의 길을 닦는 데 도움이 될 수 있다고 믿습니다. 본질적으로 로봇이 정보를 더 효율적으로 다룰수록 더 좋습니다.
반 드 몰렌그라프트의 게으른 로봇공학은 현재 연구자와 로봇 회사가 로봇이 작업을 성공적으로, 유연하게, 가능한 가장 효율적인 방식으로 완료하도록 훈련하는 데 사용하는 접근 방식 중 하나에 불과합니다.
수집한 데이터를 걸러내고 간과해도 안전한 모든 것을 우선 순위에서 제외하는 방식으로 더 똑똑해지도록 가르치면 그들이 더 안전하고 신뢰할 수 있게 되는 데 도움이 됩니다. 로봇 커뮤니티의 오랜 목표.
반 드 몰렌그라프트는 로봇이 더 널리 채택되려면 이런 식으로 작업을 단순화하는 것이 필요하다고 말한다. 왜냐하면 로봇의 현재 에너지 사용량은 확장되지 않을 것이기 때문이다. 엄청나게 비싸고 환경에 해로울 것이다. “제 생각에 최고의 로봇은 게으른 로봇입니다.” 그는 말한다. “그들은 우리처럼 기본적으로 게으르게 행동해야 합니다.”
게으른 사람이 되는 법을 배우다
반 드 몰렌그라프트는 이런 노력을 시험할 재미있는 방법을 생각해냈습니다. 로봇에게 축구를 가르치는 것입니다. 그는 최근 대학의 자율 로봇 축구팀인 Tech United를 이끌고 축구장에서 로봇의 기술을 시험하는 연례 국제 로봇 및 AI 대회인 RoboCup에서 우승했습니다. 축구는 로봇에게 힘든 도전입니다. 골을 넣고 막는 데 모두 빠르고 통제된 움직임, 전략적 의사 결정, 조정이 필요하기 때문입니다.
마치 최고의 인간 축구 선수들이 하듯이, 주변의 방해 요소를 무시하고 집중하는 법을 배우면, 에너지 효율성이 높아질 뿐만 아니라(특히 배터리로 구동되는 로봇의 경우) 역동적이고 빠르게 움직이는 상황에서 더 현명한 결정을 내릴 가능성이 높아집니다.
Tech United의 로봇은 RoboCup에서 상대방보다 우위를 점하기 위해 여러 가지 “게으른” 전략을 사용했습니다. 한 가지 접근 방식은 “세계 모델“축구 경기장의 레이아웃과 라인 표시를 식별하고 매핑하는 것, 즉 경기 내내 동일하게 유지되는 것입니다. 이를 통해 배터리 구동 로봇은 주변을 끊임없이 스캔하지 않아도 되며, 귀중한 전력을 낭비하지 않아도 됩니다. 각 로봇은 또한 카메라가 포착하는 내용을 4명의 팀원과 공유하여 경기장을 더 넓게 볼 수 있어 빠르게 움직이는 공을 추적하는 데 도움이 됩니다.
이전에는 로봇이 경기장을 돌아다니려면 정확하고 미리 코딩된 궤적이 필요했습니다. 이제 Van de Molengraft와 그의 팀은 로봇이 지정된 목적지로 가는 경로를 스스로 선택하도록 하는 실험을 하고 있습니다. 이를 통해 특정 여정을 추적하는 데 필요한 에너지를 절약하고 로봇이 도중에 마주칠 수 있는 장애물에 대처하는 데 도움이 됩니다.
그룹은 또한 로봇이 필드의 열린 구역을 향해 슛을 날리고 이를 받을 수 있는 팀원 중 가장 좋은 위치에 있는 멤버와 소통하는 “관통 패스” 실행 방법과 공을 받거나 패스하는 것과 같은 기술을 팀에 성공적으로 가르쳤습니다. 삼각형과 같은 구성. 로봇에게 주변 환경의 데이터를 사용하여 구축된 세계 모델에 대한 액세스 권한을 제공하면 로봇은 특정 지점만이 아니라 경기장 어디에서나 기술을 실행할 수 있습니다.
축구장 너머로
축구는 로봇 기술이 얼마나 성공적인지 시험할 수 있는 재미있는 방법이지만, 다른 연구자들도 효율성 문제를 연구하고 있으며 훨씬 더 큰 위험을 감수하고 있습니다.
창고에서 일하는 로봇이 다양한 데이터 입력의 우선순위를 더 잘 정하는 것은 예를 들어, 로봇이 인간 주변에서 안전하게 작동하고 작업을 완료하는 데 의존할 수 있도록 하는 데 필수적입니다. 테슬라의 로봇 사업부 전 책임자인 크리스 월티는 기계가 이를 관리할 수 없다면 회사는 배송이 지연되거나, 상품이 손상되거나, 사람이 다치거나, 더 나쁜 일이 발생할 수 있다고 말합니다.
월티는 로봇이 단순히 재료를 옮기는 것이 얼마나 어려운지 목격한 후 회사를 떠나 자신의 회사를 세웠습니다. 그의 스타트업인 Mytra는 컴퓨터 비전과 AI 강화 학습 시스템을 사용하여 가장 가까운 다른 로봇에 대한 인식을 제공하고, 훨씬 더 계산적으로 효율적인 방식으로 작업(예: 깨진 팔레트 옮기기)을 완료하기 위해 추론하고 협업할 수 있도록 돕는 완전 자율 기계를 설계합니다.
오늘날 창고에 있는 대부분의 모바일 로봇은 경로를 지시하는 단일 중앙 “두뇌”에 의해 제어되므로 로봇은 무엇이든 하기 전에 지시를 기다려야 합니다. 이 접근 방식은 확장하기 어려울 뿐만 아니라 중앙 컴퓨팅 전력을 많이 소모하고 매우 신뢰할 수 있는 통신 링크가 필요합니다.
Mytra는 개별 로봇이 창고 반대편에서 수백 개의 다른 로봇이 무엇을 하는지 알 필요가 없다는 것을 인정하는 훨씬 더 효율적인 접근 방식을 찾았다고 믿습니다. 머신 러닝 시스템은 이 불필요한 데이터와 이를 처리하는 데 필요한 컴퓨팅 파워를 줄여 각 로봇이 창고에서 작업을 수행하기 위해 취할 수 있는 최적의 경로를 시뮬레이션합니다. 이를 통해 로봇은 훨씬 더 자율적으로 행동할 수 있습니다.
“축구의 맥락에서 효율적이면 더 많은 골을 넣을 수 있습니다. 제조의 맥락에서 효율적이면 시스템이 더 안정적으로 작동하기 때문에 더욱 중요합니다.”라고 그는 말합니다. “로봇이 자율적이고 효율적으로 행동하고 생각할 수 있는 능력을 제공함으로써 더 광범위한 운영의 효율성과 안정성도 최적화하고 있습니다.”
로봇이 처리해야 하는 정보 유형을 단순화하는 것이 큰 과제이기는 하지만, 영국 허트퍼드셔 대학교의 교수이자 인공 시스템에서 생물학적 과정을 복제하는 것을 전문으로 하는 대니얼 폴라니는 혁신이 이루어지고 있다고 말합니다. 그는 또한 RoboCup 챌린지의 팬입니다. 사실, 그는 대학의 Bold Hearts 로봇 축구팀을 이끌고 있으며, 이 팀은 올해 RoboCup 휴머노이드 리그 2라운드에 진출했습니다.
“생물은 필요하지 않은 정보를 처리하지 않으려고 합니다. 그 처리가 대사 에너지 측면에서 매우 비용이 많이 들기 때문입니다.” 그는 말합니다. 폴라니는 생물학에서 얻은 교훈을 로봇이 정보를 더 효율적으로 사용할 수 있도록 하는 방대한 네트워크에 적용하는 데 관심이 있습니다. 로봇이 처리할 수 있는 정보의 양을 줄이면 주어진 작업의 특성에 따라 로봇이 더 약해질 뿐이라고 그는 말합니다. 대신, 로봇은 자신이 가진 데이터를 더 지능적인 방식으로 사용하는 법을 배워야 합니다.
소프트웨어 단순화
세계에서 가장 큰 규모인 75만 대 이상의 로봇을 보유한 Amazon은 AI를 사용하여 더 똑똑하고 안전하며 효율적인 결정을 내리는 데 관심이 있습니다. Amazon의 로봇은 대부분 재고를 옮기는 모바일 로봇과 물건을 다루도록 설계된 로봇 팔의 두 가지 범주로 나뉩니다. 이러한 기계에 동력을 제공하는 AI 시스템은 매일 수백만 개의 데이터 포인트를 수집하여 작업을 완료하도록 훈련합니다. 예를 들어, 어떤 품목을 잡고 더미에서 옮겨야 하는지 또는 인간 창고 근로자를 안전하게 피하는 방법을 학습해야 합니다. 이러한 프로세스에는 많은 컴퓨팅 파워가 필요하며, 새로운 기술은 이를 최소화하는 데 도움이 될 수 있습니다.
일반적으로 로봇 팔과 유사한 “조작” 로봇은 기계 학습을 사용하여 예를 들어 물체를 식별하는 방법을 알아냅니다. 그런 다음 하드코딩된 규칙이나 알고리즘을 따라 행동 방법을 결정합니다. 생성 AI를 사용하면 이러한 동일한 로봇이 시도하기도 전에 행동의 결과를 예측할 수 있으므로 성공할 가능성이 가장 높은 행동을 선택하거나 움직여야 하는 물체를 잡는 가장 좋은 접근 방식을 결정할 수 있습니다.
이러한 학습 시스템은 로봇을 훈련하는 기존 방법보다 훨씬 확장성이 뛰어나며, 생성 AI와 방대한 데이터 세트를 결합하면 작업 시퀀싱을 간소화하고 불필요한 분석 계층을 제거하는 데 도움이 됩니다. 바로 여기서 컴퓨팅 파워 절감이 이루어집니다. Amazon Robotics의 수석 과학자인 Michael Wolf는 “모델에 더 많은 작업을 요청하여 소프트웨어를 간소화할 수 있습니다.”라고 말합니다. “우리는 로봇 시스템의 자율성을 구축하는 방법을 근본적으로 재고하는 단계에 접어들고 있습니다.”
덜 함으로써 더 많은 것을 성취하다
올해의 RoboCup 대회는 끝났을지 모르지만, Van de Molengraft는 팀의 엄청난 성공에 안주하지 않습니다. 그는 “각 로봇에서 여전히 각 순간에 본질적으로 필요하지 않은 많은 계산 활동이 진행 중입니다.”라고 말합니다. 그는 내년에 경쟁자보다 우위를 점하기 위해 로봇 팀을 더욱 게으르게 만드는 새로운 방법에 대한 작업을 이미 시작했습니다.
현재 로봇은 아직 인간의 에너지 효율성에 근접하지도 못하지만, 그는 연구자들이 계속해서 진전을 이룰 것이고, 일을 더 잘하는 게으른 로봇이 훨씬 더 많아질 것이라고 낙관합니다. 하지만 하룻밤 사이에 일어나지는 않을 것입니다. 그는 “로봇의 인식과 이해를 높여서 축구든 기본적으로 인간이 만든 환경의 모든 분야에서든 로봇이 작업을 더 잘 수행할 수 있도록 하는 것은 지속적으로 진행 중인 작업입니다.”라고 말합니다.