오늘, 보스턴 다이내믹스 그리고 도요타 연구소(TRI) TRI의 대형 행동 모델을 활용한 범용 휴머노이드 로봇 개발을 가속화하기 위해 새로운 파트너십을 발표했습니다. 보스턴 다이내믹스의 아틀라스 로봇.” 범용 로봇을 만들기 위해 노력하는 것은 지금 이 파트너십이 다른 모든 상업용 휴머노이드 회사처럼 들릴 수도 있지만 여기서는 전혀 그렇지 않습니다. BD와 TRI는 어려운 문제에 초점을 맞춘 근본적인 로봇 공학 연구에 대해 이야기하고 있습니다. 가장 중요한 것은) 결과를 공유하는 것입니다.
여기서 더 넓은 맥락은 Boston Dynamics가 상대적으로 기본적이고 무차별적인 조작과 함께 발전하고 때로는 고통스러워 보이는 전신 동작 동작을 수행할 수 있는 예외적으로 유능한 휴머노이드 플랫폼을 보유하고 있다는 것입니다. 한편 TRI는 오랫동안 개발을 위해 노력해 왔습니다. AI 기반 학습 기술 다양하고 복잡한 조작 문제를 해결합니다. TRI는 그들이 부르는 것을 향해 노력하고 있습니다 대규모 행동 모델(LBM)물리적 세계에서 유용한 작업을 수행하는 로봇을 제외하면 LLM(대형 언어 모델)과 유사하다고 생각할 수 있습니다. 이 파트너십의 매력은 매우 분명합니다. Boston Dynamics는 Atlas를 위한 새로운 유용한 기능을 얻고, TRI는 Atlas가 새로운 유용한 기능을 탐색하도록 합니다.
다음은 좀 더 자세한 내용입니다. 보도 자료:
이 프로젝트는 각 파트너의 강점과 전문 지식을 동등하게 활용하도록 설계되었습니다. 새로운 전기 Atlas 로봇의 물리적 기능과 광범위한 전신 양손 조작 동작을 프로그래밍 방식으로 명령하고 원격 조작할 수 있는 기능을 통해 연구팀은 다양한 작업에 로봇을 배치하고 성능에 대한 데이터를 수집할 수 있습니다. 이 데이터는 엄격한 하드웨어와 시뮬레이션 평가를 활용하여 고급 LBM의 훈련을 지원하는 데 사용되어 사전 훈련된 대규모 모델이 새롭고 강력하고 민첩한 전신 기술을 신속하게 습득할 수 있음을 입증합니다.
합동팀은 또한 휴머노이드 로봇에 대한 기본적인 훈련 질문에 답하기 위한 연구, 전신 감지를 활용하는 연구 모델의 능력, 인간-로봇 상호 작용 및 이러한 새로운 기능을 지원하는 안전/보증 사례를 이해하는 연구를 수행할 것입니다.
자세한 내용은 담당자와 이야기를 나누었습니다. 스콧 쿤더스마 (Boston Dynamics의 로봇공학 연구 수석 이사) 및 러스 테드레이크 (TRI 로봇공학 연구 부사장).
이번 파트너십은 어떻게 이루어졌나요?
러스 테드레이크: 우리는 Boston Dynamics 팀과 그들이 하드웨어 측면뿐만 아니라 Atlas의 컨트롤러 측면에서 해온 일에 대해 깊은 존경심을 갖고 있습니다. 우리가 기계 학습 측면에서 점점 더 많은 작업을 진행함에 따라 그들은 기계 학습 노력을 늘려 왔습니다. TRI 측에서는 테이블 위에서 조작할 수 있는 작업의 한계를 확인하고 있으며 그 이상을 탐구하고 싶습니다.
스콧 쿤더스마: 지난 몇 년간 구축해 온 기계 학습 팀 외에도 TRI가 Boston Dynamics에서 보유하고 있는 기존 플랫폼 기능과 결합된 기술 및 도구를 통해 우리는 목표를 달성할 수 있는 정말 좋은 위치에 있게 되었습니다. Atlas를 사용하여 함께 실행하고 꽤 놀라운 작업을 수행해 보세요.
특히 현재 휴머노이드를 둘러싼 모든 광란의 맥락에서 당신의 작업을 전달하기 위해 당신의 접근 방식은 무엇입니까?
테드레이크: 지금 당장은 6개월마다 새롭고 놀라운 일을 해야 한다는 엄청난 압박감이 있습니다. 어떤 면에서는 그 분야에서 그만큼의 에너지와 열정, 야망을 갖는 것이 건강에 좋습니다. 그러나 나는 또한 무엇이 효과가 있고 무엇이 효과가 없는지를 이해하는 좀 더 길고 깊은 관점을 이해하기 위해 돌아오는 현장 사람들이 있다고 생각합니다. 그래서 우리는 그 균형을 맞춰야 합니다.
제가 말하고 싶은 또 다른 점은 거기에는 너무 많은 과대 광고가 있다는 것입니다. 나 ~이다 이 모든 새로운 기능의 가능성에 대해 엄청나게 기대됩니다. 저는 우리가 과학을 발전시키면서 과학이 얼마나 효과가 있는지 솔직하고 투명하게 밝히고 싶습니다.
쿤데르스마: 이것이 아마도 로봇 공학 역사상 가장 흥미로운 점 중 하나라는 사실은 우리 조직 모두에서 잊혀지지 않지만 여전히 해야 할 일이 엄청나게 많습니다.
귀하의 파트너십이 고유하게 해결할 수 있는 과제는 무엇입니까?
쿤데르스마: 우리 둘 다 정말 기대하는 것 중 하나는 휴머노이드에서 가능한 행동의 범위입니다. 휴머노이드 로봇은 이동식 베이스에 있는 한 쌍의 그리퍼 그 이상입니다. 저는 휴머노이드의 완전한 행동 능력 공간을 탐구할 수 있는 기회가 아마도 우리가 Boston Dynamics에서 수행한 역사적 작업으로 인해 지금 당장 할 수 있는 고유한 위치에 있는 것일 것이라고 생각합니다. Atlas는 신체적 능력이 매우 뛰어난 로봇으로, 지금까지 우리가 만든 인간형 로봇 중 가장 능력이 뛰어납니다. 그리고 우리가 보유한 플랫폼 소프트웨어를 사용하면 전신 조작을 위한 데이터 수집과 같은 작업을 세계 어느 곳에서나 쉽게 할 수 있습니다.
테드레이크: 내 생각에는 우리가 완전히 새로운 과학을 열었다고 생각합니다. 답이 필요한 일련의 새로운 기본 질문이 있습니다. 로봇 공학은 기본적으로 대규모 데이터 세트를 구축하고 이러한 근본적인 질문을 할 수 있는 위치에 있도록 모델을 훈련시키기 위해 대규모 팀, 대규모 예산, 강력한 협력자가 필요한 대규모 과학 시대에 들어왔습니다.
어떤 근본적인 질문이 있나요?
테드레이크: 휴머노이드를 위한 올바른 훈련 혼합물이 무엇인지에 대한 아이디어를 가진 사람은 아무도 없습니다. 예를 들어, 우리는 언어로 사전 훈련을 하고 싶습니다. 그게 훨씬 더 낫습니다. 하지만 비전을 얼마나 일찍 도입합니까? 얼마나 일찍 조치를 도입합니까? 아무도 모릅니다. 올바른 작업 커리큘럼은 무엇입니까? 우리는 상자에서 꺼내자마자 0보다 더 큰 성능을 얻을 수 있는 쉬운 작업을 원합니까? 아마. 우리는 정말 복잡한 작업도 원하나요? 아마. 우리는 집에만 있고 싶어? 그냥 공장에서요? 올바른 혼합물은 무엇입니까? 우리는 공중제비를 원하나요? 모르겠습니다. 우리는 그것을 알아내야 합니다.
인터넷에 로봇을 훈련시키기에 충분한 데이터가 있는지, 인터넷 데이터 세트의 기능을 어떻게 혼합하고 로봇 공학으로 전송할 수 있는지와 같은 더 많은 질문도 있습니다. 로봇 데이터는 다른 데이터와 근본적으로 다른가요? 동일한 확장 법칙을 기대해야 합니까? 동일한 장기적 역량을 기대해야 할까요?
전문가들이 이야기하는 또 다른 큰 문제는 평가인데, 이는 주요 병목 현상입니다. 놀라운 결과를 보여주는 일부 논문을 보면 결과 섹션의 통계적 강점이 매우 약하고 결과적으로 근거가 많지 않은 것에 대해 많은 주장을 하고 있습니다. 우리의 결과에 경험적 강점을 조심스럽게 구축하려면 많은 엔지니어링 작업이 필요할 것입니다. 평가가 충분히 주목을 받지 못하는 것 같아요.
작년에 로봇공학 연구에 어떤 변화가 있어서 당신이 달성하고자 하는 진전을 가능하게 했다고 생각하시나요?
쿤데르스마: 내 관점에서 볼 때, 이 분야의 일에 대한 내가 생각하는 방식을 변화시킨 두 가지 높은 수준의 것들이 있습니다. 하나는 시연을 통해 조작 기술을 훈련하기 위한 반복 가능한 프로세스를 중심으로 한 분야의 융합입니다. 확산정책의 선구적인 작업(TRI는 큰 부분을 차지했습니다)는 정말 강력한 기능입니다. 이전에는 기본적으로 헤아릴 수 없었던 조작 기술을 생성하는 프로세스를 거쳐 이를 대량의 데이터를 수집하는 방식으로 바꾸고, 현재로서는 다소 안정적인 아키텍처에서 이를 훈련시킵니다. 그리고 당신은 결과를 얻습니다.
두 번째는 AI의 로봇 공학 인접 영역에서 일어난 모든 일로, 데이터 규모와 다양성이 실제로 일반화 가능한 행동의 핵심임을 보여줍니다. 우리는 이것이 로봇 공학에도 해당될 것으로 기대합니다. 따라서 이 두 가지를 종합하면 진로가 매우 명확해집니다. 하지만 여전히 우리가 답해야 할 공개된 연구 과제와 질문이 엄청나게 많다고 생각합니다.
시뮬레이션이 로봇 공학의 데이터를 확장하는 효과적인 방법이라고 생각하십니까?
테드레이크: 일반적으로 사람들은 시뮬레이션을 과소평가한다고 생각합니다. 우리가 해왔던 작업을 통해 저는 시뮬레이션을 현명하게 사용하기만 한다면 시뮬레이션의 가능성에 대해 매우 낙관적으로 생각하게 되었습니다. 특정 작업을 수행하는 특정 로봇에 초점을 맞추는 것은 잘못된 질문을 하는 것입니다. 실제 세계의 작업 분포와 성과를 예측하려면 시뮬레이션에서 작업과 성과의 분포를 가져와야 합니다. 아직 잘 시뮬레이션하기 어려운 부분이 있지만 마찰 접촉 등의 부분에 있어서도 현재는 꽤 나아지고 있다고 생각합니다.
당신이 이야기할 수 있는 이 파트너십의 상업적 미래가 있습니까?
쿤데르스마: Boston Dynamics의 경우 분명히 이 작업에는 장기적인 상업적 가치가 있다고 생각하며 이것이 우리가 이 작업에 투자하려는 주요 이유 중 하나입니다. 하지만 이 협력의 목적은 실제로 근본적인 연구에 관한 것입니다. 즉, 우리가 작업을 수행하고, 과학을 발전시키고, 결과를 실제로 이해하고 신뢰하며 이를 전 세계에 전달할 수 있도록 충분히 엄격한 방식으로 수행하는지 확인하는 것입니다. . 그렇습니다. 우리는 이것이 상업적으로 엄청난 가치를 지닌다고 봅니다. 예, 우리는 Atlas를 상용화하고 있지만 이 프로젝트는 실제로 기초 연구에 관한 것입니다.
다음에는 어떻게 되나요?
테드레이크: BD가 해낸 일과 TRI가 해낸 일의 교차점에 우리가 시작하기 위해 함께 해야 할 질문이 있고, 그것이 일을 추진할 것입니다. 그리고 우리는 큰 야망을 갖고 있습니다. Atlas에서 실행되는 LBM(대형 행동 모델)이라고 부르는 일반 기능을 얻는 것이 목표입니다. 첫해에 우리는 이러한 근본적인 질문에 집중하고, 경계를 넓히고, 논문을 작성하고 출판하려고 노력하고 있습니다.
나는 사람들이 우리의 결과를 보고 흥미를 느끼기를 원하고, 사람들이 우리의 결과를 볼 때 신뢰를 갖기를 바랍니다. 저에게는 이것이 로봇 공학 커뮤니티에 대한 가장 중요한 메시지입니다. 이 파트너십을 통해 우리는 접근 방식에 있어 극도의 낙관주의와 비판적 태도의 균형을 맞추는 장기적인 관점을 취하려고 노력하고 있습니다.