구글 딥마인드, 로봇을 훈련시켜 탁구에서 인간을 이겼다

rhiannon williams

1년 ago

탁구 경기에서 로봇을 이길 수 있는 기회가 있다고 생각하시나요? Google DeepMind가 로봇을 훈련시켜 아마추어 수준의 경쟁적 성과로 게임을 하도록 했다고 회사가 발표했습니다. 로봇이 인간과 인간 수준에서 스포츠를 하도록 훈련된 것은 이번이 처음이라고 주장합니다.

연구자들은 3D로 인쇄된 패들을 휘두르는 로봇 팔을 만들어서 경쟁적인 탁구 경기에서 다양한 능력을 가진 인간 상대를 상대로 29게임 중 13게임을 이겼습니다. 이 연구는 아카이브 종이.

이 시스템은 완벽과는 거리가 멉니다. 탁구 봇은 마주친 초보자 레벨의 모든 인간 상대와 아마추어 레벨의 55%를 이길 수 있었지만, 고급 플레이어와의 모든 게임에서 졌습니다. 그래도 인상적인 발전입니다.

“몇 달 전만 해도 우리는 로봇이 이전에 한 번도 상대하지 않은 사람을 상대로 현실적으로 이길 수 없을 것이라고 예상했습니다. 이 시스템은 확실히 우리의 기대를 뛰어넘었습니다.” 프로젝트를 이끈 Google DeepMind의 선임 스태프 소프트웨어 엔지니어인 Pannag Sanketi의 말입니다. “로봇이 강력한 상대를 따돌린 방식은 정말 놀라웠습니다.”

그리고 연구는 그저 재미와 게임만은 아닙니다. 사실, 그것은 유용한 작업을 수행할 수 있는 로봇을 만드는 방향으로 나아가는 한 걸음을 나타냅니다. 실제 환경에서 능숙하고 안전하게 집이나 창고와 같은 로봇 커뮤니티의 오랜 목표뉴욕 대학교의 컴퓨터 과학 연구원인 레렐 핀토는 구글 딥마인드의 머신 학습 접근 방식은 해당 분야의 다른 많은 분야에도 적용 가능하다고 말했습니다. 그는 이 프로젝트에 참여하지 않았습니다.

“저는 로봇 시스템이 실제 인간과 함께 일하는 것을 보는 것을 매우 좋아하는데, 이것은 이것의 환상적인 예입니다.”라고 그는 말합니다. “강력한 플레이어는 아니지만, 개선을 계속하고 결국에는 거기에 도달할 수 있는 원재료가 있습니다.”

능숙한 탁구 선수가 되려면 인간은 뛰어난 손과 눈의 협응력, 빠르게 움직이고 상대방에 반응하여 빠른 결정을 내릴 수 있는 능력이 필요합니다. 이 모든 것이 로봇에게는 상당한 과제입니다. Google DeepMind의 연구자들은 두 가지 접근 방식을 사용하여 시스템이 이러한 능력을 모방하도록 훈련했습니다. 그들은 컴퓨터 시뮬레이션을 사용하여 시스템이 타격 기술을 마스터하도록 훈련한 다음 실제 데이터를 사용하여 미세 조정하여 시간이 지남에 따라 개선할 수 있도록 했습니다.

연구자들은 위치, 스핀, 속도에 대한 데이터를 포함하여 탁구공 상태의 데이터 세트를 편집했습니다. 이 시스템은 탁구 경기의 물리를 정확하게 반영하도록 설계된 시뮬레이션 환경에서 이 라이브러리에서 추출하여 서브 리턴, 포핸드 탑스핀 치기, 백핸드 샷과 같은 기술을 학습했습니다. 로봇의 한계로 인해 공을 서브할 수 없었기 때문에 실제 게임은 이를 수용하도록 수정되었습니다.

로봇은 인간과의 경기에서 자신의 기술을 다듬는 데 도움이 되는 성과 데이터를 수집합니다. 카메라 한 쌍으로 캡처한 데이터를 사용하여 공의 위치를 추적하고, 상대편 패들의 LED를 사용하는 모션 캡처 시스템을 통해 인간 상대편의 플레이 스타일을 따릅니다. 공 데이터는 훈련을 위해 시뮬레이션으로 다시 피드백되어 지속적인 피드백 루프를 생성합니다.

이 피드백을 통해 로봇은 새로운 기술을 시험해 상대를 이기려고 시도할 수 있습니다. 즉, 인간처럼 전략과 행동을 조정할 수 있다는 뜻입니다. 즉, 주어진 매치 내내, 그리고 더 많은 게임을 할수록 점점 더 나아진다는 뜻입니다.

이 시스템은 매우 빠르게, 시야 너머(테이블 위 6피트 이상) 또는 매우 낮게 공을 치는 경우, 패들을 손상시킬 수 있는 충돌을 피하도록 지시하는 프로토콜 때문에 공을 치는 데 어려움을 겪었습니다. 회전하는 공은 스핀을 직접 측정할 수 있는 용량이 부족해서 도전 과제였는데, 고급 플레이어들은 이 한계를 재빨리 이용했습니다.

로봇 회사 Mytra의 창립자이자 이전에 테슬라 로봇 팀의 책임자였으며 이 프로젝트에는 참여하지 않았던 크리스 월티는 시뮬레이션 환경에서 모든 상황에 대비해 로봇을 훈련하는 것은 정말 어려운 일이라고 말합니다.

“실제 세계를 시뮬레이션하는 것은 바람의 돌풍이나 먼지와 같은 변수가 너무 많기 때문에 매우 어렵습니다. [on the table]”라고 그는 말합니다. “매우 현실적인 시뮬레이션이 없다면 로봇의 성능은 한계에 도달할 것입니다.”

Google DeepMind에서는 이러한 한계가 공의 궤적을 예상하도록 설계된 예측 AI 모델을 개발하고 더 나은 충돌 감지 알고리즘을 도입하는 것을 포함하여 다양한 방법으로 해결될 수 있다고 생각합니다.

결정적으로, 인간 선수들은 로봇 팔과의 경기를 즐겼습니다. 로봇 팔을 이길 수 있었던 상급 경쟁자들조차도 그 경험이 재미있고 매력적이라고 말했고, 기술을 연마하는 데 도움이 되는 역동적인 연습 파트너로서 잠재력이 있다고 느꼈다고 말했습니다.

한 연구 참여자는 “저는 분명히 그것을 훈련 파트너로 갖고 싶고, 때때로 경기를 치를 수 있는 누군가를 갖고 싶습니다.”라고 말했습니다.

관련된 글: