Google DeepMind는 로봇 용 기기 Gemini AI 모델을 소개합니다

0
8
google-deepmind는-로봇-용-기기-gemini-ai-모델을-소개합니다
Google DeepMind는 로봇 용 기기 Gemini AI 모델을 소개합니다
Gemini Robotics Op-Device의 그래픽.

Gemini Robotics Op-Device는 강력한 로봇 모델을보다 접근 가능하고 적응할 수 있도록하기위한 것입니다. | 출처 : Google Deepmind

Google Deepmind 이번 주 Google Deepmind는 일반적인 목록과 빠른 작업 적응을위한 기기 Gemini Robotics 모델을 소개했습니다. DeepMind는이 비전 언어 행동 또는 VLA 모델은 Gemini 2.0의 멀티 모달 추론과 실제 이해를 물리적 세계에 가져올 것이라고 말했다.

Gemini Robotics Op-Device는 a 로봇 공학 기초 모델 두 무기 로봇의 경우 최소한의 계산 자원이 필요하도록 설계되었습니다. 모델은 로컬로 최적화되어 데이터 네트워크와 독립적으로 작동하기 때문에 DeepMind는 대기 시간에 민감한 응용 프로그램에 도움이된다고 말했다. 또한 간헐적이거나 연결성이없는 환경에서 견고성을 보장 할 수 있습니다.

Gemini Robotics Op-Device 외에도 심해 Gemini Robotics 소프트웨어 개발 키트를 소개했습니다.SDK). 개발자는이를 사용하여 작업 및 환경에 대한 VLA 모델을 평가하고 DeepMind ‘s에서 테스트 할 수 있습니다. 무자코 물리 시뮬레이터, 50 ~ 100 개의 데모로 새로운 도메인에 신속하게 조정하십시오. 개발자는 DeepMind의 신뢰할 수있는 테스터 프로그램에 가입하여 SDK에 액세스 할 수 있습니다.



Deepmind는 Gemini 2.0 모멘텀을 기반으로합니다

Deepmind 이후 몇 개월 밖에되지 않았습니다 소개 Gemini Robotics는 이미 작업 일반화 및 손재주 기능 기능을 기반으로하고 있습니다. Google 부대는 기기 모델은 다음과 같이 말했다.

  • 손재주 조작으로 빠른 실험을 위해 설계되었습니다
  • 성능을 향상시키기 위해 미세 조정을 통해 새로운 작업에 적응할 수 있습니다
  • 타락성이 낮은 추론으로 로컬로 실행하도록 최적화되었습니다

Gemini Robotics Op-Device는 광범위한 테스트 시나리오에서 강력한 시각적, 의미 및 행동 일반화를 달성한다고 회사는 주장했다. 이 플랫폼을 통해 로봇은 자연 언어 지침을 따르고 압축을 풀거나 접는 옷과 같은 고도로 손재주 작업을 완료 할 수 있습니다. DeepMind는 여전히 기기 제한없이 유사한 결과를 원하는 사람들에게 Gemini Robotics 모델을 제공 할 것입니다.

이 시스템은 상자에서 작동하는 작업에만 국한되지 않습니다. DeepMind는 개발자들이 모델을 조정하여 특정 응용 프로그램에 대한 더 나은 성능을 달성 할 수 있다고 말했다. 회사는 모델을 테스트했습니다 도시락을 지키고, 카드 그리기, 샐러드 드레싱을 쏟아 부는 등 다양한 수준의 난이도의 7 개의 손재주 조작 작업.

Deepmind는 Gemini를 더 많은 로봇 실시 예로 확장시킵니다

Deepmind는 기기 모델 만 훈련했습니다 알로하 로봇, 모델을 BI-Arm에 더욱 조정할 수있었습니다. 솔직한 FR3 로봇과 아폴로 휴머노이드 로봇 Apptronik.

FR3 로봇, Deepmind가 말했다 일체 포함 모델은 일반 목적 지시에 따랐습니다. 이전에 보이지 않는 물건과 장면을 처리하거나 드레스를 접거나 실행하는 등의 손재주 작업을 완료 할 수 있습니다. 산업용 벨트 조립 정밀성과 손재주가 필요한 작업.

아폴로 휴머노이드, 심해는 모델을 상당히 다른 실시 예에 적응시켰다. 동일한 일반 모델은 자연 언어 지침을 따르고 이전에 보이지 않는 물건을 포함한 다양한 물체를 일반적으로 조작 할 수 있다고 회사는 말했다.

Deepmind는 그것이 모든 모델을 그와 일치시키고 모든 모델을 개발하고 있다고 주장했다. AI 원칙 그리고 적용 a 전체 론적 안전 접근 시맨틱 및 물리적 안전에 걸쳐 있습니다. 실제로 이것은 캡처를 의미합니다 시맨틱 및 내용 안전을 사용합니다 라이브 API 저수준 안전 크리티컬 컨트롤러와 모델을 인터페이스하여 동작을 실행합니다.

회사는 추천합니다 최근에 개발 된 엔드 투 엔드 시스템 평가 시맨틱 안전 벤치 마크 모델의 안전 취약점을 노출시키기 위해 모든 수준에서 빨간 팀 연습을 수행합니다.

Deepmind는 그 덧붙였다 책임있는 개발 및 혁신 (REDI) 팀은 모든 Gemini Robotics 모델의 실제 영향을 계속 분석하고 조언하여 사회적 영향을 극대화하고 위험을 최소화하는 방법을 찾습니다. 그런 다음 책임 및 안전 협의회 (RSC)는 평가를 검토하여 혜택을 극대화하고 위험을 최소화하는 데 도움이되는 피드백을 제공합니다.

Gemini Robotics Op-Device의 사용 및 안전 프로파일에 대한 더 깊은 이해를 얻고 피드백을 수집하기 위해 회사는 처음에 일부 그룹으로 공개하고 있습니다. 신뢰할 수있는 테스터.

게시물 Google DeepMind는 로봇 용 기기 Gemini AI 모델을 소개합니다 먼저 나타났습니다 로봇 보고서.