우리는 언제 로봇 공학의 chatgpt를 얻을 수 있습니까? 구체화 된 AI의 미래는 밝습니다

Date:

Google의 RT-X는 다양한 유형의 로봇을 제어하고 복잡한 작업에 대한 기본 추론을 수행 할 수있는 구체화 된 AI 또는 일반 목적 로봇 모델의 예입니다.

Google의 RT-X는 다양한 유형의 로봇을 제어하고 복잡한 작업에 대한 기본 추론을 수행 할 수있는 일반 목적 로봇 모델의 예입니다. 출처 : Google Deepmind

생성 AI의 성공으로 인해 대형 언어 모델에서 발견되는 유연한 지능을 물리적 세계로 가져올 수있는 잠재력에 대한 많은 논의가있었습니다. 이것을 종종“구체화 된 AI”라고하며, 세계 경제에서 가장 심오한 혁신적인 기회 중 하나입니다.

나는 구체화 된 AI의 미래가 밝다 고 주장하고 싶지만, 앞으로 나아가는 경로는 순수한 디지털 영역에서 AI의 경로보다 훨씬 간단하다. “로봇 공학을위한 chatgpt”로가는 길에는 많은 스피드 볼프가 있으며 아이디어가 현실이 되려면 새로운 혁신이 필요합니다. 이것은 스타트 업 설립자와 투자자에게 영향을 미치며, 몇 가지 권장 사항으로 증류하려고 시도 할 것입니다.

더 많은 로봇 자동화는 불가피하며 모든 불확실성은 다음과 같은 문제에 있습니다. 어떻게아니다 만약에. 그 이후로 인수 2012 년 Kiva Systems, 아마존 창고에 750,000 개 이상의 로봇을 배치했습니다. 스타트 업 그리고 투자자들은 로봇 능력과 시장 요구 사이의 이러한 수준의 정렬을 달성 할 수있는 다음 응용 프로그램을 삼각화하려고 시도하고 있습니다.

의 궤도 일체 포함 이 삼각 측량 프로세스의 핵심 변수이며 강력한 새로운 모델은 절대적인 게임 체인저가 될 수 있습니다. 그렇다면 우리는이 모델의 개발에서 어디에 서 있습니까? 나는이 질문을 더 잘 이해하기 위해 숙련 된 로봇과 로봇 파운데이션 모델을 개발하는 사람들과 이야기했습니다.


2025 Robotics Summit Registration의 사이트 광고.당신이 놓치지 않도록 지금 등록하십시오!


구체화 된 ai를 향해 한 단계 씩 한 단계

최첨단 구체화 된 AI 연구의 목적은 전용 교육없이 새롭거나 역동적 인 사용 사례를 처리 할 수있을 정도로 유연한 작업이 아닌 일반적인 목적 인 로봇 인텔리전스를 만드는 것입니다. 일반 목적 로봇 파운데이션 모델의 약속은 두 가지입니다.

첫째, 로봇 공학이 해결할 수있는 사용 사례의 수를 극적으로 확장 할 것입니다. 둘째, 그들은 로봇 시스템의 역사적으로 오랜 상업화 타임 라인을 단축시킬 것입니다.

이 두 가지 약속은 GPT-4, Gemini, Claude 및 Llama와 같은 기초 모델에 의해 순수한 디지털 영역에서 이루어지고 있습니다. 이 모델은 수많은 새로운 사용 사례의 문을 열면서 소규모 단일 목적 AI 모델을 빠른 트랙에 노후화에 넣었습니다. 전자는 후자와 동일한 작업을 수행하면서 맞춤형 모델 교육을 수행하는 데 필요한 엔지니어링 투자를 제거 할 수 있기 때문입니다.

범용 모델은 AI에 거의 모든 것을 구축하는 사실상의 방법이되었습니다. 새로운 Chatgpt와 같은 모델이 로봇 공학 응용 프로그램 개발을 지배하게 될 것이라고 추측 할 수 있습니다.

그러나 나는 이것이 단기적으로는 그런 경우라고 생각하지 않습니다. 대신, 내 기대는 생성 AI 기술이 밤새 풍경을 재구성하는 대신 로봇 공학을 점차적으로 주입 할 것이며, 그들은 한동안 고전적인 로봇 공학과 공존 할 것입니다.

로봇 공학은 헤드 라인을 잡지 못하더라도 생성 AI 기술 덕분에 꾸준히 발전해 왔습니다. 오늘날 스타트 업 빌딩은 이미보다 유연하고 일반화 된 지능과 더 빠른 시장에 대한 약속을 약속하는 기술을 사용하고 있습니다. 그들은 단일“세계 모델”에 응용 프로그램의 기초에 의존하지 않습니다.

예를 들어, 확산 정책 정책은 AI 이미지 생성기를 뒷받침하는 동일한 기술인 확산 모델을 활용하여 로봇 동작을 생성합니다. 결과 모델은 매우 유연하며 교육 데이터가 적지 만 현재는 일반적으로 작업별로 여전히 교육을받습니다. 또 다른 유망한 생성 AI 기술은 NERF (Neural Radiance Fields)로, 2D 이미지에서 3D 장면을 재구성하고 새로운 훈련 데이터 생성과 같은 로봇 공학의 응용 프로그램을 가질 수 있습니다.

범용 모델은 로봇 공학 개발의 기초가 될 가능성이 있으며,이 접근 방식의 약속은 다음과 같은 연구 모델에 의해 강조되었습니다. GoogleRT-X 및 물리적 지능‘에스0.

이 모델의 중요한 증거 점은 이들이 부품의 합보다 더 큰 것으로 입증되었다는 것입니다. 많은 작업의 교육이 포함되면 모델은 해당 작업에 대해서만 교육을받은 것보다 개별 작업에서 더 잘 수행됩니다.

그러나이 접근법은 데이터, 결정론 및 계산과 관련된 채택으로가는 길에 속도를 향상시킵니다. 이 카테고리의 모델이 생산 준비가되기 전에 더 많은 혁신이 필요합니다.

파운데이션 모델로 3 개의 스피드 홀

첫 번째 SpeedBump는 기존의 기초 모델을 가능하게하는 웹 스케일 텍스트, 이미지 및 오디오 데이터의 풍부함과 달리 물리적 세계와 상호 작용하는 것에 대한 기초 모델을 훈련시키기위한 데이터의 코퍼스가없는 것처럼 보입니다. 인식 모델이 매우 강력 해졌지만 인식을 작동시키는 것은 어렵습니다.

진정한 기초 모델에 필요한 규모를 달성하기 위해서는 상당한 투자가 더 많은 데이터를 수집하기위한 메커니즘과 다양한 유형의 교육 데이터의 효과를 이해하기위한 실험에 들어가야한다고 생각합니다. 예를 들어, 작업을 수행하는 인간의 비디오가 모델 성능에 기여할 수있는 정도는 확실하지 않습니다. 나는 독창성과 투자의 조합으로 강력한 대규모 교육 데이터를 조립할 수 있다고 생각합니다.

사전 훈련이 심각한 강력한 모델이 향후 몇 년 안에 등장 할 것이지만, 특정 작업에서 추가 보충 교육 데이터가 필요할 것입니다. 이것은 대형 언어 모델의 미세 조정과 유사하지만 로봇 모델과 함께 “상자 밖으로”작동하기 때문에 더 필수적입니다.

두 번째 SpeedBump는 결정론 및 신뢰성과 관련이 있습니다. 로봇 공학 이외의 경우, 결정론의 중요성은 적용에 따라 크게 다르며, 가장 성공적인 초기 생성 AI 응용은 결정론이 중요하지 않은 곳입니다. 로봇 공학에서는 결정론이 중요합니다. 안전을 제외하고, 로봇 공학의 ROI (Return on Investment)는 일반적으로 처리량에 달려 있으며 오류 해상도에 소비 된 시간은 처리량을 파괴합니다.

지금까지 로봇 공학 재단 모델에 대한 연구는 신뢰성이 아니라 참신함을 강조했습니다. 생성 AI 모델의 비 결정을 완화하는 방법에 대한 상당한 노력이 있으며,이 문제는 해결 될 수 있다고 생각하지만 아마도 한 번의 무너지는 것은 아니라고 생각합니다. 이것은 결정 론적 및 비 결정적 모델의 공존에 대한 주장이다.

유연성의 신뢰성을 균형을 유지하기 위해 포트폴리오 회사 Micropsi Industries세계 최대의 일부 제조업체의 고분율 작업을 자동화합니다. 용도 확률 적보다는 결정 론적 인 신경망.

로봇 공학 재단 모델의 세 번째 스피드 덤프 (Speedbump)는 로봇 공학에서 컴퓨팅이 종종 가장자리에서 수행되어야한다는 것입니다. 로봇은 비용 효율적이어야하며 오늘날 많은 응용 프로그램은 가장 강력한 모델에 대한 추론을 실행하기에 충분한 GPU를 추가하는 데 드는 비용을 지원하지 않습니다.

이 문제는 잠재적으로 내가 언급 한 세 가지 중에서 가장 다루기 쉬운 일입니다. 로봇 공학 주의자들은 대형 모델을 출발점으로 취하고 증류 기술을 사용하여 리소스 요구 사항이 적은 작고 집중된 모델을 생성 할 것으로 예상됩니다. 그러나 이것은 반드시 모델의 일반성을 줄이며 무엇이든 할 수있는 로봇의 아이디어와 상반됩니다.

우리의 포트폴리오 회사 RGO 로봇 공학 용품 인식 엔진은 광범위한 범위입니다 모바일 로봇 OEM, 그리고이 로봇 제조업체 기반에서 더 작고 저렴한 모델이 비용에 민감한 사용 사례에서 계속 인기를 얻을 것으로 기대합니다. 하드웨어는 가격/성능이 지속적으로 향상되고 있으므로 Edge에서 실용적으로 진행되는 것은 진화합니다.

양자화와 같은 기술은 또한 대형 모델의 크기를 효과적으로 줄일 수있게합니다. 하이브리드 접근 방식도 가능하며, 일부 컴퓨팅은 클라우드 및 일부 기기에서 수행됩니다.

Genai에 대한 권장 사항, 구체화 된 AI 시대

세상은 점점 더 디지털화되고 있지만, 우리는 여전히 물리적 세계에 살고 있으며, 디지털의 상호 작용은 물리적 인 성장 범위를 가지고 있습니다.

관찰자들은 종종 AI가 에세이 나 음악을 쓸 수있는 이유를 묻지 만 식기 세척기로드와 같은 정신적 인 일을하지는 않습니다. 후자는 단기적으로는 실현 가능할 것이지만, 또한 수조 달러의 산업의 물리적 프로세스에 대해 같은 질문을하고있다. 이것은 구체화 된 AI를 세계 경제에서 가장 심오한 기회 중 하나로 만듭니다.

로봇 공학은 엄청난 진전을 이루고 있으며, 나는 이전에 존재하지 않았던 산업에서 로봇이 중요한 인 에이 블러가되고있는 반면, 설립 된 로봇 시장은 새로운 구체화 된 AI 혁신의 혜택을 받고 있습니다. 생성 AI는 로봇 공학을위한 경로의 변형 요소가 될 것이지만, 현재의 결론은 로봇 회사가 구축되는 방식을 근본적으로 변화시키는 하룻밤 사이의 교대보다는 점진적인 프로세스가 될 것입니다.

동시에, 혁신가들이 내가 설명한 도전을 극복 할 수있는 능력을 과소 평가하는 것은 어리석은 일이지만, 획기적인시기가 언제 일어날 지 예측하기는 매우 어렵습니다. 결과적으로 오늘날 로봇 회사를 시작하는 기업가에 대한 권장 사항은 다음과 같습니다.

  1. 고 부가가치 응용 프로그램에 집중하고 한 접근 방식에 결혼하지 않고 해당 응용 프로그램을 해결하는 가장 좋은 방법을 결정하십시오. 세부 사항의 악마는 로봇 공학 솔루션의 경제적 생존력을 죽이는 것이기 때문에 응용 프로그램의 모든 뉘앙스를 아십시오.
  2. 새로운 생성 AI 기술이 이전에 해결할 수없는 문제를 해결할 수있는 위치를 평가하십시오. 생성 AI를 그 자체로 솔루션이 아닌 도구로보십시오.
  3. 대부분의 엔지니어링 시간은 새로운 기능이 아니라 견고성과 강화에 전념 할 것으로 기대합니다.
  4. 가장 성공적인 로봇 회사의 플레이 북을 연구하고 에뮬레이션해야 할 측면을 확인하십시오. 나는 가치 제안, 제품 개발 또는 마켓 전략과 관련하여 성공적인 로봇 회사의 레시피가 근본적으로 변화했다고 생각하지 않습니다.

새로운 로봇 스타트 업을 진행하거나 생성 AI를 물리적 세계 자동화에 적용하는 데 혁신하는 경우, 여러분의 의견을 듣고 싶습니다.

James Falkoff, Converge VC저자에 대해

제임스 포크 오프 파트너입니다 모이다보스턴과 실리콘 밸리에 본사를 둔 벤처 캐피탈 회사는 지능형 자동화와 물리적 및 디지털 세계의 교차점에 중점을 두었습니다. 그는 19 년 동안 기술 산업의 투자자였습니다.

게시물 우리는 언제 로봇 공학의 chatgpt를 얻을 수 있습니까? 구체화 된 AI의 미래는 밝습니다 먼저 나타났습니다 로봇 보고서.

Share post:

Subscribe

Popular

More like this
Related

메타 AI의 MILS : 제로 샷 멀티 모달 AI의 게임 체인저

몇 년 동안 인공 지능 (AI) 인상적인 발전을 이루었지만,...

4 Microsoft AI의 실제 비즈니스 혜택

AI 변환이 번개 속도로 움직이고 있다는 데는 의문의 여지가...

AI 기반 디지털 스레드로 제조의 미래를 잠금 해제합니다

대형 전자 제조업체의 품질 관리 관리자라고 상상해보십시오....

공개 Manus AI : 완전히 자율적 인 AI 요원에서의 중국의 획기적인

먼지가 정착하기 시작하는 것처럼 Deepseek중국 스타트 업의 또 다른...