nvidia Jensen Huang CEO는 회사의 AI 컴퓨팅 기능에서 일련의 획기적인 발전을 발표했습니다. GTC 2025 년 3 월 기조 연설그가 “1 조 달러의 컴퓨팅 변곡점”이라고 부르는 것을 설명합니다. 기조 연설은 생산 준비를 공개했다 블랙웰 GPU 아키텍처미래의 아키텍처를위한 다년간 로드맵, AI 네트워킹의 주요 혁신, 새로운 엔터프라이즈 AI 솔루션 및 로봇 공학 및 물리적 AI의 중요한 개발.
“토큰 경제”와 AI 공장
Huang의 비전의 중심은 AI의 기본 빌딩 블록으로서“토큰”이라는 개념이며 생성 컴퓨팅을 위해 설계된 전문 데이터 센터로서“AI 공장”의 출현입니다.
Huang은“이것은 지능이 만들어지는 새로운 종류의 토큰 생성기 인 AI의 빌딩 블록이 새로운 국경을 열었습니다. 그는 토큰이“이미지를 과학적 데이터 차트로 변환 할 수있는 외계인 분위기”,“물리 법칙을 해독”및“질병이 보류하기 전에 질병을 참조”할 수 있다고 강조했다.
이 비전은 전통적인 “검색 컴퓨팅”에서 “생성 컴퓨팅”으로 전환을 나타내며, 여기서 AI는 사전 저장된 데이터를 가져 오는 대신 컨텍스트를 이해하고 답을 생성합니다. Huang에 따르면,이 전환은 “컴퓨터가 파일 검색이 아니라 토큰의 생성기가 된 새로운 종류의 데이터 센터 아키텍처가 필요합니다.
Blackwell Architecture는 대규모 성능을 제공합니다
Nvidia Blackwell GPU 아키텍처는 현재“Full Production”에서 동일한 전력 조건 하에서 모델 추론 모델에 대한“40 배의 호퍼 성능”이라고 주장하는 것을 제공합니다. 이 아키텍처에는 FP4 정밀도에 대한 지원이 포함되어있어 에너지 효율이 크게 향상되었습니다.
Huang은“Iso Power, Blackwell은 25 배입니다.
Blackwell Architecture는 NVLink 72와 같은 기술을 통해 극도의 스케일 업을 지원하여 거대한 통합 GPU 시스템을 만들 수 있습니다. Huang은 Blackwell의 성능이 AI 워크로드를 요구하는 데 이전 세대 GPU가 크게 덜 바람직하게 만들 것이라고 예측했습니다.

(출처 : Nvidia)
AI 인프라를위한 예측 가능한 로드맵
NVIDIA는 AI 인프라 혁신에 대한 정기적 인 연간 케이던스를 설명하여 고객이 더 확실하게 투자를 계획 할 수 있도록했습니다.
- Blackwell Ultra (2025 년 후반) : 플롭, 메모리 및 대역폭이 증가한 블랙웰 플랫폼으로 업그레이드.
- 베라 루빈 (2026 년 후반) : 성능이 두 배의 CPU, 새로운 GPU 및 차세대 NVLink 및 메모리 기술을 갖춘 새로운 아키텍처.
- Rubin Ultra (2027 년 후반) : 랙 당 15 개의 엑사 플롭의 컴퓨팅을 목표로하는 극단적 인 스케일 업 아키텍처.
AI 민주화 : 네트워킹에서 모델로
NVIDIA는 광범위한 AI 채택의 비전을 실현하기 위해 네트워킹, 하드웨어 및 소프트웨어에 걸친 포괄적 인 솔루션을 발표했습니다. 인프라 수준 에서이 회사는 실리콘 광자 기술에 대한 상당한 투자를 통해 AI 공장의 수십만 또는 수백만 GPU를 연결 해야하는 과제를 해결하고 있습니다. MRM (Micro Ring Resonator Modulator) 기술을 기반으로 한 1.6 초당 CPO 인 1.6 Terabit CPO 인 CPO (Copackaged Optics) 실리콘 광학 시스템은 전통적인 트랜시버에 비해 상당한 전력 절약 및 밀도가 증가하여 다양한 사이트에 걸쳐 대량 GPU 간의보다 효율적인 연결을 가능하게합니다.
Nvidia는 대규모 AI 공장의 기초를 구축하는 동안 동시에 AI 컴퓨팅 파워를 개인과 소규모 팀에게 가져오고 있습니다. 회사는 새로운 라인을 소개했습니다 Grace Blackwell 플랫폼에 의해 구동되는 DGX 개인 AI 슈퍼 컴퓨터AI 개발자, 연구원 및 데이터 과학자에게 권한을 부여하는 것을 목표로했습니다. 라인업에는 소형 개발 플랫폼 인 DGX Spark 및 DGX 스테이션, 액체 냉각이있는 고성능 데스크톱 워크 스테이션 및 인상적인 20 개의 페타 플롭의 컴퓨팅이 포함됩니다.

NVIDIA DGX SPARK (출처 : NVIDIA)
Nvidia는 이러한 하드웨어 발전을 보완하여 Open을 발표했습니다 라마 네모트론 모델 제품군 추론 능력으로, 첨단 구축을위한 엔터프라이즈 준비가되도록 설계되었습니다. AI 요원. 이 모델은 NVIDIA NIM (NVIDIA 추론 마이크로 서비스)에 통합되어 개발자가 로컬 워크 스테이션에서 클라우드까지 다양한 플랫폼에 걸쳐 배치 할 수 있습니다. 이 방법은 Enterprise AI 채택을위한 전체 스택 솔루션을 나타냅니다.
Huang은 NVIDIA 모델, NIM 및 라이브러리를 AI 전략에 통합하는 여러 산업의 주요 회사와의 광범위한 협력을 통해 이러한 이니셔티브가 향상되고 있다고 강조했습니다. 이 생태계 접근 방식은 다양한 기업 요구 및 사용 사례에 대한 유연성을 제공하면서 채택을 가속화하는 것을 목표로합니다.
물리적 AI 및 로봇 공학 : $ 50 조 기회
Huang에 따르면 Nvidia는 물리적 AI와 로봇 공학을“5 조 5 천만 달러의 기회”로 본다. 이 회사는 오픈 소스 Nvidia Isaac GR00T N1을 발표했다.
NVIDIA COSMOS World Foundation 모델에 대한 상당한 업데이트는 NVIDIA OMNIVERE를 사용한 로봇 교육을위한 합성 데이터 생성에 대한 전례없는 제어를 제공합니다. Huang은 다음과 같이 설명했듯이“Omniverse를 사용하여 우주를 조정하고 우주를 사용하여 무한한 수의 환경을 생성함으로써 우리가 접지되고 제어되는 데이터를 만들 수 있지만 동시에 체계적으로 무한한 데이터를 만들 수 있습니다.”
이 회사는 또한 Google Deepmind 및 Disney Research와 공동으로 개발 된 “Newton”이라는 새로운 오픈 소스 물리 엔진을 공개했습니다. 이 엔진은 강성 및 부드러운 몸체, 촉각 피드백 및 GPU 가속도를 포함한 고 충실도 로봇 시뮬레이션을 위해 설계되었습니다.

ISAAC GR00T N1 (출처 : NVIDIA)
에이전트 AI 및 산업 혁신
Huang은“Agentic AI”를“대행사”를 사용하여 AI로 정의했습니다.“대행사”,“컨텍스트”,“이유”및“계획 및 행동”, 도구를 사용하고 멀티 모달 정보로부터 학습 할 수 있습니다.
“에이전트 AI는 기본적으로 기관이있는 AI가 있음을 의미합니다. 상황의 맥락을 인식하고 이해할 수 있습니다. 추론 할 수 있습니다. 매우 중요한 것은 문제를 해결하는 방법이나 문제를 해결하는 방법에 대해 추론 할 수 있으며 계획과 행동을 계획하고 행동 할 수 있습니다. 도구를 사용할 수 있습니다.
이 기능은 다음과 같은 계산 요구가 급증하고 있습니다.“계산 요구량의 양, AI의 스케일링 법률은 더 탄력적이고 실제로 과도한 가속화되었습니다.이 시점 에서이 시점에서 필요한 계산의 양은 작년에 우리가 필요하다고 생각했던 것보다 50 배나 더 쉽게 수백 배가 더 많습니다.
결론
Jensen Huang의 GTC 2025 Keynote는 지능형 에이전트, 자율 로봇 및 목적으로 지어진 AI 공장이 특징 인 AI 중심 미래에 대한 포괄적 인 비전을 제시했습니다. 하드웨어 아키텍처, 네트워킹, 소프트웨어 및 오픈 소스 모델에 대한 NVIDIA의 발표는 회사의 다음 컴퓨팅 시대를 전원과 가속화하려는 결정을 알 수 있습니다.
컴퓨팅이 검색 기반에서 생성 모델로의 전환을 계속함에 따라, NVIDIA는 AI의 핵심 통화로서의 토큰에 중점을두고 클라우드, 엔터프라이즈 및 로봇 공학 플랫폼의 스케일링 기능에 중점을 둔다.
게시물 검색을 넘어서 : 생성 컴퓨팅 시대를위한 NVIDIA 차트 과정 먼저 나타났습니다 Unite.ai.