Alex Yeh는 창립자이자 CEO입니다. GMI 클라우드는 누구나 쉽게 AI를 배포할 수 있도록 지원하고 통합 하드웨어 및 소프트웨어 솔루션을 통해 기업이 AI를 구축, 배포 및 확장하는 방법을 단순화한다는 사명을 가진 벤처 지원 디지털 인프라 회사입니다.
GMI Cloud를 시작하게 된 계기는 무엇이며, 귀하의 배경이 회사 구축에 대한 접근 방식에 어떤 영향을 미쳤습니까?
GMI Cloud는 2021년에 설립되었으며, 주로 처음 2년 동안 비트코인 컴퓨팅 노드를 제공하기 위한 데이터 센터 구축 및 운영에 중점을 두었습니다. 이 기간 동안 우리는 아칸소와 텍사스에 3개의 데이터 센터를 설립했습니다.
작년 6월, 우리는 GPU 컴퓨팅 성능에 대한 투자자와 고객의 높은 수요를 확인했습니다. 한 달도 안 되어 그는 AI 클라우드 인프라로 전환하기로 결정했습니다. AI의 급속한 발전과 AI가 가져오는 새로운 비즈니스 기회의 물결은 예측이 불가능하거나 설명하기 어렵습니다. 필수 인프라를 제공함으로써 GMI Cloud는 AI 분야에서 흥미롭고 종종 상상할 수 없는 기회와 긴밀하게 연계되는 것을 목표로 합니다.
GMI Cloud 이전에는 벤처 캐피탈 회사의 파트너로 일하면서 정기적으로 신흥 산업에 참여했습니다. 저는 인공지능을 21세기 최신 ‘골드러시’라고 봅니다. GPU와 AI 서버가 현대 ‘발굴자’의 ‘곡괭이’ 역할을 하여 GPU 컴퓨팅 파워 임대를 전문으로 하는 클라우드 기업의 급속한 성장을 촉진하는 것입니다.
AI 인프라를 단순화하려는 GMI Cloud의 사명과 이러한 초점이 오늘날 시장에서 그토록 중요한 이유에 대해 말씀해 주시겠습니까?
현재 AI 스택의 복잡성과 단편화로 인해 AI 인프라 단순화는 필수적입니다. 이로 인해 AI의 잠재력을 활용하려는 기업의 접근성과 효율성이 제한될 수 있습니다. 오늘날의 AI 설정에는 데이터 전처리 및 모델 교육부터 배포 및 확장에 이르기까지 서로 연결되지 않은 여러 계층이 포함되는 경우가 많으며, 이를 효과적으로 관리하려면 상당한 시간, 전문 기술 및 리소스가 필요합니다. 많은 기업이 AI 인프라의 가장 적합한 계층을 식별하는 데 몇 주, 심지어 몇 달을 소비합니다. 이 프로세스는 몇 주 또는 몇 달까지 확장되어 사용자 경험과 생산성에 영향을 미칠 수 있습니다.
- 배포 가속화: 단순화된 인프라를 통해 AI 솔루션의 보다 빠른 개발 및 배포가 가능해 기업이 경쟁력을 유지하고 변화하는 시장 요구에 적응할 수 있도록 돕습니다.
- 비용 절감 및 자원 절감: 전문 하드웨어 및 맞춤형 통합의 필요성을 최소화함으로써 간소화된 AI 스택은 비용을 크게 절감할 수 있으며, 특히 소규모 기업의 경우 AI에 대한 접근성을 더욱 높일 수 있습니다.
- 확장성 활성화: 잘 통합된 인프라를 통해 효율적인 리소스 관리가 가능합니다. 이는 수요 증가에 따라 애플리케이션을 확장하는 데 필수적이며 AI 솔루션이 더 큰 규모에서도 강력하고 반응성을 유지하도록 보장합니다.
- 접근성 개선: 인프라가 단순화되면 광범위한 기술 전문 지식 없이도 더 다양한 조직에서 AI를 더 쉽게 도입할 수 있습니다. 이러한 AI의 민주화는 더 많은 산업 분야에서 혁신을 촉진하고 가치를 창출합니다.
- 신속한 혁신 지원: AI 기술이 발전함에 따라 인프라가 덜 복잡해지면서 새로운 도구, 모델, 방법을 더 쉽게 통합할 수 있어 조직이 민첩성을 유지하고 빠르게 혁신할 수 있습니다.
AI 인프라를 단순화하려는 GMI Cloud의 사명은 기업과 스타트업이 AI의 이점을 완전히 실현하고 모든 규모의 조직에서 AI에 액세스할 수 있고, 비용 효율적이며, 확장 가능하도록 지원하는 데 필수적입니다.
최근 확보한 시리즈 A 펀딩에서 8,200만 달러. 이 새로운 자본은 어떻게 사용될 것이며, 즉각적인 확장 목표는 무엇입니까?
GMI Cloud는 자금을 활용하여 콜로라도에 새로운 데이터 센터를 개설하고 H200 GPU에 주로 투자하여 추가 대규모 GPU 클러스터를 구축할 예정입니다. GMI Cloud는 또한 고급 하드웨어와 원활하게 통합되는 자체 클라우드 기반 리소스 관리 플랫폼인 Cluster Engine을 적극적으로 개발하고 있습니다. 이 플랫폼은 가상화, 컨테이너화 및 오케스트레이션 분야에서 탁월한 기능을 제공합니다.
GMI Cloud는 경쟁사에 비해 2배 빠른 속도로 GPU 액세스를 제공합니다. 어떤 독특한 접근 방식이나 기술이 이를 가능하게 합니까?
GMI Cloud의 고유한 접근 방식의 핵심 측면은 GMI Cloud에 GPU 및 기타 최첨단 리소스에 대한 우선 액세스를 제공하는 NVIDIA의 NCP를 활용하는 것입니다. 강력한 금융 옵션과 결합된 제조업체의 직접 조달은 비용 효율성과 매우 안전한 공급망을 보장합니다.
전 세계 5개 위치에서 사용할 수 있는 NVIDIA H100 GPU를 통해 이 인프라는 미국과 아시아에서 AI 고객의 요구 사항을 어떻게 지원합니까?
GMI Cloud는 전 세계 IDC(인터넷 데이터 센터) 네트워크를 통해 대만, 미국, 태국을 비롯한 여러 국가와 지역에 서비스를 제공하는 글로벌 입지를 전략적으로 구축했습니다. 현재 GMI Cloud는 수천 개의 NVIDIA Hopper 기반 GPU 카드를 운영하고 있으며 향후 6개월 동안 리소스를 늘릴 계획으로 급속한 확장 궤도에 있습니다. 이러한 지리적 분포를 통해 GMI Cloud는 다양한 지역의 클라이언트에게 원활하고 지연 시간이 짧은 서비스를 제공하여 데이터 전송 효율성을 최적화하고 전 세계적으로 AI 운영을 확장하는 기업에 강력한 인프라 지원을 제공할 수 있습니다.
또한 GMI Cloud의 글로벌 역량을 통해 지역 전반에 걸쳐 다양한 시장 수요와 규제 요구 사항을 이해하고 충족할 수 있으며 각 지역의 고유한 요구 사항에 맞는 맞춤형 솔루션을 제공할 수 있습니다. 컴퓨팅 리소스 풀이 증가함에 따라 GMI Cloud는 AI 컴퓨팅 성능에 대한 증가하는 수요를 해결하고 광범위한 AI 프로젝트에 대한 모델 훈련을 가속화하고 정확도를 향상하며 모델 성능을 향상시킬 수 있는 충분한 컴퓨팅 용량을 고객에게 제공합니다.
AI 기반 클라우드 서비스의 리더로서 GMI의 기술을 발전시키기 위해 어떤 트렌드나 고객 요구에 중점을 두고 있습니까?
GPU에서 애플리케이션에 이르기까지 GMI Cloud는 고객을 위한 지능형 혁신을 주도하여 AI 기술 개발 요구 사항을 충족합니다.
하드웨어 아키텍처:
- 물리적 클러스터 아키텍처: 1250 H100과 같은 인스턴스에는 고성능 컴퓨팅 성능을 제공하는 서버 및 네트워크 장비의 최적화된 구성을 갖춘 GPU 랙, 리프 랙 및 스파인 랙이 포함됩니다.
- 네트워크 토폴로지 구조: 효율적인 IB 패브릭과 이더넷 패브릭으로 설계되어 원활한 데이터 전송 및 통신을 보장합니다.
소프트웨어 및 서비스:
- 클러스터 엔진: 자체 개발 엔진을 활용해 베어메탈, 쿠버네티스/컨테이너, HPC Slurm 등의 리소스를 관리함으로써 사용자와 관리자를 위한 최적의 리소스 할당이 가능합니다.
- 독점 클라우드 플랫폼: CLUSTER ENGINE은 자원 스케줄링을 최적화하여 유연하고 효율적인 클러스터 관리 솔루션을 제공하는 독자적인 클라우드 관리 시스템입니다.
추론 엔진 로드맵 추가:
- 지속적인 컴퓨팅으로 높은 SLA를 보장합니다.
- 부분적인 시간 사용을 위한 시간 공유.
- 스팟 인스턴스
컨설팅 및 맞춤형 서비스: 컨설팅, 데이터 보고, 컨테이너화, 모델 학습 추천, 맞춤형 MLOps 플랫폼 등 맞춤형 서비스를 제공합니다.
강력한 보안 및 모니터링 기능: 역할 기반 액세스 제어(RBAC), 사용자 그룹 관리, 실시간 모니터링, 기록 추적 및 경고 알림이 포함됩니다.
향후 몇 년간 AI 인프라의 가장 큰 과제와 기회는 무엇이라고 생각하시나요?
도전과제:
- 확장성 및 비용: 모델이 더욱 복잡해짐에 따라 확장성과 경제성을 유지하는 것이 특히 소규모 기업의 경우 어려운 과제가 됩니다.
- 에너지와 지속 가능성: AI 도입이 급증하면서 에너지 소비가 많아 친환경 솔루션이 더욱 요구되고 있습니다.
- 보안 및 개인정보 보호: 공유 인프라의 데이터 보호에는 진화하는 보안과 규정 준수가 필요합니다.
- 상호 운용성: AI 스택의 단편화된 도구는 원활한 배포 및 통합을 복잡하게 만듭니다. 사실상 모든 AI 배포도 복잡해집니다. 이제 개발 시간을 2배 단축하고 AI 프로젝트 인력을 3배 줄일 수 있습니다.
기회:
- 엣지 AI 성장: 데이터 소스에 더 가까운 AI 처리를 통해 지연 시간을 줄이고 대역폭을 절약합니다.
- 자동화된 MLOps: 간소화된 운영으로 배포의 복잡성이 줄어들어 기업은 애플리케이션에 집중할 수 있습니다.
- 에너지 효율적인 하드웨어: 혁신을 통해 접근성을 높이고 환경에 미치는 영향을 줄일 수 있습니다.
- 하이브리드 클라우드: 클라우드와 온프레미스 환경을 넘나들며 운영되는 인프라는 기업의 유연성에 매우 적합합니다.
- AI 기반 관리: AI를 사용하여 인프라를 자율적으로 최적화하면 가동 중지 시간이 줄어들고 효율성이 향상됩니다.
GMI Cloud에 대한 장기 비전에 대한 통찰력을 공유할 수 있습니까? AI와 AGI의 진화에서 그것이 어떤 역할을 한다고 보시나요?
나는 인터넷의 AI를 만들고 싶다. 저는 전 세계의 미래를 뒷받침할 인프라를 구축하고 싶습니다.
Squarespace 또는 Wix와 유사하지만 AI를 위한 접근 가능한 플랫폼을 만드는 것입니다. 누구나 자신의 AI 애플리케이션을 구축할 수 있어야 합니다.
앞으로 더 많은 산업이 이러한 기술을 통합하여 창의성을 향상시키고 프로세스를 자동화하며 의사결정을 최적화함에 따라 AI는 특히 생성적 AI 사용 사례에서 상당한 성장을 보일 것입니다. 추론은 복잡한 작업을 효율적이고 대규모로 처리할 수 있는 실시간 AI 애플리케이션을 가능하게 함으로써 미래에 중심적인 역할을 하게 될 것입니다. B2B(Business-to-Business) 사용 사례가 지배적일 것으로 예상되며 기업은 AI를 활용하여 생산성을 높이고 운영을 간소화하며 새로운 가치를 창출하는 데 점점 더 집중하고 있습니다. GMI Cloud의 장기 비전은 이러한 추세에 맞춰 기업이 조직 전체에서 AI의 생산성과 영향을 극대화할 수 있도록 지원하는 신뢰할 수 있는 고급 인프라를 제공하는 것을 목표로 합니다.
콜로라도의 새로운 데이터 센터로 운영을 확장하면서 내년에 달성하고자 하는 전략적 목표 또는 이정표는 무엇입니까?
콜로라도의 새로운 데이터 센터로 운영을 확장하면서 우리는 내년에 대한 몇 가지 전략적 목표와 이정표에 중점을 두고 있습니다. 미국은 AI 및 AI 컴퓨팅 분야에서 가장 큰 시장이기 때문에 우리가 이 지역에서 강력한 입지를 구축하는 것이 필수적입니다. 콜로라도의 전략적 위치는 강력한 기술 생태계 및 유리한 비즈니스 환경과 결합되어 증가하는 고객 기반에 더 나은 서비스를 제공하고 서비스 제공을 향상시킬 수 있는 위치에 있습니다.
첨단 AI 인프라를 도입하려는 기업이나 스타트업에게 어떤 조언을 해주고 싶나요?
AI 기반 혁신에 초점을 맞춘 스타트업의 경우 인프라 관리에 소중한 시간을 낭비하지 않고 제품을 구축하고 개선하는 데 우선순위를 두어야 합니다. 신뢰할 수 있고 확장 가능한 GPU 솔루션을 제공하는 신뢰할 수 있는 기술 제공업체와 협력하고, 화이트 라벨이 붙은 대안을 사용하는 제공업체를 피하세요. 안정성과 신속한 배포가 중요합니다. 초기 단계에서 속도는 스타트업이 기존 플레이어와 경쟁할 수 있는 유일한 경쟁력인 경우가 많습니다. 성장을 지원하고 민첩성을 희생하지 않고도 보안과 규정 준수에 집중할 수 있는 클라우드 기반의 유연한 옵션을 선택하세요. 이를 통해 스타트업은 원활하게 통합하고 빠르게 반복하며 리소스를 진정으로 중요한 일에 집중하여 시장에서 뛰어난 제품을 제공할 수 있습니다.
훌륭한 인터뷰에 감사드립니다. 더 자세히 알고 싶은 독자들은 방문하시기 바랍니다. GMI 클라우드,
게시물 Alex Yeh, GMI Cloud 창립자 겸 CEO – 인터뷰 시리즈 처음 등장한 Unite.AI.