NVIDIA AI Foundry가 기업에서 맞춤형 생성 AI 모델을 구축할 수 있도록 하는 방법

kari briski

1년 ago

AI의 힘을 활용하고자 하는 기업에는 특정 산업 요구 사항에 맞는 맞춤형 모델이 필요합니다.

엔비디아 AI 파운드리 기업이 데이터, 가속 컴퓨팅 및 소프트웨어 도구를 사용하여 자사의 생성적 AI 이니셔티브를 엄청나게 강화할 수 있는 맞춤형 모델을 만들고 배포할 수 있도록 해주는 서비스입니다.

TSMC가 다른 회사가 설계한 칩을 제조하는 것처럼 NVIDIA AI Foundry는 다른 회사가 개발하고 사용할 수 있는 인프라와 도구를 제공합니다. AI 모델 사용자 정의 — DGX Cloud, 기반 모델, NVIDIA NeMo 소프트웨어, NVIDIA 전문 지식, 그리고 생태계 도구와 지원을 활용합니다.

주요 차이점은 제품입니다. TSMC는 물리적 반도체 칩을 생산하는 반면 NVIDIA AI Foundry는 맞춤형 모델을 만드는 데 도움을 줍니다. 둘 다 혁신을 가능하게 하고 방대한 도구 및 파트너 생태계에 연결합니다.

기업은 AI Foundry를 사용하여 새로운 NVIDIA 및 개방형 커뮤니티 모델을 사용자 정의할 수 있습니다. 라마 3.1 수집뿐만 아니라 엔비디아 네모트론Google DeepMind의 CodeGemma, CodeLlama, Google DeepMind의 Gemma, Mistral, Mixtral, Phi-3, StarCoder2 및 기타.

산업 선구자들이 AI 혁신을 주도합니다

업계 리더 암닥스Capital One, Getty Images, KT, 현대자동차, SAP, ServiceNow, Snowflake는 NVIDIA AI Foundry를 사용하는 최초의 기업입니다. 이러한 선구자들은 엔터프라이즈 소프트웨어, 기술, 커뮤니케이션 및 미디어 분야에서 AI 기반 혁신의 새로운 시대를 위한 무대를 마련하고 있습니다.

ServiceNow의 AI 제품 부사장인 Jeremy Barnes는 “AI를 배포하는 조직은 산업 및 비즈니스 지식을 통합하는 맞춤형 모델을 통해 경쟁 우위를 확보할 수 있습니다.”라고 말했습니다. “ServiceNow는 NVIDIA AI Foundry를 사용하여 고객의 기존 워크플로에 쉽게 통합할 수 있는 모델을 미세 조정하고 배포합니다.”

NVIDIA AI Foundry의 기둥

NVIDIA AI Foundry는 기반 모델, 엔터프라이즈 소프트웨어, 가속 컴퓨팅, 전문가 지원 및 광범위한 파트너 생태계라는 핵심 요소로 뒷받침됩니다.

해당 소프트웨어에는 NVIDIA 및 AI 커뮤니티의 AI 기반 모델과 완전한 엔비디아 네모 신속한 모델 개발을 위한 소프트웨어 플랫폼.

NVIDIA AI Foundry의 컴퓨팅 능력은 NVIDIA DGX 클라우드세계 최고의 퍼블릭 클라우드인 Amazon Web Services, Google Cloud 및 Oracle Cloud Infrastructure와 공동으로 엔지니어링한 가속화된 컴퓨팅 리소스 네트워크입니다. DGX Cloud를 통해 AI Foundry 고객은 전례 없는 용이성과 효율성으로 맞춤형 생성 AI 애플리케이션을 개발하고 미세 조정할 수 있으며, 하드웨어에 대한 상당한 사전 투자 없이 필요에 따라 AI 이니셔티브를 확장할 수 있습니다. 이러한 유연성은 빠르게 변화하는 시장에서 민첩성을 유지하려는 기업에 매우 중요합니다.

NVIDIA AI Foundry 고객이 도움이 필요한 경우 NVIDIA AI Enterprise 전문가가 도와드립니다. NVIDIA 전문가는 고객이 독점 데이터로 모델을 빌드, 미세 조정 및 배포하는 데 필요한 각 단계를 안내하여 모델이 비즈니스 요구 사항과 긴밀하게 일치하도록 보장합니다.

NVIDIA AI Foundry 고객은 전체 범위의 지원을 제공할 수 있는 글로벌 파트너 생태계에 액세스할 수 있습니다. Accenture, Deloitte, Infosys 및 Wipro는 AI 기반 디지털 변환 프로젝트의 설계, 구현 및 관리를 포함하는 AI Foundry 컨설팅 서비스를 제공하는 NVIDIA 파트너 중 일부입니다. 액센추어 Accenture AI Refinery 프레임워크를 기반으로 맞춤형 모델 개발을 위한 자체 AI Foundry 제품을 최초로 출시했습니다.

또한, Data Monsters, Quantiphi, Slalom, SoftServe와 같은 서비스 제공 파트너는 기업이 AI를 기존 IT 환경에 통합하는 과정에서 발생하는 복잡성을 해결하고, AI 애플리케이션이 확장 가능하고 안전하며 비즈니스 목표에 부합하도록 보장하는 데 도움을 줍니다.

고객은 Cleanlab, DataDog, Dataiku, Dataloop, DataRobot, Domino Data Lab을 포함한 NVIDIA 파트너의 AIOps 및 MLOps 플랫폼을 사용하여 프로덕션용 NVIDIA AI Foundry 모델을 개발할 수 있습니다. 피들러 AINew Relic, 규모와 가중치 및 편향.

고객은 AI Foundry 모델을 다음과 같이 출력할 수 있습니다. 엔비디아 NIM 사용자 정의 모델, 최적화된 엔진 및 표준 API를 포함하는 추론 마이크로서비스를 선호하는 가속 인프라에서 실행합니다.

다음과 같은 추론 솔루션 엔비디아 텐서RT-LLM Llama 3.1 모델에 대한 향상된 효율성을 제공하여 대기 시간을 최소화하고 처리량을 극대화합니다. 이를 통해 기업은 프로덕션에서 모델을 실행하는 총 비용을 줄이면서 토큰을 더 빠르게 생성할 수 있습니다. 엔터프라이즈급 지원 및 보안은 다음에서 제공됩니다. 엔비디아 AI 엔터프라이즈 소프트웨어 모음.

NVIDIA NIM과 TensorRT-LLM은 Llama 3.1 모델의 추론 지연 시간을 최소화하고 처리량을 극대화하여 토큰을 더 빠르게 생성합니다.

광범위한 배포 옵션은 다음과 같습니다. NVIDIA 인증 시스템 Cisco, Dell Technologies, Hewlett Packard Enterprise, Lenovo, Supermicro를 비롯한 글로벌 서버 제조 파트너와 Amazon Web Services, Google Cloud, Oracle Cloud Infrastructure의 클라우드 인스턴스를 통해 제공됩니다.

또한, 함께 AI선도적인 AI 가속 클라우드인 는 오늘 10만 명이 넘는 개발자와 기업으로 구성된 생태계가 NVIDIA GPU 가속 추론 스택을 사용하여 DGX Cloud에서 Llama 3.1 엔드포인트와 기타 개방형 모델을 배포할 수 있도록 지원하겠다고 발표했습니다.

Together AI의 설립자 겸 CEO인 비풀 베드 프라카시는 “생성적 AI 애플리케이션을 운영하는 모든 기업은 더 빠른 사용자 경험과 더 높은 효율성, 더 낮은 비용을 원합니다.”라고 말했습니다. “이제 Together Inference Engine을 사용하는 개발자와 기업은 NVIDIA DGX Cloud에서 성능, 확장성 및 보안을 극대화할 수 있습니다.”

NVIDIA NeMo는 사용자 정의 모델 개발을 가속화하고 간소화합니다.

와 함께 엔비디아 네모 AI Foundry에 통합된 개발자는 데이터를 정리하고, 기초 모델을 사용자 지정하고, 성과를 평가하는 데 필요한 도구를 손끝에서 사용할 수 있습니다. NeMo 기술에는 다음이 포함됩니다.

NeMo 큐레이터 사전 학습 및 미세 조정을 위해 대규모 고품질 데이터 세트를 준비하여 생성적 AI 모델 성능을 개선하는 GPU 가속 데이터 큐레이션 라이브러리입니다.
NeMo 커스터마이저 도메인별 사용 사례에 맞게 LLM의 미세 조정과 정렬을 간소화하는 고성능, 확장 가능한 마이크로서비스입니다.
NeMo 평가자 가속화된 클라우드나 데이터 센터에서 학술적, 맞춤형 벤치마크를 통해 생성 AI 모델을 자동으로 평가합니다.
네모 가드레일 대규모 언어 모델을 사용하는 스마트 애플리케이션에서 정확성, 적절성 및 보안을 지원하여 대화 관리를 조율하고 생성형 AI 애플리케이션에 대한 보호 장치를 제공합니다.

NVIDIA AI Foundry의 NeMo 플랫폼을 사용하면 기업은 필요에 맞게 정확하게 맞춤화된 맞춤형 AI 모델을 만들 수 있습니다. 이러한 맞춤화를 통해 전략적 목표와의 더 나은 일치, 의사 결정의 정확성 향상 및 향상된 운영 효율성이 가능합니다. 예를 들어, 기업은 업계별 전문 용어를 이해하고, 규제 요구 사항을 준수하며, 기존 워크플로와 원활하게 통합되는 모델을 개발할 수 있습니다.

SAP의 최고 AI 책임자인 Philipp Herzig는 “파트너십의 다음 단계로 SAP는 NVIDIA의 NeMo 플랫폼을 사용하여 기업이 SAP Business AI를 기반으로 하는 AI 기반 생산성을 가속화하도록 지원할 계획입니다.”라고 말했습니다.

기업은 다음을 사용하여 맞춤형 AI 모델을 프로덕션에 배포할 수 있습니다. NVIDIA NeMo 리트리버 NIM 추론 마이크로서비스. 이는 개발자가 독점 데이터를 가져와 AI 애플리케이션에 대한 지식이 풍부한 응답을 생성하는 데 도움이 됩니다. 검색 증강 생성 (조각).

Snowflake의 AI 책임자인 Baris Gultekin은 “안전하고 신뢰할 수 있는 AI는 생성적 AI를 활용하는 기업에 있어서 협상할 수 없는 요소이며, 검색 정확도는 RAG 시스템에서 생성된 응답의 관련성과 품질에 직접적인 영향을 미칩니다.”라고 말했습니다. “Snowflake Cortex AI는 NVIDIA AI Foundry의 구성 요소인 NeMo Retriever를 활용하여 기업에 사용자 지정 데이터를 사용하여 쉽고 효율적이며 신뢰할 수 있는 답변을 제공합니다.”

맞춤형 모델은 경쟁 우위를 확보합니다

NVIDIA AI Foundry의 주요 장점 중 하나는 기업이 AI를 도입하는 데 직면한 고유한 과제를 해결할 수 있는 능력입니다. 일반적인 AI 모델은 특정 비즈니스 요구 사항과 데이터 보안 요구 사항을 충족하지 못할 수 있습니다. 반면, 맞춤형 AI 모델은 뛰어난 유연성, 적응성 및 성능을 제공하여 경쟁 우위를 확보하려는 기업에 이상적입니다.

자세히 알아보세요 엔비디아 AI 파운드리 기업의 생산성과 혁신을 촉진합니다.

산업 선구자들이 AI 혁신을 주도합니다

NVIDIA AI Foundry의 기둥

NVIDIA NeMo는 사용자 정의 모델 개발을 가속화하고 간소화합니다.

맞춤형 모델은 경쟁 우위를 확보합니다

관련된 글: