대규모로 창의성 발휘: Azure AI Foundry의 다중 모드 혁명

ceprodblogsupp

1일 ago

스타트업이든 글로벌 기업이든 관계없이 모든 개발자가 텍스트, 이미지, 오디오, 비디오 등 AI의 전체 스펙트럼을 활용할 수 있는 플랫폼을 상상해 보세요. 이번 OpenAI DevDay, Azure AI 파운드리 그 비전을 현실로 만들고 있습니다. 오늘 OpenAI GPT-image-1-mini, GPT-realtime-mini 및 GPT-audio-mini 출시와 GPT-5의 주요 안전 업그레이드를 통해 이제 그 어느 때보다 빠르고 저렴하게 다중 모드 솔루션을 생성, 실험 및 확장할 수 있는 최고의 툴킷을 갖게 되었습니다. 오늘 OpenAI가 발표한 모델이 이제 Azure AI Foundry에서 출시될 예정이라는 소식을 공유하게 되어 기쁩니다.대부분의 고객은 2025년 10월 7일에 시작할 수 있습니다.

지금 Azure AI Foundry를 사용해 보세요

오늘의 발표는 우리가 지난주에 발표한 주요 혁신과 결합됩니다. Microsoft Agent Framework 출시 (현재 미리보기 중), 비공개 미리보기의 Foundry Agent Service의 다중 에이전트 워크플로, 통합된 관측 가능성Voice Live API 일반 가용성 및 새로운 Responsible AI 기능을 제공합니다. Microsoft 에이전트 프레임워크(GitHub)는 다중 에이전트 시스템의 오케스트레이션을 단순화하도록 설계된 상용급 오픈 소스 SDK 및 런타임입니다. 이는 Semantic Kernel의 비즈니스 지원 기반을 AutoGen의 다중 에이전트 기능과 통합하여 개발자에게 빠르고 자신감 있게 지능적이고 확장 가능한 에이전트 솔루션을 구축할 수 있는 도구를 제공합니다.

최신 OpenAI 모델로 Azure AI Foundry를 확장하고 에이전트 AI 프레임워크를 발전시킴으로써 고객에게 탁월한 선택, 유연성 및 비즈니스 기능을 제공하여 개발자가 복잡한 비즈니스 요구 사항을 해결하고 대규모 혁신을 주도하는 지능형 에이전트 시스템을 구축할 수 있도록 지원합니다.

새로운 모델을 만나보세요: 개발자를 위해 제작되었으며 무엇이든 가능합니다.

GPT-image-1-mini: 시각적 창의성을 위한 컴팩트한 성능

GPT-image-1-mini는 신속하고 리소스 효율적인 대규모 이미지 생성이 필요한 조직 및 개발자를 위해 특별히 제작되었습니다. 컴팩트한 아키텍처를 통해 더 적은 계산 리소스를 소비하면서 고품질의 텍스트-이미지 및 이미지-이미지 생성이 가능하므로 팀은 제한된 설정에서도 멀티모달 AI를 배포할 수 있습니다. Image-1 모델을 기반으로 구축된 강력한 아키텍처는 이미 Azure AI Foundry에서 다중 모드 AI를 활용하고 있는 조직의 일관성과 채택 용이성을 최적화합니다.

무엇이 특별할까요?

유연한 이미지 생성: 고품질 배포 텍스트를 이미지로 그리고 이미지 대 이미지 예산을 초과하지 않고 기능을 제공합니다.
매우 빠른 추론: 기존 Azure AI Foundry 워크플로와 원활하게 통합되어 실시간으로 이미지를 생성합니다.

사용 사례:

교실 및 온라인 학습을 위한 교육 자료를 생성합니다.
스토리북과 시각적 내러티브를 디자인합니다.
신속한 프로토타이핑 및 개발을 위한 게임 자산을 제작합니다.
앱과 웹사이트의 UI 디자인 워크플로를 가속화합니다.

표 1: Azure AI Foundry의 GPT-image-1-mini 가격 및 배포(1m 토큰당)*

GPT-realtime-mini 및 GPT-audio-mini: 효율적이고 저렴한 음성 솔루션

두 가지 새로운 미니 모델은 품질 저하 없이 빠르고 비용 효율적인 다중 모드 AI가 필요한 조직과 개발자를 위해 설계되었습니다. 이러한 모델은 가볍고 고도로 최적화되어 최소한의 리소스 요구 사항으로 실시간 음성 상호 작용 및 오디오 생성을 제공합니다. 간소화된 아키텍처를 통해 신속한 추론과 낮은 대기 시간이 가능하므로 음성 기반 챗봇, 실시간 번역, 동적 오디오 콘텐츠 생성 등 속도와 응답성이 중요한 시나리오에 이상적입니다. 더 적은 컴퓨팅 리소스를 소비함으로써 이러한 모델은 기업과 개발자 팀이 운영 비용을 절감하는 동시에 다양한 애플리케이션에서 다중 모드 기능을 확장하는 데 도움이 됩니다.

무엇이 그들을 특별하게 만드는가?

실시간 응답성: 거의 0에 가까운 대기 시간으로 챗봇, 도우미, 번역 도구를 강화하세요.
자원 조명: 최소한의 인프라에서 고급 음성 및 오디오 모델을 실행하세요.
합리적인 규모의 확장: 다중 모드 기능을 확장하는 동시에 운영 비용을 절감하십시오.

사용 사례:

고객 서비스 및 지원을 위한 음성 기반 챗봇입니다.
글로벌 커뮤니케이션을 위한 실시간 번역입니다.
미디어 및 엔터테인먼트를 위한 동적 오디오 콘텐츠 제작.
기업 및 소비자 애플리케이션을 위한 대화형 음성 도우미입니다.

Azure AI Foundry의 GPT‑realtime‑mini를 통해 고객은 대기 시간이 짧고 지침 준수가 향상되며 비용 효율성이 높은 음성 솔루션을 구축할 수 있습니다. 고객이 중요하게 생각하는 기능은 처리 시간 단축, 대화 원활화, 가치 실현 시간 단축입니다.

Andy O’Dower, Twilio 제품 담당 부사장

표 2: Azure AI Foundry의 GPT-realtime-mini 및 GPT-audio-mini 가격 및 배포(1m 토큰당)*

GPT-5-채팅-최신: 안전과 웰빙을 위한 기준 높이기

Azure AI Foundry의 최신 GPT-5-chat-최신 업데이트는 민감한 대화 중에 사용자를 더 잘 보호하도록 설계된 보다 강력한 안전 가드레일 세트를 도입합니다. 향상된 감지 및 대응 기능을 통해 GPT-5-chat-latest는 이제 정신적 또는 정서적 고통으로 이어질 수 있는 대화를 보다 효과적으로 인식하고 관리할 수 있습니다. 이러한 개선 사항은 책임감 있는 AI에 대한 우리의 지속적인 노력을 반영하여 모든 상호 작용이 지능적이고 도움이 될 뿐만 아니라 어려운 순간에 사용자에게 안전하고 지원이 되도록 보장합니다.

표 3: GPT-5-chat-Azure AI Foundry의 최신 가격 및 배포(1백만 토큰당)*

GPT-5-pro: 추론과 분석의 정점

GPT-5-pro는 Azure AI Foundry 생태계 내 고급 추론 및 분석의 정점을 나타내며 연구 수준의 인텔리전스를 제공합니다. Foundry를 통해 배포할 경우 GPT-5-pro의 토너먼트 스타일 아키텍처는 여러 추론 경로를 활용하여 최대의 정확성과 신뢰성을 보장하므로 복잡한 분석, 코드 생성 및 의사 결정 워크플로에 이상적입니다. Azure AI Foundry를 통해 조직은 GPT-5-pro의 잠재력을 최대한 활용하여 더 현명한 결정을 내리고 가장 중요한 비즈니스 프로세스 전반에서 안전하고 안정적으로 혁신을 가속화합니다.

표 4: Azure AI Foundry의 GPT-5-pro 가격 및 배포(1백만 토큰당)*

개발자의 장점: 더욱 빠르게 구축하고, 실험하고, 출시하세요

이러한 새 모델을 통해 Azure AI Foundry는 단지 따라잡는 데 그치지 않고 속도를 설정하고 있습니다. 이제 개발자는 텍스트를 넘어 이미지 및 오디오 생성, 편집 및 이해를 활용할 수 있습니다. 결과는? 교육, 게임부터 기업 자동화까지 모든 산업에서 혁신을 주도하는 더욱 풍부하고 스마트한 워크플로우입니다.

미리보기: Sora 2 — 차세대 비디오 및 오디오

그리고 앞으로 더 많은 일이 있을 것입니다. Azure AI Foundry의 Sora 2가 곧 출시되어 단일 API에서 고급 비디오 및 오디오 생성 기능을 제공합니다. Azure AI Foundry를 통해 개발자가 사용할 수 있는 물리학 기반 애니메이션, 동기화된 대화 및 카메오 기능을 상상해 보세요. 몰입감 있고 생성적인 경험의 차세대 물결을 계속 지켜봐 주시기 바랍니다.

몰입형 다중 모드 경험의 차세대 물결을 창조할 준비가 되셨습니까? Azure AI 파운드리 모든 가능성을 위한 플랫폼입니다.

*가격은 2025년 10월 기준으로 정확합니다.

게시물 대규모로 창의성 발휘: Azure AI Foundry의 다중 모드 혁명 처음 등장한 Microsoft AI 블로그.