스타트업이든 글로벌 기업이든 관계없이 모든 개발자가 텍스트, 이미지, 오디오, 비디오 등 AI의 전체 스펙트럼을 활용할 수 있는 플랫폼을 상상해 보세요. 이번 OpenAI DevDay, Azure AI 파운드리 그 비전을 현실로 만들고 있습니다. 오늘 OpenAI GPT-image-1-mini, GPT-realtime-mini 및 GPT-audio-mini 출시와 GPT-5의 주요 안전 업그레이드를 통해 이제 그 어느 때보다 빠르고 저렴하게 다중 모드 솔루션을 생성, 실험 및 확장할 수 있는 최고의 툴킷을 갖게 되었습니다. 오늘 OpenAI가 발표한 모델이 이제 Azure AI Foundry에서 출시될 예정이라는 소식을 공유하게 되어 기쁩니다.대부분의 고객은 2025년 10월 7일에 시작할 수 있습니다.
오늘의 발표는 우리가 지난주에 발표한 주요 혁신과 결합됩니다. Microsoft Agent Framework 출시 (현재 미리보기 중), 비공개 미리보기의 Foundry Agent Service의 다중 에이전트 워크플로, 통합된 관측 가능성Voice Live API 일반 가용성 및 새로운 Responsible AI 기능을 제공합니다. Microsoft 에이전트 프레임워크(GitHub)는 다중 에이전트 시스템의 오케스트레이션을 단순화하도록 설계된 상용급 오픈 소스 SDK 및 런타임입니다. 이는 Semantic Kernel의 비즈니스 지원 기반을 AutoGen의 다중 에이전트 기능과 통합하여 개발자에게 빠르고 자신감 있게 지능적이고 확장 가능한 에이전트 솔루션을 구축할 수 있는 도구를 제공합니다.
최신 OpenAI 모델로 Azure AI Foundry를 확장하고 에이전트 AI 프레임워크를 발전시킴으로써 고객에게 탁월한 선택, 유연성 및 비즈니스 기능을 제공하여 개발자가 복잡한 비즈니스 요구 사항을 해결하고 대규모 혁신을 주도하는 지능형 에이전트 시스템을 구축할 수 있도록 지원합니다.
새로운 모델을 만나보세요: 개발자를 위해 제작되었으며 무엇이든 가능합니다.
GPT-image-1-mini: 시각적 창의성을 위한 컴팩트한 성능
GPT-image-1-mini는 신속하고 리소스 효율적인 대규모 이미지 생성이 필요한 조직 및 개발자를 위해 특별히 제작되었습니다. 컴팩트한 아키텍처를 통해 더 적은 계산 리소스를 소비하면서 고품질의 텍스트-이미지 및 이미지-이미지 생성이 가능하므로 팀은 제한된 설정에서도 멀티모달 AI를 배포할 수 있습니다. Image-1 모델을 기반으로 구축된 강력한 아키텍처는 이미 Azure AI Foundry에서 다중 모드 AI를 활용하고 있는 조직의 일관성과 채택 용이성을 최적화합니다.
무엇이 특별할까요?
- 유연한 이미지 생성: 고품질 배포 텍스트를 이미지로 그리고 이미지 대 이미지 예산을 초과하지 않고 기능을 제공합니다.
- 매우 빠른 추론: 기존 Azure AI Foundry 워크플로와 원활하게 통합되어 실시간으로 이미지를 생성합니다.
사용 사례:
- 교실 및 온라인 학습을 위한 교육 자료를 생성합니다.
- 스토리북과 시각적 내러티브를 디자인합니다.
- 신속한 프로토타이핑 및 개발을 위한 게임 자산을 제작합니다.
- 앱과 웹사이트의 UI 디자인 워크플로를 가속화합니다.
표 1: Azure AI Foundry의 GPT-image-1-mini 가격 및 배포(1m 토큰당)*
GPT-realtime-mini 및 GPT-audio-mini: 효율적이고 저렴한 음성 솔루션
두 가지 새로운 미니 모델은 품질 저하 없이 빠르고 비용 효율적인 다중 모드 AI가 필요한 조직과 개발자를 위해 설계되었습니다. 이러한 모델은 가볍고 고도로 최적화되어 최소한의 리소스 요구 사항으로 실시간 음성 상호 작용 및 오디오 생성을 제공합니다. 간소화된 아키텍처를 통해 신속한 추론과 낮은 대기 시간이 가능하므로 음성 기반 챗봇, 실시간 번역, 동적 오디오 콘텐츠 생성 등 속도와 응답성이 중요한 시나리오에 이상적입니다. 더 적은 컴퓨팅 리소스를 소비함으로써 이러한 모델은 기업과 개발자 팀이 운영 비용을 절감하는 동시에 다양한 애플리케이션에서 다중 모드 기능을 확장하는 데 도움이 됩니다.
무엇이 그들을 특별하게 만드는가?
- 실시간 응답성: 거의 0에 가까운 대기 시간으로 챗봇, 도우미, 번역 도구를 강화하세요.
- 자원 조명: 최소한의 인프라에서 고급 음성 및 오디오 모델을 실행하세요.
- 합리적인 규모의 확장: 다중 모드 기능을 확장하는 동시에 운영 비용을 절감하십시오.
사용 사례:
- 고객 서비스 및 지원을 위한 음성 기반 챗봇입니다.
- 글로벌 커뮤니케이션을 위한 실시간 번역입니다.
- 미디어 및 엔터테인먼트를 위한 동적 오디오 콘텐츠 제작.
- 기업 및 소비자 애플리케이션을 위한 대화형 음성 도우미입니다.
Azure AI Foundry의 GPT‑realtime‑mini를 통해 고객은 대기 시간이 짧고 지침 준수가 향상되며 비용 효율성이 높은 음성 솔루션을 구축할 수 있습니다. 고객이 중요하게 생각하는 기능은 처리 시간 단축, 대화 원활화, 가치 실현 시간 단축입니다.
Andy O’Dower, Twilio 제품 담당 부사장
표 2: Azure AI Foundry의 GPT-realtime-mini 및 GPT-audio-mini 가격 및 배포(1m 토큰당)*
GPT-5-채팅-최신: 안전과 웰빙을 위한 기준 높이기
Azure AI Foundry의 최신 GPT-5-chat-최신 업데이트는 민감한 대화 중에 사용자를 더 잘 보호하도록 설계된 보다 강력한 안전 가드레일 세트를 도입합니다. 향상된 감지 및 대응 기능을 통해 GPT-5-chat-latest는 이제 정신적 또는 정서적 고통으로 이어질 수 있는 대화를 보다 효과적으로 인식하고 관리할 수 있습니다. 이러한 개선 사항은 책임감 있는 AI에 대한 우리의 지속적인 노력을 반영하여 모든 상호 작용이 지능적이고 도움이 될 뿐만 아니라 어려운 순간에 사용자에게 안전하고 지원이 되도록 보장합니다.
표 3: GPT-5-chat-Azure AI Foundry의 최신 가격 및 배포(1백만 토큰당)*
GPT-5-pro: 추론과 분석의 정점
GPT-5-pro는 Azure AI Foundry 생태계 내 고급 추론 및 분석의 정점을 나타내며 연구 수준의 인텔리전스를 제공합니다. Foundry를 통해 배포할 경우 GPT-5-pro의 토너먼트 스타일 아키텍처는 여러 추론 경로를 활용하여 최대의 정확성과 신뢰성을 보장하므로 복잡한 분석, 코드 생성 및 의사 결정 워크플로에 이상적입니다. Azure AI Foundry를 통해 조직은 GPT-5-pro의 잠재력을 최대한 활용하여 더 현명한 결정을 내리고 가장 중요한 비즈니스 프로세스 전반에서 안전하고 안정적으로 혁신을 가속화합니다.
표 4: Azure AI Foundry의 GPT-5-pro 가격 및 배포(1백만 토큰당)*
개발자의 장점: 더욱 빠르게 구축하고, 실험하고, 출시하세요
이러한 새 모델을 통해 Azure AI Foundry는 단지 따라잡는 데 그치지 않고 속도를 설정하고 있습니다. 이제 개발자는 텍스트를 넘어 이미지 및 오디오 생성, 편집 및 이해를 활용할 수 있습니다. 결과는? 교육, 게임부터 기업 자동화까지 모든 산업에서 혁신을 주도하는 더욱 풍부하고 스마트한 워크플로우입니다.
미리보기: Sora 2 — 차세대 비디오 및 오디오
그리고 앞으로 더 많은 일이 있을 것입니다. Azure AI Foundry의 Sora 2가 곧 출시되어 단일 API에서 고급 비디오 및 오디오 생성 기능을 제공합니다. Azure AI Foundry를 통해 개발자가 사용할 수 있는 물리학 기반 애니메이션, 동기화된 대화 및 카메오 기능을 상상해 보세요. 몰입감 있고 생성적인 경험의 차세대 물결을 계속 지켜봐 주시기 바랍니다.
몰입형 다중 모드 경험의 차세대 물결을 창조할 준비가 되셨습니까? Azure AI 파운드리 모든 가능성을 위한 플랫폼입니다.
*가격은 2025년 10월 기준으로 정확합니다.
게시물 대규모로 창의성 발휘: Azure AI Foundry의 다중 모드 혁명 처음 등장한 Microsoft AI 블로그.