AI 뉴스허브

오디오 및 음성 기능이 포함된 GPT-4o-Realtime-Preview를 포함한 Azure OpenAI 서비스의 새로운 제품 및 기능 발표

오디오 및 음성 기능이 포함된 GPT-4o-Realtime-Preview를 포함한 Azure OpenAI 서비스의 새로운 제품 및 기능 발표

오디오 및 음성 기능이 포함된 GPT-4o-Realtime-Preview를 포함한 Azure OpenAI 서비스의 새로운 제품 및 기능 발표

오디오 및 음성에 대한 GPT-4o-Realtime-Preview의 공개 미리 보기를 발표하게 되어 기쁘게 생각합니다. 마이크로소프트 Azure OpenAI 서비스 고급 음성 기능을 추가하고 GPT-4o의 다중 모드 제공을 확장합니다. 이 이정표는 AI, 특히 음성 기술 영역에서 Azure의 리더십을 더욱 공고히 합니다. 이 분야에서 Azure의 유산은 Teams, Office 365, Edge와 같은 핵심 Microsoft 제품 전반에 걸쳐 음성-텍스트, 텍스트-음성, 신경 음성 및 실시간 번역을 역사적으로 통합한 음성 서비스를 통해 오랫동안 확립되었습니다. .

이제 GPT-4o-Realtime-Preview는 언어 생성과 원활한 음성 상호 작용을 통합하여 개발자에게 보다 자연스럽고 대화적인 AI 경험을 만드는 데 필요한 도구를 제공함으로써 경계를 더욱 확장합니다. 가상 비서 생성부터 실시간 고객 지원 강화에 이르기까지 이 새로운 모델은 음성 기반 애플리케이션에 대한 광범위한 가능성을 열어줍니다. 새로운 모델은 Copilot과도 통합되었습니다. 새로운 Copilot Voice 제품 발표했다.

최근 Azure OpenAI 발표를 기반으로 구축

이번 발표는 계속해서 일련의 중요한 업데이트 다음을 포함하는 Azure OpenAI 서비스 내:

이러한 지속적인 발전은 전 세계 고객에게 가장 포괄적이고 안전하며 다양한 AI 도구를 제공하려는 Azure의 노력을 보여줍니다. 뉴스피드를 북마크에 추가하세요 향후 모든 공지 사항을 추적합니다.

GPT-4o-실시간 미리보기의 새로운 기능은 무엇입니까?

GPT-4o-실시간 API: 이번 릴리스를 통해 GPT-4o는 오디오 입력 및 출력을 지원하도록 진화하여 기존의 텍스트 기반 AI 대화를 뛰어넘는 실시간, 자연스러운 음성 기반 상호 작용을 가능하게 합니다. 이 다중 모드 기능을 통해 개발자는 혁신적인 음성 애플리케이션을 쉽게 구축할 수 있습니다.

Azure AI Studio 조기 액세스 플레이그라운드: 탐색을 열망하는 개발자를 위해 이 전용 공간을 통해 오디오 기능용 GPT-4o-Realtime API를 조기에 실험할 수 있습니다. 스튜디오는 프로덕션 환경에 출시하기 전에 음성 상호 작용을 테스트하고 미세 조정하고 최적화할 수 있는 환경을 제공합니다.

그 자체로 말하는 성능

오디오용 GPT-4o-Realtime API를 사용하는 초기 고객은 놀라운 결과를 공유하여 성능과 영향을 확인했습니다.

Azure OpenAI 서비스의 GPT-4o-Realtime-Preview 애플리케이션

GPT-4o-Realtime-Preview의 잠재력은 다양한 산업에 걸쳐 비즈니스 운영 방식과 사용자가 기술과 상호 작용하는 방식을 변화시킵니다.

혁신을 주도하는 사용 사례

GPT-4o-Realtime-Preview의 다양성은 이미 다양한 분야의 운영을 변화시키고 있습니다. 다음은 얼리 어답터 몇 명과 이들이 이 기술을 통해 어떤 혜택을 누리고 있는지 소개합니다.

“AOAI는 대화 우선 솔루션인 HeyBosch(Virtual Sales Executive Solution)에 이상적인 인터페이스입니다. AOAI를 기존 솔루션에 쉽게 통합할 수 있습니다. 참조 샘플을 제공해 주셔서 감사합니다. 이제 두 가지(음성 및 LLM)를 결합하는 단일 인터페이스가 있으므로 가상 에이전트의 응답 시간이 크게 향상되었습니다. 이는 대기 시간을 최소화하는 데 도움이 됩니다. 이번 통합은 GenAI, 3D 기술 및 실시간 음성 처리 기능을 결합하여 매력적인 사용자 경험을 창출할 수 있는 가능성을 보여줍니다.”Vamsidhar Sunkari 수석 전문가 Bosch Global Software Technologies Pvt Ltd.

Lyrebird Health는 의료 제공자/환자 관계에 오디오 기능을 제공하게 된 것을 기쁘게 생각합니다. 새로운 GPT-4o 실시간 미리보기 모델을 통해 고객과 최종 사용자를 위한 새로운 경험을 실험하고 출시할 수 있습니다. 이는 지구상 최고의 인력 기술을 제공하려는 우리의 사명을 완수하는 데 도움이 될 것입니다.”—Kai Van Lieshout, Lyrebird Health의 공동 창립자 겸 CEO

신뢰할 수 있는 AI에 대한 우리의 약속

Azure는 책임감 있는 AI에 대한 약속을 확고히 유지하고 있습니다.안전과 개인정보 보호를 기본 우선순위로 삼습니다. Realtime API는 오용을 방지하기 위해 자동화된 모니터링 및 사람의 검토를 포함한 여러 계층의 안전 조치를 활용합니다.

Realtime API는 Responsible AI에 대한 약속에 따라 엄격한 평가를 거쳤습니다. 확인해 보세요 2024 책임 있는 AI 투명성 보고서.

Azure OpenAI 서비스는 추가 비용 없이 기본 제공 콘텐츠 안전 기능을 제공하고, Azure AI Studio는 AI 애플리케이션의 안전성을 평가하는 도구를 제공하여 안전하고 책임감 있는 AI 환경을 보장합니다.

오디오용 GPT-4o-Realtime API의 다음 단계는 무엇입니까?

오디오용 GPT-4o-Realtime API의 기능을 지속적으로 혁신하고 확장하면서 개발자와 기업이 이 최첨단 기술을 활용하여 가능성의 경계를 넓히는 음성 기반 애플리케이션을 만드는 방법을 보게 되어 기쁩니다.

고객 서비스 운영에 음성 기능을 통합하려는 경우나 다국어 상호 작용의 가능성을 모색하려는 경우 오디오용 GPT-4o-Realtime API는 AI 솔루션을 혁신할 수 있는 유연성과 성능을 제공합니다. 오늘부터 다음에서 이러한 새로운 기능을 탐색할 수 있습니다. Azure OpenAI 스튜디오Early Access Playground에서 실험해 보거나 공개 미리 보기의 실시간 API를 애플리케이션에 직접 통합하세요.

최신 업데이트에 대한 문서를 검토하고, 사용 가능한 사용 사례를 자세히 살펴보고, 오디오용 GPT-4o-Realtime API를 사용하여 구축을 시작하여 비즈니스를 AI 혁신의 한 단계 끌어올리십시오.

앞으로 몇 주 동안 계속 업데이트를 출시할 예정이므로 향후 고객 사례, 자세한 사용 사례 데모 등을 계속 지켜봐 주시기 바랍니다!

게시물 오디오 및 음성 기능이 포함된 GPT-4o-Realtime-Preview를 포함한 Azure OpenAI 서비스의 새로운 제품 및 기능 발표 처음 등장한 Microsoft AI 블로그.

Exit mobile version