OpenAI는 대화할 수 있는 고급 AI 챗봇을 출시하고 있습니다. 오늘부터 이용 가능합니다. 적어도 일부에게는 그렇습니다.
새로운 챗봇은 Siri와 Alexa의 맥락에서 OpenAI가 새로운 세대의 AI 기반 음성 비서를 추진하는 것을 나타내지만, 더 자연스럽고 유창한 대화를 가능하게 하는 훨씬 더 많은 기능을 갖추고 있습니다. 이는 더욱 완벽하게 기능하는 AI 에이전트. 새로운 ChatGPT 음성 봇은 다양한 음성 톤이 무엇을 전달하는지 알아내고, 방해에 대응하고, 실시간으로 질의에 답할 수 있습니다. 또한 보다 자연스럽게 들리도록 훈련되었으며, 음성을 사용하여 다양한 감정을 전달합니다.
음성 모드는 OpenAI의 새로운 기능으로 구동됩니다. GPT-4o 음성, 텍스트, 비전 기능을 결합한 모델입니다. 피드백을 수집하기 위해 이 회사는 처음에는 ChatGPT Plus를 지불하는 “소규모 사용자 그룹”에게 챗봇을 출시했지만, 이번 가을에는 모든 ChatGPT Plus 구독자에게 봇을 제공할 것이라고 밝혔습니다. ChatGPT Plus 구독료는 한 달에 20달러입니다. OpenAI는 ChatGPT 앱에서 첫 번째 출시 웨이브에 속한 고객에게 알리고 새 모델을 사용하는 방법에 대한 지침을 제공할 것이라고 밝혔습니다.
새로운 음성 기능은 5월에 발표됨원래 계획보다 한 달 늦게 출시됩니다. 회사가 말했다 모델의 원치 않는 콘텐츠 감지 및 거부 기능과 같은 안전 기능을 개선하는 데 더 많은 시간이 필요했습니다. 이 회사는 또한 수백만 명의 사용자에게 실시간 응답을 제공하기 위한 인프라를 준비 중이라고 밝혔습니다.
OpenAI는 모델의 음성 기능을 100명 이상의 외부 레드팀원과 함께 테스트했으며, 이들은 모델의 결함을 조사하는 임무를 맡았다고 밝혔습니다. OpenAI에 따르면, 이 테스터들은 총 45개 언어를 구사했고 29개국을 대표했습니다.
이 회사는 여러 가지 안전 장치를 마련했다고 말합니다. 예를 들어, 이 모델이 오디오 딥페이크를 만드는 데 사용되는 것을 방지하기 위한 조치로, 성우와 협력하여 사전 설정된 음성 4개를 만들었습니다. GPT-4o는 다른 사람의 음성을 사칭하거나 생성하지 않습니다.
OpenAI가 처음 GPT-4o를 출시했을 때, 이 회사는 여배우 스칼렛 요한슨과 매우 흡사한 “Sky”라는 음성을 사용했다는 이유로 반발에 직면했습니다. 요한슨은 성명 회사에서 모델에 자신의 목소리를 사용하도록 허가를 요청했지만 거절했다고 말했습니다. 그녀는 모델 데모에서 자신의 목소리와 “소름 돋을 정도로 비슷한” 목소리를 듣고 충격을 받았다고 말했습니다. OpenAI는 거부됨 목소리는 요한슨의 것이지만 Sky 사용을 중단했습니다.
이 회사는 또한 저작권 침해 혐의로 여러 소송에 연루되어 있습니다. OpenAI는 음악이나 기타 저작권이 있는 오디오를 생성하라는 요청을 인식하고 차단하는 필터를 채택했다고 말합니다. OpenAI는 또한 텍스트 기반 모델에서 사용하는 것과 동일한 안전 메커니즘을 GPT-4o에 적용하여 법을 위반하고 유해한 콘텐츠를 생성하지 못하도록 했다고 말합니다.
OpenAI는 비디오 및 화면 공유와 같은 고급 기능을 포함할 계획이며, 이를 통해 어시스턴트가 더 유용해질 수 있습니다. 5월 데모에서 직원들은 휴대전화 카메라를 종이에 대고 AI 모델에 수학 방정식을 풀도록 도와달라고 요청했습니다. 또한 컴퓨터 화면을 공유하고 모델에 코딩 문제를 풀도록 도와달라고 요청했습니다. OpenAI는 이러한 기능이 지금은 제공되지 않지만 나중에 불특정 날짜에 제공될 것이라고 말합니다.