이는 우리 모두가 경험해 본 일입니다. 식당에서 저녁 식사를 하면서 친구와 이야기를 나누거나, 칵테일 파티에서 흥미로운 사람을 만나거나, 사무실에서 소란스러운 가운데 회의를 진행하는 경우, 우리는 배경 잡담과 일반적인 소음 때문에 소리를 지르게 됩니다. . 인간의 귀와 뇌는 시끄러운 환경에서 특정 대화에 집중하기 위해 별도의 소리 소스를 식별하는 데 특히 능숙하지 않습니다. 이 능력은 일반 청력 상실로 인해 더욱 악화되며, 이는 사람들의 수명이 길어짐에 따라 더욱 널리 퍼지고 사회적 고립으로 이어질 수 있습니다.
그러나 워싱턴 대학 연구팀은 마이크로소프트그리고 조립 AI 가지다 방금 표시됨 AI는 음원을 분리하여 침묵의 영역을 만드는 데 있어 인간을 능가할 수 있습니다. 이 사운드 버블을 사용하면 최대 반경 2m 내의 사람들이 다른 스피커의 간섭이나 영역 외부의 소음을 크게 줄여 대화할 수 있습니다.
워싱턴 대학 교수가 이끄는 그룹 샴 골라코타AI와 하드웨어를 결합하여 인간의 능력을 향상시키는 것을 목표로 합니다. Gollakota는 이것이 엄청난 컴퓨팅 리소스를 사용하여 작업하는 것과는 다르다고 말합니다. 채팅GPT 고용하다; 오히려 하드웨어 제약의 한계 내에서 특히 모바일이나 웨어러블 용도로 유용한 AI 애플리케이션을 만드는 것이 과제입니다. Gollakota는 “칵테일 파티 문제”라고 불리는 문제가 이러한 접근 방식이 실현 가능하고 유익할 수 있는 광범위한 문제라고 오랫동안 생각해 왔습니다.
현재 시중에서 판매되고 있는 소음 제거 헤드셋은 배경 소음을 억제하지만 음원과의 거리나 밀폐된 공간의 반향과 같은 기타 문제를 보상하지는 않습니다. 그러나 이전 연구에서는 신경망이 기존 신호 처리보다 음원을 더 잘 분리하는 것으로 나타났습니다. 이 발견을 바탕으로 Gollakota 그룹은 오디오 데이터를 분석하여 지정된 버블 크기 내외의 음원을 명확하게 식별하는 통합 하드웨어 AI “히어러블” 시스템을 설계했습니다. 그런 다음 시스템은 외부 소리를 실시간으로 억제하므로 사용자가 듣는 것과 말하는 사람을 보면서 보는 것 사이에 인지할 수 있는 지연이 없습니다.
시스템의 오디오 부분은 근처의 소리와 더 먼 소리를 감지하여 신경망 분석을 위한 데이터를 제공하는 최대 6개의 마이크를 갖춘 상업용 소음 제거 헤드셋입니다. 맞춤형 네트워크는 음원까지의 거리를 찾아 프로그래밍 가능한 버블 반경 1미터, 1.5미터 또는 2미터 내에 있는 음원을 결정합니다. 이러한 네트워크는 다양한 크기와 흡음 품질을 갖춘 22개의 방에서 수집된 시뮬레이션 데이터와 실제 데이터를 모두 사용하여 훈련되었습니다. 인간 주제의 다양한 조합으로. 알고리즘은 Orange Pi 또는 라즈베리 파이청각과 시각의 동기화를 유지할 수 있을 만큼 빠른 속도로 처리된 데이터를 밀리초 내에 헤드폰으로 다시 보냅니다.
소음 제거 헤드셋을 켠 상태와 끈 상태에서 대화할 때의 차이를 들어보세요. Malek Itani 및 Tuochao Chen/Paul G. Allen 학교/워싱턴 대학교
이 프로토타입의 알고리즘은 빈 버블 외부의 사운드 볼륨을 49데시벨만큼 줄여서 대략 0.001%까지 줄였습니다. 버블 내부에 기록된 강도. 새로운 음향 환경과 다양한 사용자의 경우에도 시스템은 버블 내 최대 2개의 스피커와 간섭하는 외부 스피커 1~2개에 대해 잘 작동했습니다. 또한 버블 내부에 새로운 스피커가 도착하는 것을 수용했습니다.
특히 시끄러운 환경에서 명확하고 수월한 언어 의사소통이 필요한 경우 맞춤형 소음 제거 장치에 시스템을 적용하는 것을 상상하기 쉽습니다. 사회적 고립의 위험성은 잘 알려져 있으며, 개인 간 의사소통을 향상시키기 위해 특별히 고안된 기술이 도움이 될 수 있습니다. Gollakota는 개인 상호 작용을 위해 청각 및 공간적 관심을 집중하도록 돕는 것만으로도 가치가 있다고 믿습니다.
사운드 버블 기술은 결국 보청기에 통합될 수도 있습니다. 둘 다 Google 스위스 보청기 제조사 포낙 이어버드와 보청기에 각각 AI 요소를 추가했습니다. Gollakota는 이제 소리 거품 접근 방식을 편안하게 착용할 수 있는 보청기 형식에 적용하는 방법을 고려하고 있습니다. 이를 위해서는 장치가 이어버드 또는 양쪽 귀 뒤에 배치되는 구성에 꼭 맞아야 하고, 왼쪽과 오른쪽 장치 간에 무선으로 통신하고, 작은 배터리로 하루 종일 작동해야 합니다.
Gollakota는 이것이 가능하다고 확신합니다. “우리는 AI 증강을 지원하기 위해 하드웨어와 알고리즘이 함께 모이는 시대에 있습니다.”라고 그는 말합니다. “이것은 AI가 일자리를 대체하는 것이 아니라 인간-컴퓨터 인터페이스를 통해 사람들에게 긍정적인 영향을 미치는 것입니다.”