돌고래는 지능, 복잡한 사회적 행동 및 복잡한 커뮤니케이션 시스템으로 유명합니다. 수년 동안 과학자와 동물 애호가들은 돌고래가 인간의 언어와 비슷한 언어를 가지고 있는지에 대한 아이디어에 매료되었습니다. 최근 몇 년 동안 인공 지능 (AI) 은이 질문을 탐구 할 흥미로운 새로운 가능성을 열었습니다. 이 분야에서 가장 혁신적인 개발 중 하나는 Google과 와일드 돌고래 프로젝트 (WDP) 생성합니다 Dolphingemma돌고래 보컬을 분석하도록 설계된 AI 모델. 이 돌파구는 돌고래 의사 소통을 해독하는 데 도움이 될뿐만 아니라 이러한 놀라운 생물과의 양방향 상호 작용을위한 길을 잠재적으로 포장 할 수 있습니다.
돌고래 사운드를 이해하는 AI의 역할
돌고래는 클릭, 휘파람 및 신체 움직임의 조합을 사용하여 통신합니다. 이러한 소리는 주파수와 강도가 다양하며, 이는 다른 사람과의 구조, 짝짓기 또는 상호 작용과 같은 사회적 맥락에 따라 다른 메시지를 알 수 있습니다. 수년간의 연구에도 불구하고, 이러한 신호의 전체 범위를 이해하는 것은 어려운 것으로 입증되었습니다. 전통적인 관찰 및 분석 방법은 돌고래 발성으로 생성 된 막대한 양의 데이터를 처리하기 위해 노력하여 통찰력을 도출하기가 어렵습니다.
AI는 기계 학습 및 자연 언어 처리 (NLP) 알고리즘을 사용하여 대량의 돌고래 사운드 데이터를 분석하여 이러한 과제를 극복하는 데 도움이됩니다. 이 모델은 인간 귀의 능력을 벗어난 발성의 패턴과 연결을 식별 할 수 있습니다. AI는 다양한 유형의 돌고래 사운드를 구별하고 특성에 따라 분류하며 특정 사운드를 특정 행동이나 감정 상태에 연결할 수 있습니다. 예를 들어, 연구원들은 특정 휘파람이 사회적 상호 작용과 관련이있는 것으로 보이지만 클릭은 일반적으로 내비게이션 또는 반향과 관련이 있습니다.
AI는 돌고래 사운드를 디코딩 할 때 큰 잠재력을 가지고 있지만, 큰 데이터 세트에서 돌고래 포드에서 방대한 양의 데이터를 수집하고 처리하는 것은 여전히 중요한 과제로 남아 있습니다. 이러한 과제를 해결하기 위해 Google과 WDP는 Dolphingemma를 개발했습니다. Dolphingemma는 Dolphingemma를 개발했습니다. Dolphingemma는 돌고래 통신 분석을 위해 특별히 설계된 AI 모델을 개발했습니다. 이 모델은 광범위한 데이터 세트에 대한 교육을 받고 돌고래 보컬에서 복잡한 패턴을 감지 할 수 있습니다.
Dolphingemma 이해
Dolphingemma는 기반을 쌓았습니다 구글의 보석약 4 억 개의 매개 변수를 가진 오픈 소스 생성 AI 모델. Dolphingemma는 돌고래 발성의 구조를 배우고 새로운 돌고래와 같은 사운드 시퀀스를 생성하도록 설계되었습니다. WDP 및 Georgia Tech와 공동으로 개발 된이 모델은 1985 년부터 수집 된 Atlantic Spotted Dolphin Vocalizations의 데이터 세트를 사용합니다.이 모델은 사용합니다. 구글의 사운드 스트림 이러한 사운드를 토큰 화하여 다음 사운드를 순서대로 예측할 수 있습니다. 언어 모델이 텍스트를 생성하는 방식과 마찬가지로 Dolphingemma는 돌고래가 만들 수있는 소리를 예측하여 돌고래 커뮤니케이션에서 문법 또는 구문을 나타내는 패턴을 식별하는 데 도움이됩니다.
이 모델은 예측 텍스트가 문장의 다음 단어를 제안하는 방식과 유사하게 새로운 돌고래와 같은 사운드를 생성 할 수 있습니다. 이 능력은 돌고래 커뮤니케이션을 지배하는 규칙을 식별하는 데 도움이 될 수 있으며 발성이 구조화 된 언어를 형성하는지 여부를 이해하는 것에 대한 통찰력을 제공 할 수 있습니다.
Dolphingemma의 행동
Dolphingemma를 특히 효과적으로 만드는 것은 Google Pixel 전화와 같은 장치에서 실시간으로 실행하는 능력입니다. 가벼운 아키텍처를 통해 모델은 비싸고 특수 장비없이 작동 할 수 있습니다. 연구원들은 Dolphin Sound를 휴대 전화에 직접 기록하고 Dolphingemma로 즉시 분석 할 수 있습니다. 이를 통해 기술의 접근성을 높이고 연구 비용을 줄이는 데 도움이됩니다.
또한 Dolphingemma는에 통합됩니다 채팅 (Cetacean Hearing Augmentation Telemetry) 시스템은 연구자들이 합성 돌고래와 같은 사운드를 연주하고 반응을 관찰 할 수 있도록합니다. 이로 인해 돌고래와 인간 사이의 양방향 커뮤니케이션을 가능하게함으로써 공유 어휘의 발전으로 이어질 수 있습니다.
더 넓은 영향과 Google의 미래 계획
Dolphingemma의 발달은 돌고래 의사 소통을 이해하는 것뿐만 아니라 동물인지 및 의사 소통에 대한 연구를 발전시키는 데 중요합니다. Dolphin Vocalizations를 디코딩함으로써 연구원들은 돌고래 사회 구조, 우선 순위 및 사고 과정에 대한 더 깊은 통찰력을 얻을 수 있습니다. 이것은 돌고래의 필요와 관심을 이해함으로써 보존 노력을 개선 할 수있을뿐만 아니라 동물 지능과 의식에 대한 우리의 지식을 확장 할 수있는 잠재력을 가지고 있습니다.
Dolphingemma는 AI를 사용하여 동물 의사 소통을 탐색하는 광범위한 운동의 일부입니다. Google은 2025 년 여름에 연구 커뮤니티에 개방형 모델로 Dolphingemma를 공개 할 계획이며, 추가 미세 조정을 통해 Bottlenose 또는 Spinner Dolphins와 같은 다른 Cetacean 종으로의 적용을 확장하려는 목표를 달성 할 계획입니다. 이 오픈 소스 접근 방식은 동물 커뮤니케이션 연구에서 글로벌 협업을 장려 할 것입니다. Google은 또한 다가오는 시즌 동안 현장에서 모델을 테스트 할 계획으로 대서양 발견 된 돌고래에 대한 이해를 더욱 확대 할 수 있습니다.
도전과 과학적 회의론
잠재력에도 불구하고 Dolphingemma는 몇 가지 도전에 직면 해 있습니다. 해양 기록은 종종 배경 소음의 영향을 받기 때문에 사운드 분석이 어렵습니다. 이 프로젝트에 참여한 연구원 인 Georgia Tech의 Thad Starner 지적합니다 대부분의 데이터에는 Ambient Ocean Sound가 포함되어 있으며 고급 필터링 기술이 필요합니다. 일부 연구자들은 또한 돌고래 커뮤니케이션이 진정으로 언어로 간주 될 수 있는지 의문을 제기합니다. 예를 들어, 동물 학자 인 Arik Kershenbaum, 그것을 제안합니다인간 언어의 복잡한 특성과 달리 돌고래 발성은 더 간단한 신호 시스템 일 수 있습니다. Thea Taylor, 이사 서 섹스 돌고래 프로젝트의도하지 않게 돌고래를 훈련하여 소리를 모방 할 위험에 대한 우려를 제기합니다. 이러한 관점은 AI 생성 통찰력에 대한 엄격한 검증과 신중한 해석의 필요성을 강조합니다.
결론
Dolphin 커뮤니케이션에 대한 Google의 AI 연구는 돌고래와 환경과 상호 작용하는 복잡한 방법을 이해하는 데 더 가까이있는 획기적인 노력입니다. 인공 지능을 통해 연구원들은 돌고래 사운드의 숨겨진 패턴을 감지하여 커뮤니케이션 시스템에 대한 새로운 통찰력을 제공하고 있습니다. 도전은 여전히 남아 있지만, 지금까지 진행된 진전은 동물 행동 연구에서 AI의 잠재력을 강조합니다. 이 연구가 발전함에 따라 보존, 동물인지 연구 및 인간-동물 상호 작용의 새로운 기회에 대한 문을 열 수 있습니다.
게시물 Google의 AI가 돌고래 커뮤니케이션의 비밀을 잠금 해제하는 방법 먼저 나타났습니다 Unite.ai.