미국 최고의 의료 센터와 연구 기관의 전문가 위원회는 NVIDIA 기반 연합 학습을 활용하여 연합 학습과 AI 지원 주석의 영향을 평가하고, 이를 통해 종양 분할을 위한 AI 모델을 훈련하고 있습니다.
연합 학습 다양한 데이터 소스의 데이터에서 훈련된 보다 정확하고 일반화 가능한 AI 모델을 개발하는 기술로, 데이터 보안이나 프라이버시를 완화하지 않습니다. 여러 조직이 민감한 데이터가 서버를 떠나지 않고도 AI 모델을 개발하는 데 협력할 수 있습니다.
위스콘신-매디슨 대학의 방사선학과 조교수인 존 개럿은 “개인정보 보호 및 데이터 관리 제약으로 인해 사이트 간 데이터를 공유하고 한곳에 모으는 것이 점점 더 복잡해지고 있으며, 이미징 AI는 연구 기관이 데이터 공유 계약을 체결하는 것보다 더 빠르게 발전하고 있습니다.”라고 말했습니다. “연방 학습을 채택하여 여러 사이트에서 동시에 모델을 구축하고 테스트하는 것이 실질적으로 따라잡을 수 있는 유일한 방법입니다. 없어서는 안 될 도구입니다.”
Garrett은 다음의 일부입니다. 영상정보학 및 의학 학회 (SIIM) 머신 러닝 도구 및 연구 하위 위원회, 의료 영상에 대한 AI의 개발 및 응용을 발전시키는 것을 목표로 하는 임상의, 연구자 및 엔지니어 그룹입니다. NVIDIA는 SIIM의 회원이며, 2019년부터 연합 학습 프로젝트 위원회와 협력해 왔습니다.
위원장인 칼레드 유니스는 “연합 학습 기법은 GDPR, HIPAA 등과 같은 개인정보 보호 규정을 준수하면서 향상된 데이터 개인정보 보호 및 보안을 가능하게 합니다.”라고 말했습니다. “또한, 모델 정확도와 일반화가 개선되었습니다.”
Case Western, Georgetown University, Mayo Clinic, University of California, San Diego, University of Florida 및 Vanderbilt University의 협력자를 포함한 팀은 최신 프로젝트를 지원하기 위해 다음을 활용했습니다. 엔비디아 플레어 (NVFlare)는 강력한 보안 기능, 고급 개인 정보 보호 기술 및 유연한 시스템 아키텍처를 포함하는 오픈소스 프레임워크입니다.
를 통해 NVIDIA 학술 보조금 프로그램위원회는 4개를 받았습니다. NVIDIA RTX A5000 GPU연합 학습을 위한 워크스테이션을 설정하기 위해 참여 연구 기관에 분산되었습니다. 추가 협력자는 클라우드와 온프레미스 서버에서 NVIDIA GPU를 사용하여 NVFLare의 유연성을 강조했습니다.
연합 학습을 위한 코드 해독
참여한 6개 의료 센터는 각각 신장암의 일종인 신세포 암에 초점을 맞춰 이 프로젝트에 약 50건의 의료 영상 연구 데이터를 제공했습니다.
“연합 학습의 아이디어는 훈련 중에 데이터를 교환하는 것이 아니라 모델을 교환한다는 것입니다.” 밴더빌트 대학교의 컴퓨터 과학 조교수이자 생물의학 데이터 표현 및 학습 랩의 책임자인 Yuankai Huo가 말했습니다.
연합 학습 프레임워크에서 초기 글로벌 모델은 모델 매개변수를 클라이언트 서버로 브로드캐스트합니다. 각 서버는 이러한 매개변수를 사용하여 조직의 독점 데이터로 학습된 모델의 로컬 버전을 설정합니다. 그런 다음 각 로컬 모델의 업데이트된 매개변수가 글로벌 모델로 다시 전송되고, 여기서 이를 집계하여 새로운 글로벌 모델을 생성합니다. 모델의 예측이 각 학습 라운드에서 더 이상 개선되지 않을 때까지 이 주기가 반복됩니다.
이 그룹은 모델을 원하는 수준의 정밀도로 훈련하는 데 필요한 훈련 속도, 정확도, 이미지 연구 수를 최적화하기 위해 모델 아키텍처와 하이퍼파라미터를 실험했습니다.
NVIDIA MONAI를 통한 AI 지원 주석
프로젝트의 첫 번째 단계에서는 모델에 사용된 훈련 데이터에 수동으로 레이블을 지정했습니다. 다음 단계에서는 팀이 NVIDIA MONAI for AI 지원 주석을 사용하여 AI의 도움으로 세분화된 훈련 데이터와 기존 주석 방법을 비교했을 때 모델 성능이 어떻게 다른지 평가합니다.
“연합 학습 활동에서 가장 큰 어려움은 일반적으로 다른 사이트의 데이터가 엄청나게 균일하지 않다는 것입니다. 사람들은 다른 이미징 장비를 사용하고, 다른 프로토콜을 가지고 있으며, 그저 데이터에 다르게 레이블을 붙일 뿐입니다.”라고 Garrett은 말했습니다. “MONAI를 추가하여 연합 학습 모델을 두 번째로 학습함으로써 전반적인 주석 정확도가 향상되는지 알아보고자 합니다.”
팀이 사용 중입니다 머니 라벨사용자가 사용자 정의 AI 주석 앱을 개발할 수 있게 해주는 이미지 레이블링 도구로, 새로운 데이터 세트를 만드는 데 필요한 시간과 노력을 줄여줍니다. 전문가는 모델 훈련에 사용되기 전에 AI에서 생성된 세분화를 검증하고 개선합니다.
수동 및 AI 지원 주석 단계에 대한 데이터는 선도적인 의료 영상 데이터 및 AI 플랫폼인 Flywheel에 호스팅됩니다. 통합 NVIDIA MONAI 제공하는 상품으로 구성했습니다.
프로젝트가 완료되면 팀은 방법론, 주석이 달린 데이터 세트, 사전 학습된 모델을 게시하여 향후 작업을 지원할 계획입니다.
Garrett은 “우리는 이러한 도구를 탐색하는 데 관심이 있을 뿐만 아니라, 다른 사람들이 의료 분야 전반에서 이러한 도구를 배우고 사용할 수 있도록 우리의 작업을 게시하는 데도 관심이 있습니다.”라고 말했습니다.
NVIDIA 학술 보조금 신청
그만큼 NVIDIA 학술 보조금 프로그램 연구자들에게 세계적인 수준의 컴퓨팅 접근성과 리소스를 제공하여 학술 연구를 발전시킵니다. 현재 신청이 진행 중입니다. NVIDIA 기술을 사용하여 프로젝트를 가속화하는 공인 학술 기관의 정규 교수진을 위해 시뮬레이션 및 모델링, 생성 AI 및 대규모 언어 모델.
향후 애플리케이션 주기는 데이터 과학, 그래픽 및 비전, 엣지 AI(연합 학습 포함) 프로젝트에 중점을 둘 것입니다.