Evo 1에서 Evo 2까지 : Nvidia가 게놈 연구 및 AI 중심 생물 혁신을 재정의하는 방법

Date:

일련의 글자를 분석하여 삶의 행동을 예측할 수있는 세상을 상상해보십시오. 이것은 공상 과학 소설이나 마술 세계가 아니라 과학자들이 수년간이 목표를 달성하기 위해 노력해 온 실제 세계입니다. 4 개의 뉴클레오티드 (A, T, C 및 G)로 구성된이 서열은 가장 작은 미생물에서 가장 큰 포유 동물에 이르기까지 지구상의 생명에 대한 기본 지침을 포함합니다. 이러한 서열을 디코딩하면 복잡한 생물학적 과정을 잠금 해제 할 수 있으며, 개인화 된 의약품 및 환경 지속 가능성과 같은 분야를 변형시킬 수 있습니다.

그러나이 엄청난 잠재력에도 불구하고 가장 간단한 미생물 게놈조차 해독하는 것이 매우 복잡한 작업입니다. 이 게놈은 DNA, RNA 및 단백질 사이의 상호 작용을 조절하는 수백만 개의 DNA 염기 쌍으로 구성되어 있으며 분자 생물학의 중심 교리에서 세 가지 주요 요소입니다. 이러한 복잡성은 개별 분자에서 전체 게놈에 이르기까지 여러 수준에 존재하여 수십억 년에 걸쳐 진화 한 방대한 유전자 정보 분야를 만듭니다.

전통적인 계산 도구는 생물학적 서열의 복잡성을 처리하기 위해 고군분투했다. 그러나 생성 AI가 증가함에 따라 이제 수조 개의 시퀀스를 확장하고 일련의 토큰에 걸쳐 복잡한 관계를 이해할 수 있습니다. 이 발전을 바탕으로 Arc Institute, Stanford University 및 Nvidia의 연구원들은 큰 언어 모델과 같은 생물학적 서열을 이해할 수있는 AI 시스템을 구축하기 위해 노력하고 있습니다. 이제 그들은 중심 교리의 멀티 모드 특성과 진화의 복잡성을 모두 포착하는 모델을 만들어 획기적인 개발을 만들었습니다. 이 혁신은 개별 분자에서 전체 게놈에 이르기까지 새로운 생물학적 서열을 예측하고 설계 할 수 있습니다. 이 기사에서는이 기술이 어떻게 작동하는지, 잠재적 인 응용 프로그램, 직면 한 과제 및 게놈 모델링의 미래를 탐색 할 것입니다.

Evo 1 : 게놈 모델링의 선구자 모델

이 연구는 2024 년 후반 Nvidia와 그 협력자들이 소개했을 때 주목을 받았습니다. 에보 1DNA, RNA 및 단백질에 걸쳐 생물학적 서열을 분석하고 생성하기위한 획기적인 모델. 총 3 천억 개의 뉴클레오티드 토큰 인 270 만 대의 원핵 생물 및 파지 게놈에 대해 교육을 받았으며,이 모델은 분자 생물학의 중심 교리를 통합하여 DNA에서 RNA 로의 유전자 정보의 흐름을 모델링하는 데 중점을 두었습니다. 컨볼 루션 필터 및 게이트를 사용하는 하이브리드 모델 인 Stripedhyena 아키텍처는 최대 131,072 개의 토큰의 긴 컨텍스트를 효율적으로 처리했습니다. 이 설계는 EVO 1이 작은 서열 변화를 더 넓은 시스템 전체 및 유기체 수준 효과에 연결하여 분자 생물학과 진화 유전체학 사이의 격차를 해소 할 수있게 해주었다.

EVO 1은 생물학적 진화의 계산 모델링의 첫 단계였다. 유전자 서열에서 진화 패턴을 분석하여 분자 상호 작용과 유전 적 변화를 성공적으로 예측했다. 그러나 과학자들이 더 복잡한 진핵 생물 게놈에 그것을 적용하려는 것처럼, 모델의 한계는 명확 해졌다. EVO 1은 긴 DNA 서열에 대한 단일-뉴클레오티드 분해능으로 어려움을 겪었고 더 큰 게놈에 대해 계산적으로 비싸다. 이러한 과제는 여러 규모에 걸쳐 생물학적 데이터를 통합 할 수있는보다 진보 된 모델이 필요했습니다.

EVO 2 : 게놈 모델링을위한 기본 모델

EVO-1에서 배운 교훈을 바탕으로 연구원들은 시작했다 에보 2 2025 년 2 월, 생물학적 서열 모델링 분야를 발전시켰다. 훈련 엄청난 9.3 조 DNA 염기 쌍 에서이 모델은 박테리아, 고고, 식물, 곰팡이 및 동물을 포함한 모든 생명 영역에서 유전자 변이의 기능적 결과를 이해하고 예측하는 법을 배웠습니다. 40 억 개가 넘는 매개 변수를 통해 Evo-2의 모델은 전례없는 시퀀스 길이를 최대 백만 개의 기본 쌍의 길이를 처리 할 수 ​​있으며, 이는 EVO-1을 포함한 이전 모델이 관리 할 수 ​​없었습니다.

EVO 2를 전임자와 차별화시키는 것은 DNA 서열뿐만 아니라 DNA, RNA 및 단백질 사이의 상호 작용 (분자 생물학의 전체 중심 교리)을 모델링하는 능력입니다. 이를 통해 EVO 2는 이전에 불가능한 방식으로 가장 작은 뉴클레오티드 변화에서 더 큰 구조적 변화에 이르기까지 유전자 돌연변이의 영향을 정확하게 예측할 수 있습니다.

EVO 2의 주요 특징은 작업 별 미세 조정이 필요없이 돌연변이의 기능적 효과를 예측할 수있는 강력한 제로 샷 예측 기능입니다. 예를 들어, DNA 서열을 단독으로 분석함으로써 유방암 연구의 중요한 요소 인 임상 적으로 유의 한 BRCA1 변이체를 정확하게 분류합니다.

생체 분자 과학의 잠재적 응용

Evo 2의 능력은 유전체학, 분자 생물학 및 생명 공학에서 새로운 국경을 열어줍니다. 가장 유망한 응용 프로그램 중 일부는 다음과 같습니다.

  • 의료 및 약물 발견 : EVO 2는 표적 치료의 발달을 돕는 특정 질병과 관련된 유전자 변이체를 예측할 수있다. 예를 들어, 테스트에서 유방암 관련 유전자 BRCA1의 변이체를 사용하여, EVO 2는 어떤 돌연변이가 양성 대 잠재적으로 병원성인지 예측할 때 90% 이상의 정확도를 달성 하였다. 이러한 통찰력은 새로운 의약품 및 개인화 된 치료를 가속화 할 수 있습니다. ​
  • 합성 생물학 및 유전 공학 : 전체 게놈을 생성하는 EVO 2의 능력은 원하는 특성을 가진 합성 유기체를 설계 할 때 새로운 길을 열어줍니다. 연구원들은 EVO 2를 사용하여 특정 기능을 갖춘 유전자를 엔지니어링하여 바이오 연료, 환경 친화적 인 화학 물질 및 새로운 치료제의 발달을 발전시킬 수 있습니다.
  • 농업 생명 공학: 가뭄 저항 또는 해충 탄력성과 같은 개선 된 특성으로 유전자 변형 작물을 설계하는 데 사용될 수 있으며, 전 세계 식량 안보 및 농업 지속 가능성에 기여합니다.
  • 환경 과학 : EVO 2는 오일이나 플라스틱과 같은 환경 오염 물질을 분해하여 지속 가능성 노력에 기여하는 바이오 연료 또는 엔지니어 단백질을 설계하기 위해 적용될 수 있습니다.

도전과 미래 방향

인상적인 기능에도 불구하고 Evo 2는 도전에 직면 해 있습니다. 주요 장애물 중 하나는 모델 교육 및 실행과 관련된 계산 복잡성입니다. 컨텍스트 창이 백만베이스 쌍과 400 억 개의 매개 변수를 사용하여 EVO 2는 효과적으로 작동하기 위해 상당한 계산 자원이 필요합니다. 이로 인해 소규모 연구 팀이 고성능 컴퓨팅 인프라에 대한 액세스없이 잠재력을 완전히 활용하기가 어렵습니다.

또한 EVO 2는 유전자 돌연변이 효과를 예측하는 데 탁월하지만, 새로운 생물학적 시스템을 처음부터 설계하는 데 사용하는 방법에 대해 여전히 배울 수 있습니다. 현실적인 생물학적 서열을 생성하는 것이 첫 번째 단계 일뿐입니다. 진정한 과제는이 힘을 사용하여 기능적이고 지속 가능한 생물학적 시스템을 만드는 방법을 이해하는 데 있습니다.

유전체학에서 AI의 접근성과 민주화

Evo 2의 가장 흥미로운 측면 중 하나는 오픈 소스 유효성. NVIDIA는 고급 게놈 모델링 도구에 대한 액세스를 민주화하기 위해 모델 매개 변수, 교육 코드 및 데이터 세트를 공개적으로 사용할 수있게했습니다. 이 오픈 액세스 방식은 전 세계의 연구원들이 EVO 2의 기능을 탐색하고 확장하여 과학계 전체의 혁신을 가속화 할 수 있습니다.

결론

EVO 2는 AI를 사용하여 복잡한 생명의 유전자 언어를 해독하기 위해 게놈 모델링에서 중요한 발전입니다. DNA 서열을 모델링하는 능력과 RNA 및 단백질과의 상호 작용은 의료, 약물 발견, 합성 생물학 및 환경 과학의 새로운 가능성을 열어줍니다. EVO 2는 유전자 돌연변이를 예측하고 새로운 생물학적 서열을 설계 할 수 있으며, 개인화 된 의약품 및 지속 가능한 솔루션에 대한 변형 가능성을 제공합니다. 그러나 계산 복잡성은 특히 소규모 연구 팀의 과제를 제시합니다. NVIDIA는 EVO 2 오픈 소스를 만들어 전세계 연구원들이 능력을 탐색하고 확장하여 유전체학 및 생명 공학의 혁신을 주도 할 수있게 해줍니다. 기술이 계속 발전함에 따라 생물학적 과학의 미래와 환경 지속 가능성을 재구성 할 수있는 잠재력을 유지하고 있습니다.

게시물 Evo 1에서 Evo 2까지 : Nvidia가 게놈 연구 및 AI 중심 생물 혁신을 재정의하는 방법 먼저 나타났습니다 Unite.ai.

Share post:

Subscribe

Popular

More like this
Related

3월 13일 정부지원사업 신규 공고 리스트 (118건) _ (파일 재가공/재배포 가능)

3월 13일 118건 <3/13 지원사업 신규 공고 목록> *전 영업일인 3/12에...

Captron North America, 센서, Robotics Summit 소프트웨어

포트 밀, SC - Captron North America용량 성 및...

2025 년에 지켜 볼 수있는 10 개의 외과 로봇 회사

왼쪽에서 오른쪽으로 : Medtronic의 Hugo Surgical Robot, Intuitive의 Da...

SCSP는 New Administration에 국가 로봇 전략을 권장합니다

산업 검사를위한 Anybotics의 Anymal은 작년 AI+Robotics Summit의 로봇 중...