진화는 분자 수준에서 수십억 년 동안 미세 조정 수명이었습니다. 생명의 기본 빌딩 블록 인 단백질은이 과정을 통해 진화하여 감염과 싸우는 것에서 음식 소화에 이르기까지 다양한 생물학적 기능을 수행했습니다. 이들 복잡한 분자는 그들의 구조와 기능을 지시하는 정확한 서열로 배열 된 긴 아미노산의 긴 사슬을 포함한다. 자연은 단백질의 특별한 다양성을 생산했지만, 그들의 구조를 이해하고 완전히 새로운 단백질을 설계하는 것은 오랫동안 과학자들에게 복잡한 도전이었습니다.
인공 지능의 최근 발전은 생물학의 가장 중요한 과제를 해결하는 능력을 변화시키고 있습니다. 이전에는 AI가 주어진 단백질 서열이 접고 행동하는 방법을 예측하는 데 사용되었습니다. 수많은 구성으로 인해 복잡한 도전입니다. 최근 AI는 전례없는 규모로 완전히 새로운 단백질을 생성하기 위해 진행되었습니다. 이 이정표는 ESM3으로 달성되었습니다. 진화론. 텍스트 처리를 위해 설계된 기존의 AI 시스템과 달리 ESM3은 단백질 서열, 구조 및 기능을 이해하도록 훈련되었습니다. 진정으로 놀랍게 만드는 것은 5 억 년의 진화를 시뮬레이션하는 능력입니다.
이 돌파구는 생물학을보다 프로그래밍 가능하게 만들기위한 중요한 단계이며 의학, 재료 과학 및 그 너머의 응용 분야에서 맞춤형 단백질을 설계 할 수있는 새로운 가능성을 열어줍니다. 이 기사에서 우리는 ESM3의 작동 방식, 달성 된 내용 및 왜이 발전이 생물학과 진화에 대한 우리의 이해를 재구성하는지 탐구합니다.
ESM3을 만나십시오 : 진화를 시뮬레이션하는 AI
ESM3은 서열, 구조 및 기능을 분석하여 단백질을 이해하고 생성하도록 훈련 된 다중 모드 언어 모델입니다. 같지 않은 알파 폴드기존 단백질의 구조를 예측할 수있는 ESM3은 본질적으로 단백질 공학 모델이며, 연구원은 완전히 새로운 단백질을 설계하기위한 기능적 및 구조적 요구 사항을 지정할 수있게합니다.
이 모델은 단백질 서열, 구조 및 기능에 대한 깊은 지식과 사용자와의 상호 작용을 통해 단백질을 생성하는 능력을 가지고 있습니다. 이 능력은 모델이 자연에 존재하지 않을 수는 있지만 생물학적으로 생존 가능한 단백질을 생성 할 수 있도록합니다. 새로운 녹색 형광 단백질 생성 (esmgfp)는이 기능에 대한 놀라운 데모입니다. 처음에 해파리와 산호에서 발견 된 형광 단백질은 의학 연구 및 생명 공학에 널리 사용됩니다. ESMGFP를 개발하기 위해 연구자들은 ESM3에 알려진 형광 단백질의 주요 구조적 및 기능적 특성을 제공했습니다. 그런 다음 모델은 반복적으로 디자인을 개선하여 a 생각의 사슬 추론 시퀀스를 최적화하기위한 접근 방식. 자연 진화는 유사한 단백질을 생산하는 데 수백만 년이 걸릴 수 있지만 ESM3 은이 과정을 가속화하여 며칠 또는 몇 주 안에이를 달성합니다.
AI 구동 단백질 설계 공정
연구자들이 ESM3을 사용하여 ESMGFP를 개발 한 방법은 다음과 같습니다.
- AI를 제기합니다 -처음에는 ESM3을 형광 관련 특징으로 안내하기 위해 순서 및 구조 신호를 입력합니다.
- 새로운 단백질 생성 – ESM3은 수천 개의 후보 단백질을 생산하기 위해 광범위한 잠재적 서열 공간을 탐구했습니다.
- 필터링 및 정제 – 가장 유망한 설계는 실험실 테스트를 위해 필터링되고 합성되었습니다.
- 살아있는 세포에서의 검증 -선택된 AI 설계 단백질을 박테리아에서 발현하여 형광 및 기능을 확인 하였다.
이 과정은 자연과는 다른 형광 단백질 (ESMGFP)이 발생했습니다.
ESMGFP가 천연 단백질과 비교하는 방법
ESMGFP를 특별하게 만드는 것은 알려진 형광 단백질에서 얼마나 멀리 떨어져 있는지입니다. 새로 발견 된 대부분의 GFP는 기존 GFP와 약간의 변화가 있지만 ESMGFP는 가장 가까운 자연 친척보다 58%의 서열 아이덴티티를 가지고 있습니다. 진화론 적으로, 이러한 차이는 5 억 년이 넘는 분기 시간에 해당합니다.
이것을 원근법으로 표현하기 위해, 마지막으로 유사한 진화 거리를 가진 단백질이 나타 났으며, 공룡은 아직 나타나지 않았으며, 다세포 수명은 여전히 초기 단계에있었습니다. 이것은 AI가 진화를 가속화했을뿐 아니라 완전히 새로운 진화 경로를 시뮬레이션하여 자연이 결코 만들어지지 않았던 단백질을 생산했습니다.
이 발견이 중요한 이유
이 발달은 단백질 공학의 중요한 단계이며 진화에 대한 우리의 이해를 심화시킵니다. AI는 며칠 만에 수백만 년의 진화를 시뮬레이션함으로써 흥미 진진한 새로운 가능성에 대한 문을 열고 있습니다.
- 더 빠른 약물 발견 : 많은 의약품은 특정 단백질을 표적화하여 작동하지만 올바른 의약품을 찾는 것은 느리고 비싸다. AI 디자인 단백질은이 과정을 속도를 높여 연구자들이 새로운 치료법을보다 효율적으로 발견 할 수 있도록 도와줍니다.
- 생명 공학의 새로운 솔루션 : 단백질은 플라스틱 폐기물을 분해하는 것에서부터 질병 감지에 이르기까지 모든 것에 사용됩니다. AI 구동 설계를 통해 과학자들은 의료, 환경 보호 및 새로운 재료를위한 맞춤형 단백질을 만들 수 있습니다.
- 진화 시뮬레이터로서의 AI:이 연구에서 가장 흥미로운 측면 중 하나는 AI를 분석 도구가 아닌 진화의 시뮬레이터로 배치한다는 것입니다. 전통적인 진화 시뮬레이션은 유전자 돌연변이를 통한 반복을 포함하며, 종종 실행 가능한 후보를 생성하는 데 몇 달 또는 몇 년이 걸립니다. 그러나 ESM3은 기능성 단백질을 직접 예측하여 이러한 느린 제약을 우회합니다. 이러한 접근 방식의 변화는 AI가 진화를 모방 할 수있을뿐만 아니라 자연 이외의 진화 가능성을 적극적으로 탐구 할 수 있음을 의미합니다. 충분한 계산 능력을 감안할 때, AI 중심의 진화는 자연 세계에 존재하지 않은 새로운 생화학 적 특성을 발견 할 수 있습니다.
윤리적 고려 사항 및 책임있는 AI 개발
AI 중심 단백질 공학의 잠재적 이점은 엄청나지만이 기술은 윤리적 및 안전 문제도 제기합니다. AI가 인간의 이해를 넘어 단백질을 설계하기 시작하면 어떻게됩니까? 이러한 단백질이 의료 또는 환경 적 사용에 안전하다는 것을 어떻게 보장합니까?
이러한 우려를 해결하기 위해 책임있는 AI 개발 및 철저한 테스트에 중점을 두어야합니다. ESMGFP와 같은 AI 생성 단백질은 실제 응용 분야를 고려하기 전에 광범위한 실험실 테스트를 거쳐야합니다. 또한, 투명성, 안전 및 대중의 신뢰를 보장하기 위해 AI 중심 생물학을위한 윤리적 프레임 워크가 개발되고 있습니다.
결론
ESM3의 출시는 생명 공학 분야에서 중요한 발전입니다. ESM3은 진화가 느리고 시행 착오 과정이되어서는 안된다는 것을 보여줍니다. 5 억 년의 단백질 진화를 단지 며칠 동안 압축하면 과학자들이 놀라운 속도와 정확도로 새로운 단백질을 설계 할 수있는 미래가 열립니다. ESM3의 개발은 우리가 생물학을 이해하기 위해 AI를 사용하는 것이 아니라 재구성 할 수 있음을 의미합니다. 이 혁신은 우리가 소프트웨어를 프로그래밍하는 방식으로 생물학을 프로그래밍하는 능력을 발전시키는 데 도움이됩니다.
게시물 AI는 방금 5 억 년의 진화를 시뮬레이션하고 새로운 단백질을 만들었습니다! 먼저 나타났습니다 Unite.ai.