Evogene Ltd. 첫 학급을 공개했습니다 생성 AI 기초 모델 소분자 설계의 경우 새로운 화합물이 발견되는 방법에 대한 돌파구를 표시합니다. 발표 2025 년 6 월 10 일 Google Cloud와 공동 으로이 모델은 Evogene의 Chempass AI 플랫폼을 확장하고 제약 및 농업 모두에서 오랜 도전을 해결합니다. 동시에 여러 가지 복잡한 기준을 충족하는 새로운 분자를 찾습니다. 이 개발은 단일 설계주기에서 효능, 독성 및 안정성과 같은 특성의 동시 최적화를 가능하게함으로써 약물 발견 및 작물 보호에서 R & D를 가속화 할 준비가되어 있습니다.
순차적 인 스크리닝에서 동시 디자인까지
전통적인 약물 및 농업 화학 연구에서 과학자들은 일반적으로 한 번에 한 가지 요소를 테스트합니다. 첫 번째는 화합물이 작동하는지 확인한 다음 나중에 안전과 안정성을 테스트합니다. 이 단계별 방법은 느리고 비싸며 종종 실패로 끝납니다. 또한 연구원들은 친숙한 화학 구조에 집중하여 혁신을 제한하고 새롭고 특허를받을 수있는 새로운 제품을 만들기가 더 어려워집니다. 이 오래된 접근 방식은 높은 비용, 긴 타임 라인 및 낮은 성공률에 기여합니다. 마약 후보자의 90%가 시장에 도달하기 전에 실패합니다.
생성 AI는이 패러다임을 변경합니다. AI 모델은 한 번의 필터링 대신 한 번에 여러 요구 사항을 저글링 할 수 있으며, 처음부터 강력하고 안전하고 안정적으로 분자를 설계 할 수 있습니다. Evogene의 새로운 기초 모델은이 동시 다중 매개 변수 설계를 가능하게하기 위해 명시 적으로 제작되었습니다. 이 접근법은 ADME 및 독성과 같은 초기 설계와 같은 전면로드 고려 사항을 통해 위험을 제거하는 것을 목표로합니다.
실제로, 그것은 후기 단계 실패가 적을 수 있습니다. 예를 들어, 부작용으로 인한 임상 시험에서만 실패하는 실험실 결과가 좋은 약물 후보자가 적습니다. 요컨대, 생성 AI는 연구자들이 더 빠르고 똑똑하게 혁신 할 수있게 해주 며, 각각의 고립 된 분자를 다루지 않고 성공적인 분자의 많은 측면을 동시에 최적화 할 수있게한다.
내부 Chempass AI : 생성 모델이 분자를 설계하는 방법
Evogene의 Chempass AI 플랫폼의 중심에는 거대한 화학 데이터 세트에 대한 교육을받은 강력한 새로운 기초 모델입니다. 회사는 a 약 400 억 분자 구조의 선별 된 데이터베이스-알려진 약물 유사 화합물 및 다양한 화학적 스캐 폴드에 걸쳐-AI에게 분자의“언어”를 가르치기 위해. GPU SuperComputing과 함께 Google Cloud의 Vertex AI 인프라를 사용 하여이 광대 한 화학 라이브러리에서 패턴을 배웠으므로 약물과 같은 분자의 모습에 대한 전례없는 폭 넓은 지식을 제공합니다. 이 거대한 훈련 요법은 큰 언어 모델을 훈련하는 것과 유사하지만 인간 언어 대신 AI는 화학적 표현을 배웠습니다.
Evogene의 생성 모델은 자연어 처리에 혁명을 일으킨 GPT 모델과 유사한 변압기 신경망 아키텍처를 기반으로합니다. 실제로 시스템을 표시합니다 Chempass-Gpt스마일 스트링 (분자 구조의 텍스트 인코딩)에 대해 훈련 된 독점 AI 모델. 간단히 말해서, Chempass-Gpt는 분자를 문장과 같은 것으로 취급합니다. 각 분자의 Smiles String은 원자와 결합을 설명하는 일련의 문자입니다. 변압기 모델은이 화학 언어의 문법을 배웠으며, GPT가 문자로 문장을 쓸 수있는 것과 같은 방식으로 한 번에 한 문자를 예측하여 새로운 분자를 “쓰기”할 수 있습니다. 수십억 개의 예제에 대해 훈련 되었기 때문에이 모델은 화학적으로 유효한 약물과 같은 구조에 해당하는 새로운 미소를 생성 할 수 있습니다.
이것 서열 기반 생성 접근법 복잡한 패턴을 캡처 할 때 변압기의 강도를 활용합니다. 이러한 거대하고 화학적으로 다양한 데이터 세트에 대한 교육을 통해 Chempass AI는 소규모 데이터 세트의 편견이나 중복 또는 유효하지 않은 분자를 생성하는 것과 같이 이전 AI 모델이 직면 한 문제를 극복합니다. 기초 모델의 성능은 이미 화학에 적용되는 일반적인 GPT를 훨씬 능가합니다. 90% 정밀도 모든 설계 기준을 충족하는 새로운 분자를 생산할 때 전통적인 GPT 기반 모델의 ~ 29% 정밀도evogene.com. 실용적으로, 이것은 거의 모든 분자 Chempass AI가 새로운 것이 아니라 목표 프로파일에 도달했을뿐만 아니라 기준 생성 기술보다 눈에 띄는 개선을 제안한다는 것을 의미합니다.
Evogene의 1 차 생성 엔진에는 선형 스마일에서 변압기를 사용하지만 더 넓은 AI 툴킷에는 다른 다른 아키텍처가 포함되어 있습니다. 그래프 신경망 (GNN). 분자는 자연스럽게 그래프 – 원자를 노드로, 가장자리와 같은 결합으로, GNN은 이러한 구조에 직접 추론 할 수 있습니다. 현대의 약물 설계에서, GNN은 종종 원자별로 만들어 특성을 예측하거나 분자를 생성하는 데 사용됩니다. 이 그래프 기반 접근법은 시퀀스 모델을 보완합니다. 예를 들어, Evogene의 플랫폼은 3D 가상 스크리닝을위한 DeepDock과 같은 도구를 통합합니다.이 도구는 딥 러닝을 사용하여 시퀀스 모델 (창의성 및 참신에 적합함)과 구조적 정확성 및 속성 예측에 적합 함)를 결합하여 구조 기반 컨텍스트에서 분자 결합을 평가할 가능성이 높습니다. AI의 설계 루프는 후보 구조를 생성 한 다음 독성 또는 합성 타당성과 같은 기준에 대한 예측 모델 (일부 GNN 기반)을 통해이를 평가하여 각 제안을 개선하는 피드백주기를 만듭니다.
다목적 최적화 : 효능, 독성, 안정성 한 번에 모두
Chempass AI의 눈에 띄는 기능은 다목적 최적화를위한 내장 기능입니다. 클래식 약물 발견은 종종 한 번에 하나의 자산을 최적화하지만 CHEMPASS는 많은 목표를 동시에 처리하도록 설계되었습니다. 이것은 여러 제약 조건을 만족시키기 위해 생성 모델을 안내하는 고급 기계 학습 기술을 통해 달성됩니다. 훈련에서 Evogene은 분자와 같은 특성 요구 사항을 부과 할 수 있습니다. 분자는 특정 목표를 강력하게 활성화하고 특정 독성 모티프를 피하고 생체 이용률이 우수해야합니다.이 규칙에 따라 화학 공간을 탐색하는 법을 배웁니다. Chempass-GPT 시스템은 “제약 기반 생성”을 가능하게하는데, 이는 처음부터 특정 원하는 특성을 충족시키는 분자 만 제안하도록 지시받을 수 있습니다.
AI는이 다중 매개 변수 밸런싱 행위를 어떻게 달성합니까? 한 가지 접근법은 멀티 태스킹 학습이며, 모델이 분자를 생성하는 것뿐만 아니라 학습 예측 변수를 사용하여 특성을 예측하고 그에 따라 생성을 조정하는 것입니다. 또 다른 강력한 접근법입니다 강화 학습 (RL). RL 강화 워크 플로에서 생성 모델은 분자 설계의“게임을하는”에이전트와 같이 작용합니다. 분자를 제안한 다음 분자가 목표 (효능, 독성 부족 등)를 얼마나 잘 충족시키는 지에 따라 보상 점수를 얻습니다. 많은 반복에 걸쳐이 모델은이 보상을 극대화하기 위해 생성 전략을 조정합니다. 이 방법은 다른 AI 구동 약물 설계 시스템에서 성공적으로 사용되었습니다. 연구원들은 강화 학습 알고리즘은 생성 모델을 안내하여 바람직한 특성을 가진 분자를 생성 할 수 있습니다.. 본질적으로, AI는 여러 목표를 캡슐화하는 보상 기능으로 교육을받을 수 있습니다. 예를 들어 예측 된 효능에 대한 포인트를 제공하고 예측 된 독성에 대한 포인트를 빼냅니다. 그런 다음이 모델은 “이동”(원자 추가 또는 제거, 기능 그룹 변경)을 최적화하여 모든 기준을 충족시키는 데 필요한 트레이드 오프를 효과적으로 학습합니다.
Evogene은 Chempass AI의 다목적 엔진 뒤에있는 정확한 독점 소스를 공개하지 않았지만 결과에서 그러한 전략이 작동한다는 것이 분명합니다. 생성 된 각 생성 된 화합물은 효능, 합성 및 안전과 같은 “필수 매개 변수를 동시에 충족”한다는 사실. 다가오는 Chempass AI 버전 2.0은이를 더욱 발전시킬 것입니다. 특정 치료 영역 또는 작물 요구 사항에 맞는 사용자 정의 기준을 포함하여보다 유연한 다중 매개 변수 튜닝을 허용하도록 개발 중입니다. 이는 차세대 모델이 연구원들이 특정 요인의 중요성 (예 : 살충제에 대한 신경학 약물 또는 환경 생분해성에 대한 뇌 침투 우선 순위를 결정 함)의 중요성을 다이얼하거나 아래로 내릴 수 있음을 시사합니다. AI는 그에 따라 설계 전략을 조정할 것입니다. 이러한 다목적 기능을 통합함으로써 Chempass AI는 한 번에 수많은 성능 지표에서 스위트 스팟에 도달하는 분자를 설계 할 수 있습니다. 전통적인 방법은 실제로 불가능합니다.
전통적인 R & D 방법을 넘어서는 도약
Chempass AI의 생성 모델의 출현은 Life-Science R & D의 더 넓은 변화를 강조합니다. AI-augmented 창의성과 정밀도. 알려진 화학 시리즈를 고수하고 천천히 반복하는 인간 화학자들과 달리 AI는 수십억의 가능성을 추측하고 99.9%의 화학 공간으로 모험을 할 수 있습니다. 이것은 우리가 이전에 본 것과 비슷하지 않은 효과적인 화합물을 찾는 문을 열어줍니다. 새로운 화학으로 질병을 치료하거나 기존 분자에 대한 저항성을 진화시키는 해충 및 병원체를 다루는 데 결정적입니다. 또한, 고려함으로써 특허 가능성 생성 AI는 붐비는 지적 재산 영역을 피하는 데 도움이됩니다. Evogene은 명시 적으로 신선한 IP를 개척하는 분자를 생산하는 것을 목표로합니다.
전통적인 접근 방식에 대한 이점은 다음과 같이 요약 될 수 있습니다.
병렬 다중 트레이트 최적화 : AI는 병렬로 많은 매개 변수를 평가하여 효능, 안전 및 기타 기준을 만족시키는 분자를 설계합니다. 대조적으로 전통적인 파이프 라인은 종종 유망한 약물에 대한 수년간의 작업 후에 만 독성 문제를 발견합니다. 이러한 문제에 대해 선제 적으로 필터링함으로써 AI 디자인 후보자는 비용이 많이 드는 이후의 시험에서 더 나은 성공을 거두었습니다.
화학적 다양성 확장 : 생성 모델은 기존 화합물 라이브러리에만 국한되지 않습니다. Chempass AI는 이전에는 한 번도 만들어지지 않은 구조를 불러 일으킬 수 있지만 효과적 일 것으로 예상됩니다. 이것 참신 중심 세대 휠 (또는 분자)을 재창조하지 않고 새로운 행동 방식으로 차별화 된 제품을 만드는 데 도움이됩니다. 전통적인 방법은 종종 참신을 거의 제공하지 않는“나중”화합물로 이어집니다.
속도와 규모 : 화학자 팀이 1 년 안에 합성 및 테스트를 통해 달성 할 수있는 AI는 며칠 내에 시뮬레이션 할 수 있습니다. Chempass AI의 딥 러닝 플랫폼은 사실상 수백억 개의 화합물을 빠르게 스크린하고 한 번의 실행에서 수백 가지의 새로운 아이디어를 생성 할 수 있습니다. 이것은 Silico에서 확인 된 가장 유망한 후보에 대해서만 습식 랩 실험을 집중시키는 발견 타임 라인을 극적으로 압축합니다.
통합 지식 : Chempass와 같은 AI 모델은 방대한 양의 화학적 및 생물학적 지식 (예 : 알려진 구조-활성 관계, 독성 경보, 약물 유사 특성 규칙)을 통합하여 훈련에서 모든 분자 설계는 단일 인간 전문가가 머리에 보유 할 수없는 광범위한 데이터의 혜택을 의미합니다. 전통적인 디자인은 의약 화학자의 경험에 의존하지만, 가치가 있지만 인간 기억과 편견에 제한되는 반면, AI는 수백만 개의 실험과 다양한 화학 제품군에 걸쳐 패턴을 포착 할 수 있습니다.
실질적으로, 제약의 경우, 이것은 임상 시험에서 성공률이 높아지고 개발 비용이 절감 될 수 있습니다. 농업에서는 더 안전하고 지속 가능한 농작물 보호 솔루션의 빠른 창조를 의미합니다. 예를 들어 잡초에 치명적이지만 비 표적 유기체에 양성하고 환경에서 무해하게 분해되는 제초제입니다. AI는 효능과 환경 안전을 통해 함께 최적화함으로써“효과적이고 지속 가능하며 독점적 인”AG- 화학 물질을 전달하여 한 번에 규제 및 저항 문제를 해결하는 데 도움이 될 수 있습니다.
Evogene의 더 넓은 AI 도구 상자의 일부
Chempass AI는 소분자 디자인의 스포트라이트를 훔치는 반면 Evogene의 트리오 AI 전원 “기술 엔진”의 트리오는 다른 영역에 맞게 조정되었습니다. 회사는 가지고 있습니다 당신이 가진 미생물 미생물에 초점을 맞추고 chempass ai 화학 및 당신이 가진 발전기 유전 적 요소에. 각 엔진은 대형 데이터 분석 및 기계 학습을 해당 분야에 적용합니다.
AI 엔진 의이 통합 생태계는 Evogene의 전략을“AI-First”생명 과학 회사로 강조합니다. 그들은 약물, 생물 자극제 또는 가뭄에 관여하는 작물을 공식화하든 전반적으로 제품 발견을 혁신하는 것을 목표로합니다. 생물학적 복잡성을 탐색하기위한 계산 활용. 엔진은 공통 철학을 공유합니다. 최첨단 기계 학습을 사용하여 R & D 성공 확률을 높이고 시간과 비용을 줄입니다.
전망 : AI 중심의 발견은 나이가 듭니다
생성 AI는 분자 발견을 변형시켜 AI의 역할을 조수에서 창의적 공동 작업자로 전환하고 있습니다. 한 번에 하나의 아이디어를 테스트하는 대신, 과학자들은 이제 AI를 사용하여 한 단계에서 잠재력, 안전, 안정성 등 여러 목표를 충족시키는 완전히 새로운 화합물을 설계 할 수 있습니다.
이 미래는 이미 전개되고 있습니다. 제약 팀은 특정 단백질을 대상으로하고 뇌를 피하고 구두로 이용 가능하는 분자를 요청할 수 있습니다. AI는 항공 후보자를 주문할 수 있습니다. 농업에서 연구원들은 규제 및 환경 제약에 맞는 친환경 해충 제어를 생성 할 수 있습니다.
Google Cloud로 개발 된 Evogene의 최근 재단 모델은 이러한 변화의 한 예입니다. 다중 매개 변수 설계를 가능하게하고 새로운 화학 공간의 새로운 영역을 엽니 다. 미래 버전이 더 많은 사용자 정의를 허용함에 따라 이러한 모델은 생명 과학 전반에 걸쳐 필수 도구가 될 것입니다.
결정적으로 영향은 실제 검증에 달려 있습니다. AI 생성 분자가 테스트되고 정제되면서 모델이 개선되어 계산과 실험 사이의 강력한 피드백 루프를 만듭니다.
이 생성 접근법은 약물이나 살충제에만 국한되지 않습니다. 재료, 식품 및 지속 가능성의 돌파구를 곧 주도 할 수 있습니다. 시행 착오에 의해 제한된 산업 전반에 걸쳐 더 빠르고 똑똑한 발견을 제공합니다.
게시물 Evogene 및 Google Cloud Olleil 생성 분자 설계를위한 Foundation Foundation 모델, 생명 과학 AI의 새로운 시대를 개척합니다. 먼저 나타났습니다 Unite.ai.