깁스 달이 매달려 있습니다 이탈리아 알프스의 외로운 산길 위에 Malles Venosta 마을 위의 조명이 아래의 계곡을칩니다. Benjamin Meesmi 그의 얼굴, 얼굴, 덤불 같은 수염, 그리고 자주색 빛으로 불이 붙은 나방 함정 옆에 서 있습니다. 그는 헤드 램프, 먼지가 많고 폭행 된 스마트 워치,화물 반바지, 소매가있는 파란 지퍼 스웨터를 입고 있습니다. 수많은 나방이 함정의 흰색, 습한 패널 주위에서 열광적으로 이겼습니다. Wiesmair는 그의 스마트 폰을 곁들인 유럽 나방 종의 데이터베이스에 로그온합니다.
“Chersotis Multangula그는 말합니다.
“예, 우리는 필요합니다.” 클라라 스필 커노트북 컨설팅.
Wiesmair, 곤충 학자 티롤레인 주립 박물관오스트리아 인스 브루크 (Insbruck)와 스필 커 (Spilker) Senckenberg 독일 곤충 연구소Müncheberg에서, 가장 광범위한 생물학적 이니셔티브 중 하나에 참여하고 있습니다. 그들 중 180 만 명. 연구원들은 원정대의 일부입니다 프로젝트 정신유럽 나비와 나방을 샘플링하고 데이터를 전 세계 이니셔티브에 공급할 것입니다. 지구 생체 프로젝트 (EBP).
진핵 생물입니다 세포가 핵을 함유하는 유기체. 원생 동물에서 인간에 이르기까지, 모두 생명의 형태를 구축, 유지 및 전파하는 것과 동일한 기본 생물학적 메커니즘을 가지고 있습니다 : 게놈. 그것은 생물이 운반하는 유전자의 총계입니다.
22 년 전, 연구원들은 처음으로 거의 모든 유전자가 인간 게놈. 프로젝트 비용 미화 30 억 달러 이상 13 년이 걸렸지 만 결국 의료 실무를 변화 시켰습니다. 새로운 시대에 게놈 의학의사는 진단 및 치료 중에 환자의 특정 유전자 구성을 고려할 수 있습니다.
EBP는 2035 년까지 기념비적 인 목표를 달성하는 것을 목표로합니다. 2024 년 7 월 현재 서열체의 집계는 약 4,200. 성공은 의심 할 여지없이 여러 생명 공학 기술을 확장하는 연구원의 능력에 달려 있습니다.
“우리는 우리가 전 세계적으로 생산하는 연간 게놈의 수 측면에서 백 배 이상 확장해야합니다.”라고 말합니다. 해리스 루인EBP를 이끌고 교수 및 유전학 연구원 인 사람 애리조나 주립 대학.
스케일링 해야하는 가장 중요한 기술 중 하나는 긴 읽기 게놈 시퀀싱이라는 기술입니다. 생물학의 게놈 혁명의 최전선에있는 전문가들은 그러한 스케일링이 가능할 것이라고 확신하며, 그들의 확신은 과거의 경험에서 비롯됩니다. “2001 년에 비해”인간 게놈 프로젝트가 거의 완성되었을 때, “이제 서열 DNA에 대해 약 50 만 배 더 저렴합니다”라고 말합니다. 스티븐 살츠버그Bloomberg Distinguished 교수 존스 홉킨스 대학교 그리고 학교 이사 계산 생물학 센터. “그리고 그것은 또한 시퀀스에 대해 약 50 만 배 더 빠릅니다.”라고 덧붙입니다. “이것은 지난 25 년 동안 메모리 나 프로세서의 속도에서 계산 기술의 개선을 크게 능가한 규모의 규모입니다.”
EBP와 기술 발전을 응원해야 할 많은 이유가 있습니다. 모든 진핵 생물에 대한 게놈을 설립 한 연구원들은 지구의 삶의 실들 사이의 연결과 수많은 생명체에 대한 진화가 어떻게 진행되었는지에 대한 깊은 새로운 통찰력을 얻게 될 것입니다. 기후 변화가 우리를 포함한 모든 생물이 의존하는 생태계를 바꾸면서 그 지식이 점점 더 중요해질 것입니다.
이 프로젝트는 과학적 협력이지만 상당한 재무 횡재를 분리 할 수 있습니다. 많은 약물, 효소, 촉매 및 기타 계산 할 수없는 가치의 화학 물질이 첫 번째였습니다. 천연 샘플에서 확인. 연구원들은 사실상 지구상의 수십억 개의 진핵 생물 유전자를 식별하는 과정에서 더 많은 것을 발견 할 것으로 기대하며, 그 중 다수는 어떤 종류의 단백질을 암호화합니다.
“한 가지 아이디어는 모든 종류의 화학 물질을 가진 식물을 보면 곤충이나 해충과 싸우기 위해 종종 중요한 약물이 될 새로운 분자를 찾을 수 있다는 것입니다. 리차드 더빈유전학 교수 캠브리지 대학교 그리고 여러 게놈 시퀀싱 이니셔티브의 베테랑. 면역 억제제 및 암 약물 라파 마이신수많은 예 중 하나를 인용하기 위해 미생물 게놈에서 나왔습니다.
당신의 유전자는 당신이 당신의 큰 이유입니다
EBP는 일부를위한 우산 조직입니다 60 프로젝트 영역 또는 특정 분류군에서 종의 시퀀싱 종인 (및 계수). 과잉 성취자는 다음과 같습니다 다윈의 나무 프로젝트이것은 영국과 아일랜드의 모든 종을 시퀀싱하고 있으며 지금까지 EBP에 의해 기록 된 모든 게놈의 약 절반을 기여했습니다. Project Psyche는 Darwin Tree of Life 이니셔티브에서 분리되었으며 둘 다 Wellcome Trust.
전체 EBP의 크기에 대한 아이디어를 얻으려면 종을 시퀀싱하는 데 필요한 것이 무엇인지 고려하십시오. 첫째, 유기체는 물론 발견되거나 포획 및 샘플링되어야합니다. 이것이 지난 7 월 Wiesmair, Spilker 및 41 명의 다른 Lepidopterists를 이탈리아 알프스로 데려 왔습니다. 5 일 동안, 그들은 시퀀싱을 위해 200 개 이상의 새로운 종을 수집했으며, 이는 이미 완성 된 1,000 개의 완성 된 Lepidoptera 게놈 서열과 시퀀싱을 기다리는 약 2,000 개의 샘플을 확대 할 것입니다. 아직해야 할 일이 여전히 많습니다. 유럽과 영국에는 약 11,000 종의 나방과 나비가 있습니다.
샘플링 후, 생물의 DNA 인 유전자 물질은 세포에서 수집 한 다음 시퀀싱 기계에 의해 읽을 수있을 정도로 짧은 단편으로 분해됩니다. 시퀀싱 후, 게놈 데이터를 분석하여 유전자의 위치와 가능한 경우 수행하는 작업을 결정합니다.
지난 25 년 동안 유전자 시퀀싱 기술의 가속은 메모리 또는 프로세서 속도에서 계산 기술의 개선을 크게 능가했습니다.
DNA는 구조가 유명한 분자입니다 이중 나선. 그것은 모든 생물의 몸에있는 모든 세포의 핵에 있습니다. 분자를 뒤틀린 사다리로 생각하면 사다리의 렁은베이스라고 불리는 화학 단위 쌍으로 형성됩니다. 아데닌 (A), 구아닌 (G), 시토신 (C) 및 티민 (T)의 네 가지 염기가 있습니다. 아데닌은 항상 흉선과 짝을 이루고 구아닌은 항상 시토신과 짝을 이룹니다. 따라서 “런그”는 a – t, t – a, c – g 또는 g – c의 네 가지 중 하나 일 수 있습니다.
그 4 명 베이스 쌍 순열은 삶의 강령을 구성하는 상징입니다. 그들의 줄은 다양한 길이의 세그먼트로서 게놈을 구성합니다. 유전자. 당신의 유전자는 적어도 부분적으로 부분적으로 당신의 신체적 및 많은 정신적 특성의 대부분을 제어합니다. 눈의 색깔과 키가 크게뿐만 아니라 어떤 질병에 걸리기 쉬운 지, 근육을 키우거나 체중을 줄이는 것이 얼마나 어려운지, 심지어는 병에 걸리기 쉽습니다.
게놈 시퀀싱이 얼마나 오랫동안 읽는가
장거리 시퀀싱은 유전자 물질의 샘플을 종종 약 20,000베이스 쌍의 길이로 분해하여 시작합니다. 그런 다음 시퀀싱 기술은 이들 DNA 가닥의 기본 쌍 순서를 읽고 길이가 10,000 쌍 이상인 “읽기”라고 불리는 임의의 세그먼트를 생성합니다. 긴 읽기가 얻어지면 강력한 생물 정보학 소프트웨어가 사용됩니다. 더 긴 스트레칭을 구축하십시오 동일한 시퀀스의베이스를 공유하는 판독 값을 겹쳐서 연속 순서.
과정을 이해하려면 게놈을 소설로 생각하고 각각의 별도 염색체 소설의 장으로. 소설을 각각 약 5 평방 센티미터의 종이 조각으로 파쇄한다고 상상해보십시오. 귀하의 임무는 원본 소설로 다시 조립하는 것입니다 (불행히도 페이지는 번호가 매겨지지 않습니다). 이 작업을 가능하게하는 것은 겹치는 것입니다. 소설의 여러 사본을 파쇄하고 조각이 겹쳐서 한 사람이 떠나고 다른 곳을 쉽게 볼 수 있습니다.
그러나 그것을 훨씬 더 어렵게 만드는 것은 반복적 인 말도 안되는 말로 가득 찬 책의 많은 부분입니다. 같은 단어는 수백 또는 수천 번 반복되었습니다. 전형적인 포유류 게놈의 절반 이상은 이러한 반복적 인 서열로 구성되며, 그 중 일부는 규제 기능 그리고 다른 사람들은 “정크”DNA 그것은 고대 유전자 나 바이러스 감염에서 후손이며 더 이상 기능적이지 않습니다. 장기 읽기 기술은 이러한 반복적 인 시퀀스를 처리하는 데 능숙합니다. 소설 셔딩 비유로 돌아가서, 책이 5가 아닌 1 센티미터 제곱 만 조각으로 파쇄 된 후 책을 다시 조립하려고 노력하는 것을 상상해보십시오. 이는 연구자들이 이전에 나이를 사용하여 백만베이스 쌍 DNA 서열을 조립하려고했던 과제와 유사합니다. “짧은 읽기”시퀀싱 기술.
두 가지는 장거리 시퀀싱에 접근합니다
오랫동안 읽기 시퀀싱 시장에는 두 가지 주요 회사가 있습니다.옥스포드 나노 포어 기술 (Ont) 및 캘리포니아 태평양 생명 과학 (Pacbio) – 강렬하게 경쟁합니다. 두 회사는 완전히 다른 시스템을 개발했습니다.
의 마음 Ont의 시스템 2,000 개 이상의 매우 작은 조리개를 함유하는 유량 셀입니다. 나노 포어는 전기 저항성 막에 고정되어 센서 칩에 통합됩니다. 작동 중에, DNA 세그먼트의 각 끝은 헬리 케이스 효소. 전기장을 생성하기 위해 나노 포어를 가로 질러 전압이 적용되고, 필드는 부착 된 어댑터로 DNA를 캡처합니다. 헬리 카제는 이중 가닥 DNA를 풀기 시작하며, DNA 가닥 중 하나가 나노 포어를 통과하고,베이스에 의해 기저부, 다른 하나는 배지로 방출됩니다.
광학 시퀀싱 (Pacific Biosciences)
중합 효소 효소는 DNA 가닥을 복제하여 각 염기를 특수 조작 된 보완 뉴클레오티드에 일치시키고 연결합니다. 뉴클레오티드는 어떤 염기가 연결되어 있는지 식별하는 특징적인 색상으로 빛을 깜박입니다.
각 DNA 가닥은 우물 바닥에서 고정화됩니다.
DNA 가닥이 복제 될 때, 각 기저부는 기초의 특징 인 색상으로 작은 빛을 방출합니다. 빛의 순서는 염기 시퀀스를 나타냅니다.
나노 포어를 통해 가닥을 추진하는 것은 전압입니다. 그것은 약 0.2 볼트에 불과하지만 나노 포어의 너비는 5 나노 미터에 불과하므로 전기장은 미터당 수십만 볼트입니다. “이것은 기공을 통과하는 번개의 섬광과 같습니다.”라고 말합니다. 데이비드 디머기술의 발명가 중 하나. “처음에는 DNA를 튀길 까봐 두려웠지만 주변의 물이 열을 흡수하는 것으로 나타났습니다.”
이러한 종류의 전계 강도는 일반적으로 P를 통해 DNA 기반 분자를 추진합니다. 분석하기에는 너무 빠른 속도로 광석. 그러나 헬리 케이스는 브레이크처럼 작용하여 분자가 한 번에 한 바닥 씩 래칫 운동으로 초당 약 400베이스의 비율로 래치 팅 운동을하게됩니다. 한편, 전기장은 또한 나노 포어를 가로 질러 이온의 흐름을 추진합니다. 이 전류 흐름은 나노 포어에 염기의 존재에 의해 감소되며, 결정적으로 감소의 양은 4 개의 염기, A, T, G 또는 C 중 어느 것이 기공으로 유입되는지에 따라 다릅니다. 결과는 일련의 염기로 빠르게 번역 될 수있는 전기 신호입니다.
나노 포어 시퀀싱 (옥스포드 나노 포어)
헬리 케이스 효소는 압축을 풀고 이중 가닥 DNA를 풀고 하나의 가닥이 나노 포어로 들어갑니다. 효소는 나노 포어를 통해 가닥을 래칫 운동으로 기본으로 공급합니다.
이온 전류는베이스에 따라 특징적인 양으로 감소됩니다. 전류 신호는 염기 시퀀스를 나타냅니다.
Pacbio의 기계는베이스를 식별하는 전자적 수단보다는 광학에 의존합니다. Pacbio의 최신 프로세스Hifi라고 부르는 것은 DNA 세그먼트의 양쪽 끝을 캡핑하고 단일 가닥 루프를 만들기 위해 비대칭으로 시작합니다. 그런 다음 각 루프는 마이크로 칩에 무한한 작은 우물에 배치되며,이 우물 중 2,500 만 명을 가질 수 있습니다. 각 루프에 부착 된 중합 효소 효소가 있는데, 이는 세포가 나눌 때마다 중요한 기능을 제공합니다. 그것은 단일 가닥 DNA에 부착하고 상보 적 염기를 추가하여 사다리의 각 런그를 다시 만듭니다. Pacbio는 자외선에 노출 될 때 특징적인 색상으로 불소화하도록 설계된 4 개의 염기의 특수 버전을 사용합니다.
UV 레이저는 작은 우물의 바닥을 통해 빛나고 상단의 감광도는 폴리머 라제가 DNA 샘플 루프 주위를 돌면서 기본으로 바닥에 따라 희미한 빛의 플래시를 감지합니다. 상향 조치는 초당 약 3의 속도로 일련의 광 플래시가 있으며, 이는 DNA 샘플에서 염기 쌍의 순서를 나타냅니다.
DNA 샘플이 루프로 변환 되었기 때문에 단순히 루프를 돌아 다니면서 더 높은 정확도를 달성하기 위해 전체 프로세스를 반복 할 수 있습니다. Pacbio의 플래그십 Revio Machine은 일반적으로 5-10 개의 패스를 만들어 99.9 %의 중간 정확도를 달성합니다. 아론 벵거회사의 제품 마케팅 담당 수석 이사.
연구자들이 장기 읽기 시퀀싱을 확장하는 방법
그런 종류의 정확성은 싸지 않습니다. Revio 시스템Wenger에 따르면, 각각 2,500 만 개의 우물을 가진 4 개의 칩이 있는데, 이는 약 60 만 달러가 소요됩니다. 무게는 465 킬로그램이며 넓은 가정용 냉장고의 크기입니다. Pacbio는 단일 Revio가 24 시간 동안 약 4 개의 전체 인간 게놈을 게놈 당 $ 1,000 미만으로 시퀀싱 할 수 있다고 말합니다.
ONT는 플래그십 머신의 99 % 이상의 클레임 정확도를 호출합니다. 약속 24. 에 따르면 약 $ 300,000의 비용이 듭니다 로즈마리 싱클레어 도코ONT의 최고 제품 및 마케팅 책임자. ONT Promethion 시스템의 또 다른 장점은 백만 개의 기본 쌍으로 DNA 조각을 처리하는 능력입니다. ONT는 또한 호출 된 엔트리 레벨 시스템을 제공합니다 미니온 MK1D단 $ 3,000. 그것은 서로 위에 쌓인 두 개의 스마트 폰의 크기에 관한 것이며, 랩톱에 연결되어 연구원들에게 현장에 쉽게 묶을 수있는 설정을 제공합니다.
연구자들은 종종 선호도가 강하지 만 최첨단 유전학 실험실에 두 회사의 기계를 장착하는 것은 드문 일이 아닙니다. 예를 들어 바르셀로나의 Centro Nacional de Análisis Genómico에서 연구원들은 Pacbio Revio 기계와 Promethion 24 및 Ont의 Gridion Machines에 액세스 할 수 있습니다.
Cambridge University의 Durbin은 현재 상황에서 많은 상승권을보고 있습니다. “두 회사가있는 것이 매우 좋습니다.”라고 그는 선언합니다. “그들은 시장을 위해 서로 경쟁하고 있습니다.” 그리고 그 경쟁은 의심 할 여지없이 EBP의 후원자들이 결승선을 가로 질러 프로젝트를 얻기 위해 의지하는 기술의 발전을 불러 일으킬 것입니다.
Pacbio의 Wenger는 Revio 시스템을 뒷받침하는 2,500 만 웰 칩이 여전히 200mm 반도체 웨이퍼에 제작되고 있다고 지적합니다. 그는 300mm 웨이퍼와 고급 리소그래피 기술로의 이동으로 인해 웨이퍼 당 더 많은 칩을 얻을 수 있고 시장이 요구하는 경우 각 칩에 수억 개의 우물을 넣을 수 있다고 말했다.
Ont에서 Dokos는 비슷한 수학을 설명합니다. 단일 유량 셀은 이제 2,000 개 이상의 나노 포어로 구성되며 최첨단 Promethion 24 시스템은 24 개의 유량 셀 (또는 48,000 나노 포어 이상)이 병렬로 실행될 수 있습니다. 그러나 미래의 시스템은 시장이 요구한다면 수십만 개의 나노 포어를 가질 수 있다고 그녀는 말했다.
EBP는 이러한 모든 발전이 필요합니다. EBP 이사 Lewin은 7 년 후에 3 단계 이니셔티브 1 단계를 마무리하고 2 단계를 준비하고 있습니다. 2 단계의 목표는 2026 년에서 2030 년 사이에 150,000 개의 게놈을 시퀀싱하는 것입니다. 2 단계의 경우,“우리는 매년 37,500 개의 게놈에 도달해야합니다. “지금 우리는 매년 3,000 명에 가까워지고 있습니다.” 2 단계에서, 시퀀싱 된 게놈 당 비용은 또한 1 단계에서 게놈 당 약 26,000 달러에서 6,100 달러로 감소해야한다. EBP의 공식 로드맵. 이 6,100 달러의 그림에는 시퀀싱뿐만 아니라 샘플링 및 완성 된 게놈을 생산하는 데 필요한 다른 단계와 모든 유전자가 염색체에 할당 된 모든 비용이 포함됩니다.
3 단계는 ante를 훨씬 더 높게 올릴 것입니다. 로드맵은 게놈 당 $ 1,900의 비용으로 2030 년에서 2035 년 사이에 165 만 명 이상의 게놈 서열을 요구합니다. 그들이 그것을 철수 할 수 있다면, 전체 프로젝트는 약 47 억 달러의 비용이 들며, 22 년 전 인간 게놈 만하는 데 드는 것보다 실제 용어로 불과합니다. 지구상의 모든 명명 된 종의 게놈 서열 인 수집 된 모든 데이터는 디지털 스토리지의 1 엑사 바이트 (10 억 기가 바이트)가 약간 넘는 것을 차지할 것입니다.
그것은 모든 과학에서 가장 귀중한 엑사 바이트 일 것입니다. “이 게놈 데이터를 통해 우리는 다윈이 오래 전에 물었던 질문 중 하나를 얻을 수 있습니다. 즉, 종의 기원은 무엇입니까? 종의 기원은 무엇입니까? 그게 그가 실제로 질문에 대답하지 않은 그의 유명한 책입니다.” Mark BlaxterCambridge 근처의 Wellcome Sanger Institute에서 Darwin Tree of Life 프로젝트를 이끌고 Project Psyche를 고안하고 시작한 사람. “우리는 종을 만드는 것이 무엇인지, 그리고 종이 서로 구별되는지에 대해 훨씬 더 나은 아이디어를 얻을 것입니다.”
그 지식의 일부는 이탈리아 알프스의 여름 밤에 수집 된 많은 나방에서 나올 것입니다. Lepidoptera는“약 3 억 년 동안 돌아갑니다”라고 말합니다 샬럿 라이트Project Psyche의 Blaxter와 함께 공동 리더. 수많은 종의 게놈을 분석하면 Lepidoptera의 일부 가지가 다른 종보다 훨씬 더 많은 종을 진화시킨 이유를 설명하는 데 도움이 될 것이라고 그녀는 말합니다.
그리고 이러한 종류의 지식은 결국 진화와 그것이 행동하는 메커니즘에 대한 생물학의 가장 심오한 질문에 대한 답변으로 축적되어야합니다. Wright는“놀라운 것은 유럽의 모든 레피도 테라를 위해이 작업을 수행함으로써 개별 사례에 대해 배우는 것이 아니라는 것입니다. “우리는 모든 것을 배웠습니다.”