메타게노믹스
나노포어 시퀀싱을 사용하여 미생물군집에서 완전하고 폐쇄된 박테리아 게놈을 추출합니다.
나노포어 시퀀싱 |메타게노믹스 |잡지 |박테리아 게놈 순환화 |장내 미생물총
하이라이트
1. 본 연구에서는 긴 DNA 단편을 추출하는 새로운 방법이 제시되었으며, 이는 300mg의 대변에서 장기 판독 시퀀싱에 적합한 마이크로그램의 순수 HMW DNA를 추출하는 데 성공했습니다.
2. 이 연구에서는 MAG가 긴 읽기로 조립되고 짧은 읽기로 수정되는 조립 워크플로우인 선반이 도입되었습니다.
3.선반은 모의혼합으로 평가하였다.12개의 박테리아 중 7개가 성공적으로 단일 콘티그로 조립되었고 3개는 4개 이하의 콘티그로 조립되었습니다.
4. Lathe를 대변 샘플에 추가로 적용하여 Prevotella copri 및 후보 Cibiobacter sp.를 포함한 20개의 원형 게놈을 생성했습니다., 이는 이동성 유전 요소가 풍부한 것으로 알려져 있습니다.
주요 성과
HWM DNA 추출 프로토콜
Long-read sequencing 기반의 장 metagenomic 연구는 오랫동안 대변에서 고분자량(HMW) DNA를 추출할 때 어려움을 겪어 왔습니다.본 연구에서는 전통적인 방법에서 비드 비트에 의한 광범위한 전단을 방지하기 위해 효소 기반 추출 프로토콜이 도입되었습니다.다음 그림에서 볼 수 있듯이, 세포벽을 분해하기 위해 용해효소, MetaPolyzyme 등의 효소 칵테일을 먼저 샘플에 처리했습니다.방출된 DNA는 페놀-클로로포름 시스템으로 추출한 후 Proteinase K 및 RNase A 분해, 컬럼 기반 정제 및 SPRI 크기 선택을 수행했습니다.이 방법은 300m의 대변에서 마이크로그램의 HMW DNA를 산출했으며, 이는 품질과 수량 측면에서 장기 판독 시퀀싱 요구 사항을 충족합니다.
그림 1. HWM DNA 추출 방식
선반의 계획 흐름
Lathe에는 다음 그림과 같이 기존의 Guppy를 이용한 raw basecalling 프로세스가 포함되어 있습니다.그런 다음 Flye와 Canu가 두 개의 긴 판독 어셈블리를 별도로 생산한 후 잘못된 어셈블리를 감지하고 제거합니다.두 개의 하위 어셈블리가 Quickmerge로 병합됩니다.병합 시 메가베이스 수준의 대규모 어셈블리에 대한 순환화가 검사됩니다.그 후, 이러한 어셈블리에 대한 합의 개선은 짧은 읽기를 통해 처리됩니다.최종 조립된 박테리아 게놈은 최종 조립 오류 감지 및 제거를 위해 처리됩니다.
그림 2. 선반 조립의 흐름도
모의 박테리아 혼합물을 이용한 선반 평가
그람 양성균과 그람 음성균을 모두 포함하는 표준 ATCC 12종 혼합물을 사용하여 MAG 조립에서 나노기공 시퀀싱 플랫폼과 선반의 성능을 평가했습니다.N50이 5.9kb인 nanopore 플랫폼에 의해 총 30.3Gb 데이터가 생성되었습니다.선반은 조립 N50을 다른 긴 판독 조립 도구에 비해 1.6~4배, 하이브리드 조립 도구에 비해 2~9배로 크게 향상시켰습니다.12개의 박테리아 게놈 중 7개가 단일 콘티그로 조립되었습니다(그림 3. 검은 점이 있는 Circos).3개 이상이 4개 이하의 콘티그로 조립되었으며, 가장 불완전한 어셈블리는 단일 콘티그에 게놈의 83%를 포함했습니다.
그림 3. 정의된 12종 박테리아 혼합물의 게놈 어셈블리
대변 샘플에 선반 적용
이 방법은 유기체 식별 및 어셈블리 연속성을 기존 방법, 읽기-클라우드 및 짧은 읽기 기반 분석과 비교하기 위해 인간 대변 샘플에 추가로 적용되었습니다.관련된 세 가지 샘플에서 새로운 효소 기반 추출을 통해 입력 질량 300mg당 최소 1μg이 생성되었습니다.이들 HMW DNA의 나노포어 시퀀싱은 각각 4.7kb, 3.0kb 및 3.0kb의 N50을 갖는 긴 판독을 생성했습니다.특히, 본 방법은 기존 방법에 비해 미생물 검출에 있어서 큰 잠재력을 보였다.짧은 읽기 및 읽기 클라우드에 비해 상대적으로 더 높은 종 수준의 알파 다양성이 여기에 표시되었습니다.더욱이, 짧은 판독 분석의 모든 속, 심지어 일반적으로 용해 저항성 그람 양성 유기체도 이 방법으로 회수되었습니다.
그림 4. Nanopore, 짧은 읽기 및 읽기-클라우드 방법으로 결정된 알파 다양성 및 분류학적 구성 요소
선반은 원시 데이터 입력량이 3~6배 낮음에도 불구하고 짧은 읽기 및 클라우드 읽기 어셈블리보다 훨씬 긴 전체 어셈블리 N50을 생성했습니다.초안 게놈은 완전성, 오염, 단일 복사본 핵심 유전자 등에 따라 초안을 "고품질" 또는 "부분"으로 분류하는 연속 비닝(contig binning)으로 생성되었습니다. 긴 읽기 어셈블리는 비교하여 저렴한 비용으로 훨씬 더 높은 연속성을 보여주었습니다. 짧은 읽기 및 읽기 클라우드.
그림 5. 각 방법의 유기체별 조립 연속성
더욱이, 현재의 조립 접근법은 닫힌 원형 게놈을 생성할 수 있습니다.대변 샘플에서는 8개의 고품질 단일 콘티그 게놈이 조립되었으며 이 중 5개는 정확한 원형화를 달성했습니다.장기 읽기 접근법은 또한 게놈의 반복적 요소를 해결하는 데 있어 인상적인 능력을 보여주었습니다.순환화P. 코프리게놈은 높은 수준의 서열 반복을 포함하는 것으로 알려진 이 접근법에 의해 생성되었습니다.짧은 읽기 및 읽기 클라우드에 의한 이 게놈의 최상의 어셈블리는 4800X의 적용 범위에서도 N50 130kb를 초과하지 않았습니다.이러한 높은 카피 수 요소는 짧은 읽기 또는 읽기-클라우드 어셈블리의 한계점에서 종종 발견되는 긴 읽기 접근 방식으로 완전히 해결되었습니다.이 연구에서는 또 다른 닫힌 게놈이 보고되었으며, 이는 최근에 기술된 게놈의 구성원으로 여겨집니다.시비오박터클레이드.이 폐쇄 어셈블리에서는 8.5~65.9kb 범위의 5개 추정 파지가 확인되었습니다.
그림 6. P.copri 및 Cibiobacter sp.의 폐쇄 게놈에 대한 Circos 다이어그램
참조
모스, EL, 마기니, DG, & 바트, AS(2020).나노포어 시퀀싱을 사용하여 미생물군집에서 완전하고 폐쇄된 박테리아 게놈을 추출합니다.자연생명공학,38(6), 701-707.
기술 및 하이라이트 다양한 연구 분야에서 다양한 고처리량 시퀀싱 기술의 최신 성공적인 적용과 실험 설계 및 데이터 마이닝의 뛰어난 아이디어를 공유하는 것을 목표로 합니다.
게시 시간: 2022년 1월 7일