RESECUENCIA DE TODO O XENOMA
Variantes de estrutura na poboación chinesa e o seu impacto nos fenotipos, enfermidades e adaptación da poboación
Nanopore |PacBio |Resecuenciación do xenoma completo |Convocatoria de variación estrutural
Neste estudo, Biomarker Technologies proporcionou a secuenciación de Nanopore PromethION.
Destacados
Neste estudo, revelouse unha paisaxe global de variacións estruturais (SV) no xenoma humano coa axuda da secuenciación de lectura longa na plataforma Nanopore PromethION, que afonda na comprensión dos SV en fenotipos, enfermidades e evolución.
Deseño Experimental
Mostras: leucocitos de sangue periférico de 405 individuos chineses non relacionados (206 homes e 199 mulleres) con 68 medicións fenotípicas e clínicas.Entre todos os individuos, as rexións ancestrais de 124 individuos eran provincias do norte, as de 198 individuos eran o sur, 53 eran o suroeste e 30 eran descoñecidas.
Estratexia de secuenciación: secuenciación de lectura longa de todo o xenoma (LRS) con lecturas Nanopore 1D e lecturas PacBio HiFi.
Plataforma de secuenciación: Nanopore PromethION;PacBio Sequel II
Convocatoria de variación de estrutura
Figura 1. Fluxo de traballo de chamadas e filtrado de SV
Principais Logros
Descubrimento e validación de variacións de estrutura
Dataset Nanopore: un total de 20,7 Tb de lecturas limpas xeradas na plataforma de secuenciación PromethION, conseguindo unha media de 51 Gb de datos por mostra, aprox.17 veces de profundidade.
Aliñamento do xenoma de referencia (GRCh38): alcanzouse unha taxa media de cartografía do 94,1%.A taxa de erro media (12,6%) foi similar a un estudo comparativo anterior (12,6%) (Figura 2b e 2c)
Chamadas de variación de estrutura (SV): as chamadas SV aplicadas neste estudo incluíron Sniffles, NanoVar e NanoSV.Os SV de alta confianza definíronse como SV identificados por polo menos dous interlocutores e pasaron filtracións en profundidade, lonxitude e rexión.
Identificáronse unha media de 18.489 SV de alta confianza (entre 15.439 e 22.505) en cada mostra.(Figuras 2d, 2e e 2f)
Figura 2. Paisaxe xeral dos SV identificados polo conxunto de datos de Nanopore
Validación por PacBio: os SV identificados nunha mostra (HG002, fillo) foron validados por un conxunto de datos PacBio HiFi.A taxa global de descubrimento falso (FDR) foi do 3,2%, o que ilustra unha identificación de SV relativamente fiable mediante lecturas de Nanopore.
SVs non redundantes e características xenómicas
SV non redundantes: obtivéronse un conxunto de 132.312 SV non redundantes fusionando SV en todas as mostras, que inclúe 67.405 DEL, 60.182 INS, 3.956 DUP e 769 INV.(Figura 3a)
Comparación cos conxuntos de datos SV existentes: comparouse este conxunto de datos co conxunto de datos publicados de TGS ou NGS.Dentro dos catro conxuntos de datos comparados, LRS15, que tamén é o único conxunto de datos da plataforma de secuenciación de lectura longa (PacBio), compartiu as maiores superposicións con este conxunto de datos.Ademais, o 53,3% (70.471) dos SV deste conxunto de datos foron informados por primeira vez.Ao analizar cada tipo de SV, o número de INS recuperados cun conxunto de datos de secuenciación de lectura longa foi moito maior que os restantes de lectura curta, o que indica que a secuenciación de lectura longa é particularmente eficiente na detección de INS.(Figura 3b e 3c)
Figura 3. Propiedades dos SV non redundantes para cada tipo de SV
Características xenómicas: o número de SVs atopouse significativamente correlacionado coa lonxitude do cromosoma.A distribución de xenes, repeticións, DELs (verde), INS (azul), DUP (amarelo) e INV (laranxa) mostráronse nun diagrama de Circos, onde se observou un aumento xeral de SV ao final dos brazos cromosómicos.(Figuras 3d e 3e)
Lonxitude dos SV: descubriuse que as lonxitudes dos INS e DELs eran significativamente máis curtas que as dos DUP e INV, que concordaban coas identificadas polo conxunto de datos PacBio HiFi.A lonxitude de todos os SV identificados sumou 395,6 Mb, o que ocupaba o 13,2% de todo o xenoma humano.Os SV afectaron de media 23,0 Mb (aprox. 0,8%) de xenoma por individuo.(Figura 3f e 3g)
Impactos funcionais, fenotípicos e clínicos dos SV
SVs de perda prevista de función (pLoF): os SV de pLoF definíronse como SV que interactuaban con CDS, onde se eliminaban os nucleótidos codificantes ou se alteraban os ORF.En total anotáronse 1.929 pLoF SVs que afectaban CDS de 1.681 xenes.Dentro destes, 38 xenes destacaron a "unión ao receptor de inmunoglobulina" na análise de enriquecemento de GO.Estes SV pLoF foron anotados por GWAS, OMIM e COSMIC, respectivamente.(Figuras 4a e 4b)
SVs fenotípica e clínicamente relevantes: mostrouse que unha serie de SV no conxunto de datos de nanoporos son fenotípica e clínicamente relevantes.Identificouse un raro DEL heterocigoto de 19,3 kb, coñecido por causar alfa-talasemia, en tres individuos, que disfuncionaban os xenes das subunidades alfa 1 e 2 de hemoglobina (HBA1 e HBA2).Outro DEL de 27,4 kb no xene que codifica a hemoglobina subunidade beta (HBB) identificouse noutro individuo.Sábese que este SV causaba hemoglobinopatías graves.(Figura 4c)
Figura 4. SVs pLoF asociados a fenotipos e enfermidades
Observouse un DEL común de 2,4 kb en 35 portadores homocigotos e 67 heterocigotos, que abarca a rexión completa do 3º exón do Receptor da Homona de Crecemento (GHR).Os portadores homocigotos atopáronse significativamente máis curtos que os heterocigotos (p=0,033).(Figura 4d)
Ademais, estes SV foron procesados para estudos evolutivos da poboación entre dous grupos rexionais: o norte e o sur de China.Atopáronse SV significativamente diferenciais distribuídos en Chr 1, 2, 3, 6,10,12,14 e 19, dentro dos cales, os superiores estaban asociados con rexións de inmunidade, como IGH, MHC, etc. É razoable especular que o A diferenciación destes SV pode deberse á deriva xenética e á exposición a longo prazo a diversos ambientes para subpoboacións en China.
Referencia
Wu, Zhikun, et al."Variantes estruturais na poboación chinesa e o seu impacto nos fenotipos, enfermidades e adaptación da poboación".bioRxiv(2021).
Novidades e Destacados ten como obxectivo compartir os últimos casos exitosos con Biomarker Technologies, capturando novos logros científicos, así como técnicas destacadas aplicadas durante o estudo.
Hora de publicación: Xaneiro-06-2022