RESECVENȚAREA ÎNTREGIULUI GENOM
Variante de structură în populația chineză și impactul acestora asupra fenotipurilor, bolilor și adaptării populației
Nanopore |PacBio |Resecvențierea întregului genom |Apelul de variație structurală
În acest studiu, secvențierea Nanopore PromethION a fost furnizată de Biomarker Technologies.
Repere
În acest studiu, a fost dezvăluit un peisaj general al variațiilor structurale (SV) în genomul uman cu ajutorul secvențierii de lungă durată pe platforma Nanopore PromethION, care aprofundează înțelegerea SV în fenotipuri, boli și evoluție.
Design experimental
Probe: leucocite din sângele periferic de la 405 indivizi chinezi neînrudiți (206 bărbați și 199 femei) cu 68 de măsurători fenotipice și clinice.Dintre toți indivizii, regiunile ancestrale de 124 de indivizi erau provincii din nord, cele de 198 de indivizi erau sud, 53 erau sud-vest și 30 nu erau cunoscute.
Strategia de secvențiere: secvențierea cu citire lungă a întregului genom (LRS) cu citiri Nanopore 1D și citiri PacBio HiFi.
Platformă de secvențiere: Nanopore PromethION;PacBio Sequel II
Apel de variație de structură
Figura 1. Fluxul de lucru al apelării și filtrării SV
Realizari principale
Descoperirea și validarea variațiilor de structură
Setul de date Nanopore: În total, 20,7 Tb de citiri curate generate pe platforma de secvențiere PromethION, obținând o medie de 51 Gb de date per probă, aprox.de 17 ori în adâncime.
Alinierea genomului de referință (GRCh38): a fost atinsă rata medie de cartografiere de 94,1%.Rata medie de eroare (12,6%) a fost similară cu un studiu anterior de evaluare comparativă (12,6%) (Figura 2b și 2c)
Apelarea variației structurii (SV): apelanții SV aplicați în acest studiu au inclus Sniffles, NanoVar și NanoSV.SV de înaltă încredere au fost definite ca SV identificate de cel puțin doi apelanți și au trecut filtre pe adâncime, lungime și regiune.
În fiecare probă au fost identificate o medie de 18.489 (între 15.439 și 22.505) SV cu încredere ridicată.(Figura 2d, 2e și 2f)
Figura 2. Peisajul general al SV-urilor identificate de setul de date Nanopore
Validarea de către PacBio: SV identificate într-un eșantion (HG002, copil) au fost validate de un set de date PacBio HiFi.Rata generală de descoperire falsă (FDR) a fost de 3,2%, ilustrând o identificare SV relativ fiabilă prin citirile Nanopore.
SV neredundante și caracteristici genomice
SV neredundante: Un set de 132.312 SV neredundante au fost obținute prin fuzionarea SV-urilor în toate eșantioanele, care include 67.405 DEL, 60.182 INS, 3.956 DUP și 769 INV.(Figura 3a)
Comparație cu seturile de date SV existente: acest set de date a fost comparat cu setul de date TGS sau NGS publicat.În cadrul celor patru seturi de date comparate, LRS15, care este, de asemenea, singurul set de date de la platforma de secvențiere cu citire lungă (PacBio) a împărtășit cele mai mari suprapuneri cu acest set de date.Mai mult, 53,3% (70.471) dintre SV din acest set de date au fost raportate pentru prima dată.Analizând fiecare tip de SV, numărul de INS recuperate cu un set de date de secvențiere cu citire lungă a fost mult mai mare decât restul celor cu citire scurtă, ceea ce indică faptul că secvențierea cu citire lungă este deosebit de eficientă în detectarea INS.(Figura 3b și 3c)
Figura 3. Proprietățile SV neredundante pentru fiecare tip de SV
Caracteristici genomice: Numărul de SV a fost corelat semnificativ cu lungimea cromozomilor.Distribuția genelor, repetările, DELs (verde), INS (albastru), DUP (galben) și INV (portocaliu) au fost afișate pe o diagramă Circos, unde s-a observat o creștere generală a SV la sfârșitul brațelor cromozomilor.(Figura 3d și 3e)
Lungimea SV: S-a constatat că lungimile INS și DEL sunt semnificativ mai scurte decât cele ale DUP-urilor și INV-urilor, care au fost de acord cu cele identificate de setul de date PacBio HiFi.Lungimea tuturor SV identificate a adăugat până la 395,6 Mb, care a ocupat 13,2% din întregul genom uman.SV au afectat în medie 23,0 Mb (aproximativ 0,8%) de genom per individ.(Figura 3f și 3g)
Impactul funcțional, fenotipic și clinic al SV
Pierderea prevăzută a funcției (pLoF) SV: pLoF SV au fost definite ca SV care au interacționat cu CDS, unde nucleotidele de codificare au fost șterse sau ORF-urile au fost modificate.În total, au fost adnotate 1.929 de SV pLoF care afectează CDS de 1.681 de gene.În cadrul acestora, 38 de gene au evidențiat „legarea la receptorul imunoglobulinei” în analiza de îmbogățire a GO.Aceste SV pLoF au fost adnotate în continuare de GWAS, OMIM și, respectiv, COSMIC.(Figura 4a și 4b)
SV relevante din punct de vedere fenotipic și clinic: un număr de SV din setul de date nanopori s-au dovedit a fi relevante din punct de vedere fenotipic și clinic.Un DEL heterozigot rar de 19,3 kb, cunoscut pentru a provoca alfa-talasemie, a fost identificat la trei indivizi, care au disfuncționat genele subunității hemoglobinei Alpha 1 și 2 (HBA1 și HBA2).Un alt DEL de 27,4 kb pe gena care codifică Hemoglobin Subunit Beta (HBB) a fost identificat la un alt individ.Se știa că acest SV provoacă hemoglobinopatii grave.(Figura 4c)
Figura 4. SV pLoF asociate cu fenotipuri și boli
Un DEL comun de 2,4 kb a fost observat la 35 de purtători homozigoți și 67 de purtători heterozigoți, care acoperă regiunea completă a celui de-al treilea exon al receptorului de homozigoți de creștere (GHR).Purtătorii homozigoți au fost găsiți semnificativ mai scurti decât cei heterozigoți (p=0,033).(Figura 4d)
În plus, aceste SV au fost procesate pentru studii evolutive ale populației între două grupuri regionale: China de Nord și de Sud.S-au găsit SV diferențiate semnificativ distribuite pe Chr 1, 2, 3, 6,10,12,14 și 19, în cadrul cărora, cele de top au fost asociate cu regiuni de imunitate, cum ar fi IGH, MHC, etc. Este rezonabil să se speculeze că diferențierea acestor SV se poate datora derivei genetice și expunerii pe termen lung la diverse medii pentru subpopulații din China.
Referinţă
Wu, Zhikun și colab.„Variantele structurale ale populației chineze și impactul lor asupra fenotipurilor, bolilor și adaptării populației.”bioRxiv(2021).
Știri și Repere își propune să împărtășească cele mai recente cazuri de succes cu Biomarker Technologies, surprinzând realizări științifice noi, precum și tehnici proeminente aplicate în timpul studiului.
Ora postării: 06-ian-2022