KËRKESA E GJENOMIT TË GJITHË
Variantet e strukturës në popullatën kineze dhe ndikimi i tyre në fenotipet, sëmundjet dhe përshtatjen e popullsisë
Nanopore |PacBio |Risekuenca e të gjithë gjenomit |Thirrja e variacionit strukturor
Në këtë studim, sekuenca Nanopore PromethION u sigurua nga Biomarker Technologies.
Pikat kryesore
Në këtë studim, një peizazh i përgjithshëm i variacioneve strukturore (SV) në gjenomën njerëzore u zbulua me ndihmën e sekuencës së lexuar gjatë në platformën Nanopore PromethION, e cila thellon të kuptuarit e SV-ve në fenotipe, sëmundje dhe evolucion.
Dizajn Eksperimental
Mostrat: Leukocite të gjakut periferik të 405 individëve kinezë të palidhur (206 meshkuj dhe 199 femra) me 68 matje fenotipike dhe klinike.Midis të gjithë individëve, rajonet stërgjyshore të 124 individëve ishin provinca në veri, ato të 198 individëve ishin në jug, 53 ishin jugperëndimore dhe 30 nuk njiheshin.
Strategjia e renditjes: Sekuenca e të gjithë gjenomit me lexim të gjatë (LRS) me lexime Nanopore 1D dhe lexime PacBio HiFi.
Platforma e renditjes: Nanopore PromethION;Vazhdimi i PacBio II
Thirrja e variacionit të strukturës
Figura 1. Rrjedha e punës e thirrjes dhe filtrimit të SV
Arritjet kryesore
Zbulimi dhe vërtetimi i variacionit të strukturës
Përcaktimi i datave Nanopore: Në total 20,7 Tb lexime të pastra të gjeneruara në platformën e sekuencës PromethION, duke arritur një mesatare prej 51 Gb të dhëna për mostër, përafërsisht.17-fish në thellësi.
Përafrimi i gjenomit të referencës (GRCh38): Është arritur shkalla mesatare e hartës prej 94.1%.Shkalla mesatare e gabimit (12.6%) ishte e ngjashme me një studim të mëparshëm të krahasimit (12.6%) (Figura 2b dhe 2c)
Thirrja e variacionit të strukturës (SV): Telefonuesit SV të aplikuar në këtë studim përfshinin Sniffles, NanoVar dhe NanoSV.SV-të me besim të lartë u përcaktuan si SV-të e identifikuara nga të paktën dy telefonues dhe kaluan filtrim në thellësi, gjatësi dhe rajon.
Një mesatare prej 18,489 (duke filluar nga 15,439 në 22,505) SV me besim të lartë u identifikuan në çdo kampion.(Figura 2d, 2e dhe 2f)
Figura 2. Peizazhi i përgjithshëm i SV-ve të identifikuara nga grupi i të dhënave Nanopore
Vleresimi nga PacBio: SV-të e identifikuara në një kampion (HG002, fëmijë) u vërtetuan nga një grup i të dhënave HiFi PacBio.Shkalla e përgjithshme e zbulimit të rremë (FDR) ishte 3.2%, duke ilustruar një identifikim relativisht të besueshëm të SV nga leximet e Nanopore.
SV-të jo të tepërta dhe veçoritë gjenomike
SV jo të tepërta: Një grup prej 132,312 SV jo të tepërta u përftuan duke bashkuar SV-të në të gjitha mostrat, që përfshin 67,405 DEL, 60,182 INS, 3,956 DUP dhe 769 INV.(Figura 3a)
Krahasimi me grupet ekzistuese të të dhënave SV: Ky grup të dhënash u krahasua me të dhënat e publikuara TGS ose NGS.Brenda katër grupeve të të dhënave të krahasuara, LRS15, i cili është gjithashtu i vetmi grup i të dhënave nga platforma e sekuencës së lexuar gjatë (PacBio) ndau mbivendosjet më të mëdha me këtë grup të dhënash.Për më tepër, 53.3% (70,471) e SV-ve në këtë grup të dhënash u raportuan për herë të parë.Duke parë çdo lloj SV, numri i INS-ve të rikuperuara me grup të dhënash të sekuencës së lexuar gjatë ishte shumë më i madh se ato të tjera të lexuara shkurt, duke treguar se sekuenca e lexuar gjatë është veçanërisht efikase në zbulimin e INS-ve.(Figura 3b dhe 3c)
Figura 3. Vetitë e SV-ve jo të tepërta për çdo lloj SV
Karakteristikat gjenomike: Numri i SV-ve u gjet i lidhur ndjeshëm me gjatësinë e kromozomeve.Shpërndarja e gjeneve, përsëritjet, DELs (jeshile), INS (blu), DUP (e verdhë) dhe INV (portokalli) u shfaqën në një diagramë Circos, ku një rritje e përgjithshme në SV u vu re në fund të krahëve të kromozomeve.(Figura 3d dhe 3e)
Gjatësia e SV-ve: Gjatësitë e INS-ve dhe DEL-ve u gjetën të jenë dukshëm më të shkurtra se ato të DUP-ve dhe INV-ve, të cilat pajtoheshin me ato të identifikuara nga grupi i të dhënave PacBio HiFi.Gjatësia e të gjitha SV-ve të identifikuara u shtua deri në 395.6 Mb, e cila zinte 13.2% të të gjithë gjenomit njerëzor.SV-të prekën mesatarisht 23,0 Mb (afërsisht 0,8%) gjenom për individ.(Figura 3f dhe 3g)
Ndikimet funksionale, fenotipike dhe klinike të SV-ve
Humbja e parashikuar e funksionit (pLoF) SV: PLoF SV u përcaktuan si SV të ndërvepruara me CDS, ku nukleotidet koduese u fshinë ose ORF-të u ndryshuan.Në total u shënuan 1,929 pLoF SV që prekin CDS të 1,681 gjeneve.Brenda tyre, 38 gjene theksuan "lidhjen e receptorit të imunoglobulinës" në analizën e pasurimit të GO.Këto pLoF SV u shënuan më tej nga GWAS, OMIM dhe COSMIC, respektivisht.(Figura 4a dhe 4b)
SV-të e rëndësishme fenotipike dhe klinike: Një numër i SV-ve në grupin e të dhënave nanopore u tregua të jetë i rëndësishëm fenotipisht dhe klinikisht.Një DEL heterozigot i rrallë prej 19.3 kb, i njohur si shkaktar alfa-talasemi, u identifikua në tre individë, të cilët disfunksiononin gjenet e nën-njësisë së hemoglobinës Alfa 1 dhe 2 (HBA1 dhe HBA2).Një tjetër DEL prej 27.4 kb në gjen kodues të Nën-njësisë së Hemoglobinës Beta (HBB) u identifikua në një individ tjetër.Ky SV dihej se shkakton hemoglobinopati serioze.(Figura 4c)
Figura 4. PLoF SV të lidhura me fenotipet dhe sëmundjet
Një DEL i zakonshëm prej 2.4 kb u vu re në 35 bartës homozigotë dhe 67 heterozigotë, i cili mbulon rajonin e plotë të ekzonit të tretë të Receptorit të Homonit të Rritjes (GHR).Transportuesit homozigotë u gjetën dukshëm më të shkurtër se ata heterzigotë (p=0.033).(Figura 4d)
Për më tepër, këto SV u përpunuan për studime evolucionare të popullsisë midis dy grupeve rajonale: Kinës Veriore dhe Jugore.SV-të dukshëm diferenciale u gjetën të shpërndara në Chr 1, 2, 3, 6,10,12,14 dhe 19, brenda të cilave, ato më të lartat ishin të lidhura me rajonet e imunitetit, si IGH, MHC, etj. Është e arsyeshme të spekulohet se diferencimi në këto SV mund të jetë për shkak të zhvendosjes gjenetike dhe ekspozimit afatgjatë ndaj mjediseve të ndryshme për nën-popullatat në Kinë.
Referenca
Wu, Zhikun, etj."Variantet strukturore në popullatën kineze dhe ndikimi i tyre në fenotipet, sëmundjet dhe përshtatjen e popullsisë."bioRxiv(2021).
Lajme dhe pika kryesore synon të ndajë rastet më të fundit të suksesshme me Biomarker Technologies, duke kapur arritjet e reja shkencore si dhe teknikat e spikatura të aplikuara gjatë studimit.
Koha e postimit: Jan-06-2022