RESEQUENCING GENOME
Varian struktur ing populasi Cina lan pengaruhe marang fenotipe, penyakit lan adaptasi populasi
Nanopore |PacBio |Kabeh genome re-sequencing |Panggilan variasi struktural
Ing panliten iki, urutan Nanopore PromethION diwenehake dening Biomarker Technologies.
Sorotan
Ing panliten iki, lanskap sakabèhé variasi struktural (SVs) ing génom manungsa dicethakaké kanthi bantuan urutan sing dawa diwaca ing platfrom Nanopore PromethION, sing nambah pemahaman babagan SV ing fenotipe, penyakit lan evolusi.
Desain Eksperimental
Sampel: Leukosit getih perifer saka 405 individu Cina sing ora ana hubungane (206 lanang lan 199 wadon) kanthi 68 pangukuran fenotipik lan klinis.Ing antarane kabeh individu, wilayah leluhur saka 124 individu minangka provinsi ing Lor, sing saka 198 individu ana ing Kidul, 53 ing Kulon Kidul lan 30 ora dingerteni.
Strategi sekuensing: Sekuensing diwaca dawa genom (LRS) kanthi maca Nanopore 1D lan maca PacBio HiFi.
Platform urutan: Nanopore PromethION;PacBio Sekuel II
Panggilan Variasi Struktur
Figure 1. Workflow saka SV nelpon lan nyaring
Prestasi Utama
Penemuan lan validasi variasi struktur
Nanopore dateset: Total 20.7 Tb wacan sing resik digawe ing platform urutan PromethION, entuk rata-rata 51 Gb data saben sampel, kira-kira.17-fold ing ambane.
Penyelarasan genom referensi (GRCh38): Tingkat pemetaan rata-rata 94,1% wis digayuh.Tingkat kesalahan rata-rata (12.6%) padha karo studi benchmarking sadurunge (12.6%) (Gambar 2b lan 2c)
Panggilan variasi struktur (SV): Panggilan SV sing ditrapake ing panliten iki kalebu Sniffles, NanoVar lan NanoSV.SV kapercayan dhuwur ditetepake minangka SV sing diidentifikasi paling ora rong panelpon lan ngliwati filtrasi ing ambane, dawa lan wilayah.
Rata-rata 18,489 (saka 15,439 nganti 22,505) SV sing duwe kapercayan dhuwur diidentifikasi ing saben sampel.(Gambar 2d, 2e lan 2f)
Gambar 2. Lanskap sakabèhé saka SVs dikenali dening Nanopore dataset
Validasi dening PacBio: SV sing diidentifikasi ing siji sampel (HG002, bocah) divalidasi dening dataset PacBio HiFi.Tingkat penemuan palsu (FDR) sakabèhé yaiku 3.2%, nggambarake identifikasi SV sing relatif dipercaya dening Nanopore maca.
SVs non-keluwih lan fitur genomik
SV non-keluwih: A pesawat saka 132.312 SV ora keluwih dipikolehi kanthi nggabungake SV ing kabeh conto, kang kalebu 67.405 DEL, 60.182 INS, 3.956 DUP lan 769 INV.(Gambar 3a)
Perbandingan karo set data SV sing wis ana: Set data iki dibandhingake karo set data TGS utawa NGS sing diterbitake.Ing patang set data sing dibandhingake, LRS15, sing uga dadi siji-sijine set data saka platform sekuensing sing wis suwe diwaca (PacBio) nuduhake tumpang tindih paling gedhe karo set data iki.Kajaba iku, 53,3% (70,471) SV ing set data iki dilaporake pisanan.Kanthi nliti saben jinis SV, jumlah INS sing wis dibalekake kanthi set data urutan sing dawa diwaca luwih gedhe tinimbang liyane sing diwaca kanthi cekak, nuduhake yen urutan sing diwaca kanthi dawa luwih efisien ing deteksi INS.(Gambar 3b lan 3c)
Figure 3. Properties SVs non-keluwih kanggo saben jinis SV
Fitur genomik: Jumlah SV ditemokake sacara signifikan hubungane karo dawa kromosom.Distribusi gen, mbaleni, DELs (ijo), INS (biru), DUP (kuning) lan INV (oranye) ditampilake ing diagram Circos, ngendi Tambah umum ing SV diamati ing mburi tangan kromosom.(Gambar 3d lan 3e)
Dawane SV: Dawane INS lan DEL ditemokake luwih cendhek tinimbang DUP lan INV, sing sarujuk karo sing diidentifikasi dening dataset PacBio HiFi.Dawane kabeh SV sing diidentifikasi ditambahake nganti 395.6 Mb, sing manggoni 13.2% saka kabeh genom manungsa.SV kena pengaruh 23,0 Mb (kira-kira 0,8%) genom saben individu kanthi rata-rata.(Gambar 3f lan 3g)
Dampak fungsional, fenotipik lan klinis saka SV
Prediksi mundhut fungsi (pLoF) SVs: pLoF SVs ditetepake minangka SVs sesambungan karo CDS, ngendi nukleotida coding dibusak utawa ORFs diganti.Gunggunge 1,929 pLoF SV sing mengaruhi CDS saka 1,681 gen dianotasi.Ing jerone, 38 gen nyorot "ikatan reseptor imunoglobulin" ing analisis pengayaan GO.SV pLoF iki luwih dianotasi dening GWAS, OMIM lan COSMIC, masing-masing.(Gambar 4a lan 4b)
SVs phenotypically lan klinis cocog: Sawetara SV ing dataset nanopore dituduhake phenotypically lan klinis cocog.DEL heterozigot langka 19.3 kb, sing dikenal nyebabake talasemia alfa, diidentifikasi ing telung individu, sing ngganggu gen Hemoglobin Subunit Alpha 1 lan 2 (HBA1 lan HBA2).DEL liyane 27.4 kb ing gen coding Hemoglobin Subunit Beta (HBB) diidentifikasi ing individu liyane.SV iki dikenal kanggo nimbulaké hemoglobinopathies serius.(Gambar 4c)
Gambar 4. pLoF SVs sing digandhengake karo fenotipe lan penyakit
DEL umum 2.4 kb diamati ing 35 homozigot lan 67 operator heterozigot, sing nyakup wilayah lengkap saka ekson kaping 3 saka Reseptor Homon Pertumbuhan (GHR).Operator homozigot ditemokake luwih cendhak tinimbang sing heterzigot (p=0.033).(Gambar 4d)
Salajengipun, SVs iki diproses kanggo studi evolusi populasi antarane rong klompok regional: China Lor lan Kidul.SV diferensial sing signifikan ditemokake sing disebarake ing Chr 1, 2, 3, 6,10,12,14 lan 19, ing ngendi, sing paling dhuwur digandhengake karo wilayah kekebalan, kayata IGH, MHC, lan liya-liyane. diferensiasi ing SV iki bisa amarga drift genetis lan long-term mbabarake envronments warna kanggo sub-populasi ing China.
Referensi
Wu, Zhikun, et al."Varian struktural ing populasi Cina lan pengaruhe marang fenotipe, penyakit lan adaptasi populasi."bioRxiv(2021).
News lan Highlights ngarahake nuduhake kasus sukses paling anyar karo Biomarker Technologies, njupuk prestasi ilmiah novel uga teknik penting sing ditrapake sajrone sinau.
Wektu kirim: Jan-06-2022