SELURUH GENOME RESEQUENCING
Varian struktur dalam populasi Cina dan kesannya terhadap fenotip, penyakit dan penyesuaian populasi
Nanopore |PacBio |Penjujukan semula genom keseluruhan |Panggilan variasi struktur
Dalam kajian ini, penjujukan Nanopore PromethION telah disediakan oleh Biomarker Technologies.
Sorotan
Dalam kajian ini, landskap keseluruhan variasi struktur (SV) dalam genom manusia telah didedahkan dengan bantuan penjujukan yang dibaca lama pada platfrom Nanopore PromethION, yang memperdalam pemahaman SV dalam fenotip, penyakit dan evolusi.
Reka bentuk eksperimen
Sampel: Leukosit darah periferi daripada 405 individu Cina yang tidak berkaitan (206 lelaki dan 199 perempuan) dengan 68 ukuran fenotip dan klinikal.Di antara semua individu, wilayah nenek moyang 124 individu adalah wilayah di Utara, 198 individu adalah Selatan, 53 adalah Barat Daya dan 30 tidak diketahui.
Strategi penjujukan: Penjujukan genom baca lama(LRS) keseluruhan dengan bacaan Nanopore 1D dan bacaan PacBio HiFi.
Platform penjujukan: Nanopore PromethION;Sekuel PacBio II
Panggilan Variasi Struktur
Rajah 1. Aliran kerja panggilan dan penapisan SV
Pencapaian Utama
Penemuan dan pengesahan variasi struktur
Set tarikh Nanopore: Secara keseluruhan 20.7 Tb bacaan bersih dijana pada platform penjujukan PromethION, mencapai purata 51 Gb data bagi setiap sampel, lebih kurang.Kedalaman 17 kali ganda.
Penjajaran genom rujukan(GRCh38): Purata kadar pemetaan 94.1% telah dicapai.Kadar ralat min (12.6%) adalah serupa dengan kajian penandaarasan sebelumnya (12.6%) (Rajah 2b dan 2c)
Panggilan variasi struktur(SV): Pemanggil SV yang digunakan dalam kajian ini termasuk Sniffles, NanoVar dan NanoSV.SV berkeyakinan tinggi ditakrifkan sebagai SV yang dikenal pasti oleh sekurang-kurangnya dua pemanggil dan lulus penapisan pada kedalaman, panjang dan rantau.
Purata 18,489 (antara 15,439 hingga 22,505) SV berkeyakinan tinggi telah dikenal pasti dalam setiap sampel.(Rajah 2d, 2e dan 2f)
Rajah 2. Landskap keseluruhan SV yang dikenal pasti oleh dataset Nanopore
Pengesahan oleh PacBio: SV yang dikenal pasti dalam satu sampel (HG002, kanak-kanak) telah disahkan oleh set data PacBio HiFi.Kadar penemuan palsu (FDR) keseluruhan ialah 3.2%, menggambarkan pengenalan SV yang agak boleh dipercayai oleh bacaan Nanopore.
SV tidak berlebihan dan ciri genomik
SV tidak lewah: Satu set 132,312 SV tidak lewah diperoleh dengan menggabungkan SV dalam semua sampel, yang merangkumi 67,405 DEL, 60,182 INS, 3,956 DUP dan 769 INV.(Rajah 3a)
Perbandingan dengan set data SV sedia ada: Set data ini dibandingkan dengan set data TGS atau NGS yang diterbitkan.Dalam empat set data yang dibandingkan, LRS15, yang juga merupakan satu-satunya set data daripada platform penjujukan yang dibaca lama (PacBio) berkongsi pertindihan terbesar dengan set data ini.Selain itu, 53.3%(70,471) SV dalam set data ini dilaporkan buat kali pertama.Dengan melihat ke dalam setiap jenis SV, bilangan INS yang dipulihkan dengan set data penjujukan bacaan lama adalah jauh lebih besar daripada penjujukan bacaan pendek yang lain, menunjukkan bahawa penjujukan bacaan lama sangat cekap dalam pengesanan INS.(Rajah 3b dan 3c)
Rajah 3. Sifat SV tidak berlebihan untuk setiap jenis SV
Ciri genom: Bilangan SV didapati berkorelasi dengan ketara dengan panjang kromosom.Taburan gen, ulangan, DEL (hijau), INS (biru), DUP (kuning) dan INV (oren) dipaparkan pada rajah Circos, di mana peningkatan umum dalam SV diperhatikan pada hujung lengan kromosom.(Rajah 3d dan 3e)
Panjang SV: Panjang INS dan DEL didapati jauh lebih pendek daripada DUP dan INV, yang bersetuju dengan yang dikenal pasti oleh set data PacBio HiFi.Panjang semua SV yang dikenal pasti ditambah sehingga 395.6 Mb, yang menduduki 13.2% daripada keseluruhan genom manusia.SV menjejaskan 23.0 Mb(lebih kurang 0.8%) genom setiap individu secara purata.(Rajah 3f dan 3g)
Kesan fungsional, fenotip dan klinikal SV
SVs kehilangan fungsi (pLoF) yang diramalkan: SV pLoF ditakrifkan sebagai SV yang berinteraksi dengan CDS, di mana nukleotida pengekodan telah dipadamkan atau ORF telah diubah.Sebanyak 1,929 pLoF SV yang mempengaruhi CDS sebanyak 1,681 gen telah diberi anotasi.Di dalamnya, 38 gen menyerlahkan "pengikatan reseptor imunoglobulin" dalam analisis pengayaan GO.SV pLoF ini masing-masing diberi anotasi oleh GWAS, OMIM dan COSMIC.(Rajah 4a dan 4b)
SV yang berkaitan secara fenotip dan klinikal: Sebilangan SV dalam dataset nanopore ditunjukkan sebagai fenotipikal dan klinikal yang berkaitan.DEL heterozigot yang jarang berlaku sebanyak 19.3 kb, diketahui menyebabkan talasemia alfa, telah dikenal pasti dalam tiga individu, yang menyebabkan gen tidak berfungsi Hemoglobin Subunit Alpha 1 dan 2 ( HBA1 dan HBA2).Satu lagi DEL sebanyak 27.4 kb pada pengekodan gen Hemoglobin Subunit Beta(HBB) telah dikenal pasti dalam individu lain.SV ini diketahui menyebabkan hemoglobinopati yang serius.(Rajah 4c)
Rajah 4. pLoF SV yang dikaitkan dengan fenotip dan penyakit
DEL biasa sebanyak 2.4 kb diperhatikan dalam 35 homozigot dan 67 pembawa heterozigot, yang meliputi kawasan lengkap exon ke-3 Reseptor Homon Pertumbuhan (GHR).Pembawa homozigot didapati jauh lebih pendek daripada pembawa heterzigot (p=0.033).(Rajah 4d)
Tambahan pula, SV ini diproses untuk kajian evolusi populasi antara dua kumpulan serantau: China Utara dan Selatan.SV pembezaan yang ketara didapati diedarkan pada Chr 1, 2, 3, 6,10,12,14 dan 19, di mana, yang teratas dikaitkan dengan kawasan imuniti, seperti IGH, MHC, dll. Adalah munasabah untuk membuat spekulasi bahawa pembezaan dalam SV ini mungkin disebabkan oleh hanyutan genetik dan pendedahan jangka panjang kepada persekitaran yang pelbagai untuk sub-populasi di China.
Rujukan
Wu, Zhikun, et al."Varian struktur dalam populasi Cina dan kesannya terhadap fenotip, penyakit dan penyesuaian populasi."bioRxiv(2021).
Berita dan Sorotan bertujuan untuk berkongsi kes-kes kejayaan terbaharu dengan Biomarker Technologies, menangkap pencapaian saintifik novel serta teknik menonjol yang digunakan semasa kajian.
Masa siaran: Jan-06-2022