ការបញ្ជូនបន្តនៃហ្សែនទាំងមូល
បំរែបំរួលរចនាសម្ព័ន្ធនៅក្នុងប្រជាជនចិន និងឥទ្ធិពលរបស់វាទៅលើ phenotypes ជំងឺ និងការសម្របខ្លួនរបស់ប្រជាជន
ណាណូប៉ឺ |PacBio |លំដាប់ហ្សែនទាំងមូលឡើងវិញ |ការហៅការផ្លាស់ប្តូររចនាសម្ព័ន្ធ
នៅក្នុងការសិក្សានេះ លំដាប់ Nanopore PromethION ត្រូវបានផ្តល់ដោយ Biomarker Technologies ។
គំនួសពណ៌
នៅក្នុងការសិក្សានេះ ទិដ្ឋភាពទូទៅនៃការប្រែប្រួលរចនាសម្ព័ន្ធ (SVs) នៅក្នុងហ្សែនរបស់មនុស្សត្រូវបានបង្ហាញដោយជំនួយនៃលំដាប់លំដោយដែលបានអានយ៉ាងយូរនៅលើបន្ទះ Nanopore PromethION ដែលធ្វើអោយការយល់ដឹងកាន់តែស៊ីជម្រៅអំពី SVs នៅក្នុង phenotypes ជំងឺ និងការវិវត្តន៍។
ការរចនាពិសោធន៍
គំរូ៖ leukocytes ឈាមផ្នែកខាងក្រៅនៃបុគ្គលចិនដែលមិនពាក់ព័ន្ធចំនួន 405 នាក់ (បុរស 206 នាក់ និងស្ត្រី 199 នាក់) ជាមួយនឹង 68 phenotypic និងវិធានការព្យាបាល។ក្នុងចំណោមបុគ្គលទាំងអស់ តំបន់ដូនតានៃបុគ្គលចំនួន 124 គឺជាខេត្តនៅភាគខាងជើង តំបន់នៃបុគ្គលចំនួន 198 នាក់គឺភាគខាងត្បូង 53 នាក់ជានិរតី និង 30 មិនត្រូវបានគេស្គាល់។
យុទ្ធសាស្ត្របន្តបន្ទាប់គ្នា៖ ការអានលំដាប់ហ្សែនទាំងមូល (LRS) ជាមួយនឹងការអាន Nanopore 1D និង PacBio HiFi អាន។
វេទិកាលំដាប់លំដោយ៖ Nanopore PromethION;PacBio Sequel II
ការហៅការផ្លាស់ប្តូររចនាសម្ព័ន្ធ
រូបភាពទី 1. លំហូរការងារនៃការហៅ និងត្រង SV
សមិទ្ធិផលសំខាន់ៗ
ការរកឃើញ និងសុពលភាពនៃការប្រែប្រួលរចនាសម្ព័ន្ធ
សំណុំកាលបរិច្ឆេទ Nanopore៖ សរុបចំនួន 20.7 Tb clean reads បង្កើតនៅលើ PromethION sequencing platform ដែលសម្រេចបានទិន្នន័យជាមធ្យម 51 Gb ក្នុងមួយគំរូ ប្រហាក់ប្រហែល។17- ដងក្នុងជម្រៅ។
ការតម្រឹមហ្សែនយោង (GRCh38): អត្រាការធ្វើផែនទីជាមធ្យម 94.1% ត្រូវបានសម្រេច។អត្រាកំហុសមធ្យម (12.6%) គឺស្រដៀងគ្នាទៅនឹងការសិក្សាគោលពីមុន (12.6%) (រូបភាព 2b និង 2c)
ការហៅតាមបំរែបំរួលរចនាសម្ព័ន្ធ (SV)៖ អ្នកហៅទូរសព្ទ SV បានអនុវត្តក្នុងការសិក្សានេះរួមមាន Sniffles, NanoVar និង NanoSV។SVs ដែលមានទំនុកចិត្តខ្ពស់ត្រូវបានកំណត់ថាជា SVs ដែលកំណត់ដោយអ្នកហៅទូរសព្ទយ៉ាងហោចណាស់ពីរនាក់ ហើយបានឆ្លងកាត់ការច្រោះតាមជម្រៅ ប្រវែង និងតំបន់។
ជាមធ្យម 18,489 (ចាប់ពី 15,439 ដល់ 22,505) SVs ដែលមានទំនុកចិត្តខ្ពស់ត្រូវបានកំណត់នៅក្នុងគំរូនីមួយៗ។(រូបភាព 2d, 2e និង 2f)
រូបភាពទី 2. ទិដ្ឋភាពរួមនៃ SVs ដែលកំណត់ដោយសំណុំទិន្នន័យ Nanopore
សុពលភាពដោយ PacBio៖ SVs ដែលត្រូវបានកំណត់ក្នុងគំរូមួយ (HG002, កូន) ត្រូវបានផ្ទៀងផ្ទាត់ដោយសំណុំទិន្នន័យ PacBio HiFi ។អត្រារកឃើញមិនពិតសរុប (FDR) គឺ 3.2% ដែលបង្ហាញពីការកំណត់អត្តសញ្ញាណ SV ដែលអាចទុកចិត្តបានដោយ Nanopore អាន។
SVs ដែលមិនប្រើឡើងវិញ និងលក្ខណៈហ្សែន
SVs ដែលមិនប្រើឡើងវិញ៖ សំណុំនៃ 132,312 SVs ដែលមិនប្រើឡើងវិញត្រូវបានទទួលបានដោយការបញ្ចូល SVs នៅក្នុងគំរូទាំងអស់ ដែលរួមមាន 67,405 DELs, 60,182 INSs, 3,956 DUPs និង 769 INVs។(រូបភាពទី 3 ក)
ការប្រៀបធៀបជាមួយសំណុំទិន្នន័យ SV ដែលមានស្រាប់៖ សំណុំទិន្នន័យនេះត្រូវបានប្រៀបធៀបទៅនឹងសំណុំទិន្នន័យ TGS ឬ NGS ដែលបានបោះពុម្ពផ្សាយ។នៅក្នុងសំណុំទិន្នន័យទាំងបួនប្រៀបធៀប LRS15 ដែលជាសំណុំទិន្នន័យតែមួយគត់ពីវេទិកាលំដាប់លំដោយអានវែង (PacBio) បានចែករំលែកការត្រួតគ្នាធំបំផុតជាមួយសំណុំទិន្នន័យនេះ។លើសពីនេះទៅទៀត 53.3% (70,471) នៃ SVs នៅក្នុងសំណុំទិន្នន័យនេះត្រូវបានរាយការណ៍ជាលើកដំបូង។ដោយការរកមើលប្រភេទ SV នីមួយៗ ចំនួន INSs ដែលបានទាញយកមកវិញជាមួយនឹងសំណុំទិន្នន័យដែលបានអានជាលំដាប់វែងគឺធំជាងចំនួនដែលអានខ្លីៗដែលនៅសល់ ដែលបង្ហាញថាលំដាប់ដែលអានយូរគឺមានប្រសិទ្ធភាពជាពិសេសក្នុងការរកឃើញ INSs ។(រូបភាព 3b និង 3c)
រូបភាពទី 3. លក្ខណៈសម្បត្តិនៃ SVs ដែលមិនប្រើឡើងវិញសម្រាប់ប្រភេទ SV នីមួយៗ
លក្ខណៈហ្សែន៖ ចំនួន SVs ត្រូវបានរកឃើញមានទំនាក់ទំនងយ៉ាងសំខាន់ជាមួយនឹងប្រវែងក្រូម៉ូសូម។ការចែកចាយហ្សែន ការធ្វើឡើងវិញ DELs (បៃតង) INS (ពណ៌ខៀវ) DUP (លឿង) និង INV (ពណ៌ទឹកក្រូច) ត្រូវបានបង្ហាញនៅលើដ្យាក្រាម Circos ដែលការកើនឡើងជាទូទៅនៃ SV ត្រូវបានគេសង្កេតឃើញនៅចុងបញ្ចប់នៃដៃក្រូម៉ូសូម។(រូបភាព 3d និង 3e)
ប្រវែងនៃ SVs៖ ប្រវែងនៃ INSs និង DELs ត្រូវបានគេរកឃើញថាខ្លីជាង DUPs និង INVs ដែលយល់ស្របជាមួយនឹងការកំណត់អត្តសញ្ញាណដែលកំណត់ដោយ PacBio HiFi dataset។ប្រវែងនៃ SVs ដែលបានកំណត់អត្តសញ្ញាណទាំងអស់បានបន្ថែមរហូតដល់ 395.6 Mb ដែលកាន់កាប់ 13.2% នៃហ្សែនមនុស្សទាំងមូល។SVs ប៉ះពាល់ដល់ 23.0 Mb (ប្រហែល 0.8%) នៃហ្សែនក្នុងមនុស្សម្នាក់ជាមធ្យម។(រូបភាព 3f និង 3g)
ផលប៉ះពាល់មុខងារ បាតុភូត និងគ្លីនិកនៃ SVs
ការបាត់បង់មុខងារដែលបានព្យាករណ៍ (pLoF) SVs៖ pLoF SVs ត្រូវបានកំណត់ថាជា SVs អន្តរកម្មជាមួយ CDS ដែលការសរសេរកូដ nucleotides ត្រូវបានលុប ឬ ORFs ត្រូវបានផ្លាស់ប្តូរ។សរុបចំនួន 1,929 pLoF SVs ដែលប៉ះពាល់ដល់ CDS នៃហ្សែន 1,681 ត្រូវបានកត់សម្គាល់។នៅក្នុងនោះ ហ្សែនចំនួន 38 បានគូសបញ្ជាក់ពី "ការភ្ជាប់អ្នកទទួល immunoglobulin" នៅក្នុងការវិភាគលើការពង្រឹង GO ។pLoF SVs ទាំងនេះត្រូវបានកត់សម្គាល់បន្ថែមដោយ GWAS, OMIM និង COSMIC រៀងគ្នា។(រូបភាព 4a និង 4b)
Phenotypically និង clinically ពាក់ព័ន្ធ SVs: ចំនួននៃ SV នៅក្នុងសំណុំទិន្នន័យ nanopore ត្រូវបានបង្ហាញថាមាន phenotypically និងទាក់ទងគ្លីនិក។DEL heterozygous ដ៏កម្រនៃ 19.3 kb ដែលត្រូវបានគេស្គាល់ថាបណ្តាលឱ្យអាល់ហ្វា-thalassemia ត្រូវបានគេកំណត់អត្តសញ្ញាណនៅក្នុងបុគ្គលបីនាក់ដែលបានធ្វើឱ្យខូចមុខងារហ្សែននៃ Hemoglobin Subunit Alpha 1 និង 2 (HBA1 និង HBA2) ។DEL មួយផ្សេងទៀតនៃ 27.4 kb លើការសរសេរកូដហ្សែន Hemoglobin Subunit Beta(HBB) ត្រូវបានកំណត់អត្តសញ្ញាណនៅក្នុងបុគ្គលផ្សេងទៀត។SV នេះត្រូវបានគេស្គាល់ថាបណ្តាលឱ្យមាន hemoglobinopathies ធ្ងន់ធ្ងរ។(រូបភាពទី 4 គ)
រូបភាពទី 4. pLoF SVs ដែលទាក់ទងនឹង phenotypes និងជំងឺ
DEL ធម្មតានៃ 2.4 kb ត្រូវបានគេសង្កេតឃើញនៅក្នុង 35 homozygous carriers និង 67 heterozygous carriers ដែលគ្របដណ្តប់តំបន់ពេញលេញនៃ exon ទី 3 នៃ Growth Homone Receptor (GHR) ។ក្រុមហ៊ុនដឹកជញ្ជូន homozygous ត្រូវបានគេរកឃើញថាខ្លីជាង heterzygous (p=0.033) ។(រូបភាពទី 4 ឃ)
លើសពីនេះ SVs ទាំងនេះត្រូវបានដំណើរការសម្រាប់ការសិក្សាវិវត្តន៍ចំនួនប្រជាជនរវាងក្រុមក្នុងតំបន់ពីរ៖ ខាងជើង និងខាងត្បូងនៃប្រទេសចិន។SVs ឌីផេរ៉ង់ស្យែលយ៉ាងសំខាន់ត្រូវបានគេរកឃើញចែកចាយនៅលើ Chr 1, 2, 3, 6,10,12,14 និង 19 ដែលក្នុងនោះកំពូលត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងតំបន់ភាពស៊ាំដូចជា IGH, MHC ជាដើម។ វាសមហេតុផលក្នុងការប៉ាន់ស្មានថា ភាពខុសគ្នានៅក្នុង SVs ទាំងនេះអាចដោយសារតែការរសាត់តាមហ្សែន និងការលាតត្រដាងរយៈពេលវែងចំពោះបរិស្ថានចម្រុះសម្រាប់ប្រជាជនរងនៅក្នុងប្រទេសចិន។
ឯកសារយោង
Wu, Zhikun, et al ។"បំរែបំរួលរចនាសម្ព័ន្ធនៅក្នុងប្រជាជនចិន និងឥទ្ធិពលរបស់វាទៅលើ phenotypes ជំងឺ និងការសម្របខ្លួនរបស់ប្រជាជន។"bioRxiv(២០២១)។
ព័ត៌មាន និងចំណុចសំខាន់ មានគោលបំណងចែករំលែកករណីជោគជ័យចុងក្រោយបង្អស់ជាមួយ Biomarker Technologies ដោយចាប់យកសមិទ្ធិផលវិទ្យាសាស្ត្រប្រលោមលោក ក៏ដូចជាបច្ចេកទេសលេចធ្លោដែលបានអនុវត្តក្នុងអំឡុងពេលសិក្សា។
ពេលវេលាផ្សាយ៖ មករា-០៦-២០២២