ПОЛНОГЕНОМНОЕ РЕСЕКВЕНИРОВАНИЕ
Варианты структуры китайской популяции и их влияние на фенотипы, заболевания и популяционную адаптацию
Нанопор |ПакБио |Полногеномное повторное секвенирование |Вызов структурных вариаций
В этом исследовании секвенирование Nanopore PromethION было предоставлено компанией Biomarker Technologies.
Основные моменты
В этом исследовании общий ландшафт структурных вариаций (SV) в геноме человека был выявлен с помощью длительного секвенирования на платформе Nanopore PromethION, что углубляет понимание SV в фенотипах, заболеваниях и эволюции.
Экспериментальная дизайн
Образцы: лейкоциты периферической крови 405 неродственных китайцев (206 мужчин и 199 женщин) с 68 фенотипическими и клиническими измерениями.Среди всех людей родовые регионы 124 человек были провинциями на севере, у 198 человек - южными, 53 - юго-западными и 30 - неизвестными.
Стратегия секвенирования: полногеномное секвенирование длинного считывания (LRS) с использованием считываний Nanopore 1D и считываний PacBio HiFi.
Платформа для секвенирования: Nanopore PromethION;ПакБио Продолжение II
Вызов изменения структуры
Рисунок 1. Рабочий процесс вызова и фильтрации SV
Главные достижения
Обнаружение и проверка вариаций структуры
Набор дат Nanopore: Всего на платформе секвенирования PromethION было создано в общей сложности 20,7 ТБ чистых считываний, при этом средний объем данных на образец составляет 51 ГБ, прибл.17-кратная глубина.
Выравнивание эталонного генома (GRCh38): была достигнута средняя степень картирования 94,1%.Средняя частота ошибок (12,6%) была аналогична предыдущему сравнительному исследованию (12,6%) (рис. 2b и 2c).
Вызов структурных вариаций (SV): в этом исследовании использовались вызовы SV, включая Sniffles, NanoVar и NanoSV.SV с высокой степенью достоверности определялись как SV, идентифицированные как минимум двумя абонентами и прошедшие фильтрацию по глубине, длине и региону.
В каждой выборке было идентифицировано в среднем 18 489 (в диапазоне от 15 439 до 22 505) SV высокой достоверности.(Рис. 2d, 2e и 2f)
Рисунок 2. Общий ландшафт SV, выявленных с помощью набора данных Nanopore.
Проверка PacBio: SV, идентифицированные в одном образце (HG002, ребенок), были подтверждены набором данных PacBio HiFi.Общий уровень ложного обнаружения (FDR) составил 3,2%, что свидетельствует об относительно надежной идентификации SV с помощью считывания Nanopore.
Неизбыточные SV и геномные особенности
Неизбыточные SV: набор из 132 312 неизбыточных SV был получен путем объединения SV во всех выборках, который включает 67 405 DEL, 60 182 INS, 3956 DUP и 769 INV.(Рисунок 3а)
Сравнение с существующими наборами данных SV: Этот набор данных сравнивался с опубликованным набором данных TGS или NGS.Среди четырех сравниваемых наборов данных LRS15, который также является единственным набором данных с платформы секвенирования длительного чтения (PacBio), имел наибольшее совпадение с этим набором данных.Более того, о 53,3% (70 471) SV в этом наборе данных сообщалось впервые.При рассмотрении каждого типа SV количество восстановленных INS с набором данных секвенирования с длинным считыванием было намного больше, чем с остальными с коротким считыванием, что указывает на то, что секвенирование с длинным считыванием особенно эффективно при обнаружении INS.(Рисунок 3б и 3в)
Рисунок 3. Свойства нерезервированных КА для каждого типа КА
Геномные особенности: Было обнаружено, что количество SV значительно коррелирует с длиной хромосомы.Распределение генов, повторов, DEL (зеленый), INS (синий), DUP (желтый) и INV (оранжевый) были отображены на диаграмме Циркоса, где общее увеличение SV наблюдалось на концах плеч хромосом.(Рис. 3d и 3e)
Длина SV: длины INS и DEL оказались значительно короче, чем длины DUP и INV, что соответствовало длинам, определенным набором данных PacBio HiFi.Длина всех идентифицированных СВ составила 395,6 Мб, что заняло 13,2% всего генома человека.В среднем СВ затронули 23,0 Мб (около 0,8%) генома на человека.(Рис. 3f и 3g)
Функциональные, фенотипические и клинические эффекты СВ
SV с прогнозируемой потерей функции (pLoF): SV pLoF определялись как SV, взаимодействующие с CDS, где кодирующие нуклеотиды были удалены или ORF были изменены.Всего было аннотировано 1929 SV pLoF, влияющих на CDS 1681 гена.Среди них 38 генов выявили «связывание рецепторов иммуноглобулинов» при анализе обогащения ГО.Эти значения pLoF SV были дополнительно аннотированы GWAS, OMIM и COSMIC соответственно.(Рисунок 4а и 4б)
Фенотипически и клинически значимые SV: Было показано, что ряд SV в наборе данных нанопор являются фенотипически и клинически значимыми.Редкая гетерозиготная DEL размером 19,3 т.п.н., которая, как известно, вызывает альфа-талассемию, была выявлена у трех человек, у которых нарушены функции генов субъединицы альфа 1 и 2 гемоглобина (HBA1 и HBA2).Другой DEL размером 27,4 т.п.н. в гене, кодирующем бета-субъединицу гемоглобина (HBB), был идентифицирован у другого человека.Известно, что этот СВ вызывает серьезные гемоглобинопатии.(Рисунок 4в)
Рисунок 4. SV pLoF, связанные с фенотипами и заболеваниями.
Общий DEL размером 2,4 т.п.н. наблюдался у 35 гомозиготных и 67 гетерозиготных носителей, который покрывает всю область 3-го экзона рецептора гомона роста (GHR).Гомозиготные носители оказались значительно короче гетерозиготных (р=0,033).(Рисунок 4г)
Кроме того, эти SV были обработаны для изучения эволюции популяций между двумя региональными группами: Северным и Южным Китаем.Были обнаружены достоверно дифференцированные СВ, распределенные по Chr 1, 2, 3, 6, 10, 12, 14 и 19, среди которых верхние были связаны с областями иммунитета, такими как IGH, MHC и т. д. Разумно предположить, что дифференциация этих SV может быть связана с генетическим дрейфом и длительным воздействием различных сред на субпопуляции в Китае.
Ссылка
Ву, Жикунь и др.«Структурные варианты китайского населения и их влияние на фенотипы, заболевания и адаптацию населения».bioRxiv(2021).
Новости и основные моменты цель – поделиться последними успешными случаями с Biomarker Technologies, фиксируя новые научные достижения, а также выдающиеся методы, примененные в ходе исследования.
Время публикации: 06 января 2022 г.