BMKCloud Log in
bannière-03

Nouvelles

RESÉQUENÇAGE DU GÉNOME ENTIER

srchttp___spider.ws_.126.net_21b922b6219133977833c7f1243b627d.jpegreferhttp___spider.ws_

Variantes de structure dans la population chinoise et leur impact sur les phénotypes, les maladies et l'adaptation de la population

Nanopore |PacBio |Re-séquençage du génome entier |Appel de variation structurelle

Dans cette étude, le séquençage Nanopore PromethION a été fourni par Biomarker Technologies.

Points forts

Dans cette étude, un paysage global des variations structurelles (SV) du génome humain a été révélé à l’aide du séquençage à lecture longue sur la plateforme Nanopore PromethION, qui approfondit la compréhension des SV dans les phénotypes, les maladies et l’évolution.

Conception expérimentale

Échantillons : leucocytes du sang périphérique de 405 individus chinois non apparentés (206 hommes et 199 femmes) avec 68 mesures phénotypiques et cliniques.Parmi tous les individus, les régions ancestrales de 124 individus étaient des provinces du Nord, celles de 198 individus étaient du Sud, 53 étaient du Sud-Ouest et 30 n'étaient pas connues.
Stratégie de séquençage : séquençage à lecture longue du génome entier (LRS) avec lectures Nanopore 1D et lectures PacBio HiFi.
Plateforme de séquençage : Nanopore PromethION ;PacBio Suite II

Appel de variation de structure

2-1024x326

Figure 1. Flux de travail d'appel et de filtrage SV

Principales réalisations

Découverte et validation des variations de structure

Ensemble de données Nanopore : Au total, 20,7 To de lectures propres générées sur la plateforme de séquençage PromethION, atteignant une moyenne de 51 Go de données par échantillon, soit environ 1 000 Go de données.17 fois en profondeur.

Alignement du génome de référence (GRCh38) : un taux de cartographie moyen de 94,1 % a été atteint.Le taux d'erreur moyen (12,6 %) était similaire à celui d'une étude comparative antérieure (12,6 %) (Figures 2b et 2c).

Appel de variation de structure (SV) : les appelants SV appliqués dans cette étude comprenaient Sniffles, NanoVar et NanoSV.Les SV de haute confiance ont été définis comme des SV identifiés par au moins deux appelants et ayant réussi les filtrations sur la profondeur, la longueur et la région.
Une moyenne de 18 489 (allant de 15 439 à 22 505) SV de confiance élevée ont été identifiées dans chaque échantillon.(Figures 2d, 2e et 2f)

3

Figure 2. Paysage global des SV identifiés par l'ensemble de données Nanopore

Validation par PacBio : les SV identifiées dans un échantillon (HG002, enfant) ont été validées par un ensemble de données PacBio HiFi.Le taux global de fausses découvertes (FDR) était de 3,2 %, illustrant une identification SV relativement fiable par lectures Nanopore.

SV non redondantes et caractéristiques génomiques

SV non redondants : un ensemble de 132 312 SV non redondants a été obtenu en fusionnant les SV dans tous les échantillons, qui comprend 67 405 DEL, 60 182 INS, 3 956 DUP et 769 INV.(Figure 3a)

Comparaison avec les ensembles de données SV existants : cet ensemble de données a été comparé à l'ensemble de données TGS ou NGS publié.Parmi les quatre ensembles de données comparés, LRS15, qui est également le seul ensemble de données de la plateforme de séquençage à lecture longue (PacBio), partageait les plus grands chevauchements avec cet ensemble de données.De plus, 53,3 % (70 471) des VS de cet ensemble de données ont été signalées pour la première fois.En examinant chaque type de SV, le nombre d'INS récupérés avec un ensemble de données de séquençage à lecture longue était beaucoup plus important que le reste des INS à lecture courte, ce qui indique que le séquençage à lecture longue est particulièrement efficace dans la détection des INS.(Figures 3b et 3c)

13

Figure 3. Propriétés des SV non redondants pour chaque type de SV

Caractéristiques génomiques : le nombre de SV a été significativement corrélé à la longueur des chromosomes.La distribution des gènes, des répétitions, des DEL (vert), INS (bleu), DUP (jaune) et INV (orange) ont été affichées sur un diagramme Circos, où une augmentation générale des SV a été observée à l'extrémité des bras chromosomiques.(Figures 3d et 3e)

Longueur des SV : les longueurs des INS et des DEL se sont révélées significativement plus courtes que celles des DUP et des INV, ce qui correspond à celles identifiées par l'ensemble de données PacBio HiFi.La longueur de tous les SV identifiés s'élevait à 395,6 Mo, ce qui occupait 13,2 % de l'ensemble du génome humain.Les SV ont affecté 23,0 Mo (environ 0,8 %) du génome par individu en moyenne.(Figures 3f et 3g)

Impacts fonctionnels, phénotypiques et cliniques des SV

Perte de fonction prévue (pLoF) SV : les SV pLoF ont été définis comme des SV interagissant avec le CDS, où les nucléotides codants ont été supprimés ou les ORF ont été modifiés.Au total, 1 929 SV pLoF affectant le CDS de 1 681 gènes ont été annotés.Parmi ceux-ci, 38 gènes ont mis en évidence la « liaison aux récepteurs d’immunoglobulines » dans l’analyse d’enrichissement GO.Ces SV pLoF ont ensuite été annotées respectivement par GWAS, OMIM et COSMIC.(Figures 4a et 4b)

SV phénotypiquement et cliniquement pertinentes : un certain nombre de SV dans l'ensemble de données nanopores se sont révélés être phénotypiquement et cliniquement pertinents.Un rare DEL hétérozygote de 19,3 kb, connu pour provoquer l'alpha-thalassémie, a été identifié chez trois individus, qui présentait un dysfonctionnement des gènes des sous-unités d'hémoglobine Alpha 1 et 2 (HBA1 et HBA2).Un autre DEL de 27,4 kb sur le gène codant pour la sous-unité bêta de l'hémoglobine (HBB) a été identifié chez un autre individu.Cette SV était connue pour provoquer des hémoglobinopathies graves.(Figure 4c)

14

Figure 4. SV pLoF associées à des phénotypes et des maladies

Un DEL commun de 2,4 kb a été observé chez 35 porteurs homozygotes et 67 porteurs hétérozygotes, qui couvre la région complète du 3ème exon du récepteur de l'homone de croissance (GHR).Les porteurs homozygotes se sont révélés significativement plus petits que les porteurs hétérozygotes (p = 0,033).(Figure 4d)

De plus, ces SV ont été traitées pour des études d'évolution de la population entre deux groupes régionaux : la Chine du Nord et la Chine du Sud.Des SV différentielles significatives ont été trouvées réparties sur les Chr 1, 2, 3, 6, 10, 12, 14 et 19, au sein desquelles les plus importantes étaient associées à des régions d'immunité, telles que IGH, MHC, etc. la différenciation de ces SV peut être due à une dérive génétique et à une exposition à long terme à des environnements divers pour les sous-populations en Chine.

Référence

Wu, Zhikun et coll."Variantes structurelles de la population chinoise et leur impact sur les phénotypes, les maladies et l'adaptation de la population."bioRxiv(2021).

Actualités et faits saillants vise à partager les derniers cas réussis avec Biomarker Technologies, en capturant de nouvelles réalisations scientifiques ainsi que des techniques importantes appliquées au cours de l'étude.


Heure de publication : 06 janvier 2022

Envoyez-nous votre message :