TRASCRITOMICA
natura
COMUNICAZIONI
La caratterizzazione della trascrizione integrale della mutazione SF3B1 nella leucemia linfocitica cronica rivela una sottoregolazione degli introni trattenuti
Trascrizioni integrali|Sequenziamento dei nanopori|Analisi delle isoforme alternative
Sfondo
SÈ stato ampiamente riportato che le mutazioni matiche nel fattore di splicing SF3B1 si associano a vari tumori, tra cui la leucemia linfocitica cronica (LLC), il melanoma uveale, il cancro al seno, ecc. Inoltre, studi di trascrittomica a lettura breve hanno rivelato modelli di splicing aberranti indotti dalle mutazioni di SF3B1.Tuttavia, gli studi su questi modelli di splicing alternativo sono stati a lungo limitati al livello di evento e alla mancanza di conoscenza a livello di isoforma a causa della limitazione delle trascrizioni assemblate di breve lettura.Qui, è stata introdotta la piattaforma di sequenziamento dei nanopori per generare trascrizioni a lunghezza intera, che hanno consentito l'indagine sulle isoforme AS.
Design sperimentale
Esperimenti
Raggruppamento:1. CLL-SF3B1(WT) 2. CLL-SF3B1(mutazione K700E);3. Cellule B normali
Strategia di sequenziamento:Sequenziamento delle librerie 2D MinION, sequenziamento delle librerie 1D PromethION;dati di lettura breve dagli stessi campioni
Piattaforma di sequenziamento:ONT MiniONE;ONT Prometeo;
Analisi bioinformatica
Risultati
UNsono state generate un totale di 257 milioni di letture da 6 campioni di CLL e 3 cellule B.In media il 30,5% di queste letture sono state identificate come trascrizioni integrali.
FL'analisi delle isoforme alternative a tutta lunghezza dell'RNA (FLAIR) è stata sviluppata per generare una serie di isoforme ad alta affidabilità.FLAIR può essere riassunto come:
Nallineamento delle letture anopore: identificare la struttura generale della trascrizione basata sul genoma di riferimento;
Scorrezione della giunzione di giunzione: correggere gli errori di sequenza (rosso) con il sito di giunzione da introni annotati, introni da dati di lettura breve o entrambi;
Collasso: riassumere isoforme rappresentative basate su catene di giunzioni di giunzione (set di primo passaggio).Seleziona isofrom ad alta affidabilità in base al numero di letture supportate (soglia: 3).
Figura 1. Analisi FLAIR per identificare le isoforme a lunghezza intera associate alla mutazione SF3B1 nella CLL
FLAIR ha identificato 326.699 isoforme di giunzione ad alta sicurezza, il 90% delle quali sono nuove isoforme.Si è scoperto che la maggior parte di queste isoforme non annotate erano nuove combinazioni di giunzioni di giunzione note (142.971), mentre le restanti nuove isoforme contenevano introne trattenuto (21.700) o nuovo esone (3594).
Lle sequenze a lunga lettura consentono l'identificazione dei siti di giunzione alterati da SF3B1-K700E mutanti a livello di isoforma.È stato riscontrato che 35 3'SS alternativi e 10 5'SS alternativi avevano uno splicing differenziale significativo tra SF3B1-K700E e SF3B1-WT.33 delle 35 alterazioni sono state scoperte di recente da sequenze di lettura prolungata.Nei dati di Nanopore, la distribuzione della distanza tra i 3'SS alterati da SF3B1-K700E e i picchi dei siti canonici è di circa -20 bp, che è significativamente diversa da una distribuzione di controllo, simile a quanto riportato nelle sequenze di lettura breve della CLL.Sono state analizzate le isoforme del gene ERGIC3, dove una nuova isoforma contenente il sito di giunzione prossimale è stata trovata più abbondante in SF3B1-K700E.Sia i 3'SS prossimali che quelli distali erano associati a modelli AS distinti che generavano più isoforme.
Figura 2. Modelli di splicing alternativi 3′ identificati con i dati di sequenziamento dei nanopori
L'analisi dell'utilizzo degli eventi IR è stata a lungo limitata nell'analisi basata su letture brevi a causa della fiducia nell'identificazione e quantificazione degli IR.L'espressione delle isoforme IR in SF3B1-K700E e SF3B1-WT è stata quantificata sulla base di sequenze di nanopori, rivelando una down-regulation globale delle isoforme IR in SF3B1-K700E.
Figura 4. Intensità agricola e connettività di rete in tre sistemi agricoli (A e B);Analisi casuale delle foreste (C) e relazione tra intensità agricola e colonizzazione AMF (D)
Figura 3. Gli eventi di ritenzione degli introni sono più fortemente sottoregolati nella CLL SF3B1-K700E
Tecnologia
Sequenziamento a lunga lettura di nanopori
NIl sequenziamento di anopori è una tecnologia di sequenziamento del segnale elettrico in tempo reale di una singola molecola.
DIl DNA o l'RNA a doppio filamento si legheranno alla proteina nanoporosa incorporata nel biofilm e si svolgeranno sotto la guida della proteina motrice.
DI filamenti di NA/RNA passano attraverso la proteina del canale dei nanopori a una certa velocità sotto l'azione della differenza di voltaggio.
Mle olecole generano segnali elettrici diversi a seconda della struttura chimica.
RIl rilevamento in tempo reale delle sequenze viene ottenuto tramite l'identificazione delle basi.
Esecuzione del sequenziamento del trascrittoma a lunghezza intera
√ Saturazione dei dati
Sono necessarie 7 volte meno letture per raggiungere una saturazione dei dati comparabile.
√ Identificazione della struttura della trascrizione
Identificazione di diverse varianti strutturali con lettura consensuale dell'intera lunghezza di ciascuna trascrizione
√ Analisi differenziale a livello di trascrizione: rivela i cambiamenti nascosti dalle letture brevi
Riferimento
Tang AD, Soulette CM, Baren MJV, e al.La caratterizzazione della trascrizione completa della mutazione SF3B1 nella leucemia linfocitica cronica rivela una sottoregolazione degli introni trattenuti[J].Comunicazioni sulla natura.
Tecnologia e punti salienti mira a condividere le più recenti applicazioni di successo di diverse tecnologie di sequenziamento ad alto rendimento in vari ambiti di ricerca, nonché idee brillanti nella progettazione sperimentale e nel data mining.
Orario di pubblicazione: 08 gennaio 2022