TRANSKRIPTOMIKA
priroda
KOMUNIKACIJE
Karakterizacija transkripta pune dužine mutacije SF3B1 kod kronične limfocitne leukemije otkriva smanjenje regulacije zadržanih introna
Transkripti u punoj dužini|Sekvenciranje nanopora|Alternativna analiza izoforme
Pozadina
SZa omatske mutacije u faktoru spajanja SF3B1 se naširoko navodi da se povezuju s različitim vrstama raka, uključujući kroničnu limfocitnu leukemiju (CLL), uvealni melanom, rak dojke, itd. Osim toga, kratko čitane transkriptomske studije otkrile su aberantne obrasce spajanja izazvane mutacijama SF3B1.Međutim, studije o ovim alternativnim obrascima spajanja dugo su bile ograničene na nivo događaja i nedostatak znanja o nivou izoforme zbog ograničenja kratko čitanih sastavljenih transkripata.Ovdje je uvedena platforma za sekvenciranje nanopora kako bi se generisali transkripti pune dužine, što je omogućilo ispitivanje AS izoforma.
Eksperimentalni dizajn
Eksperimenti
Grupisanje:1. CLL-SF3B1(WT) 2. CLL-SF3B1(K700E mutacija);3. Normalne B-ćelije
Strategija sekvenciranja:MinION 2D sekvenciranje biblioteke, PromethION 1D sekvenciranje biblioteke;kratko pročitani podaci iz istih uzoraka
Platforma za sekvenciranje:ONT MinION;ONT PromethION;
Bioinformatička analiza
Rezultati
Aukupno 257 miliona očitavanja je generirano iz 6 CLL uzoraka i 3 B-ćelije.U proseku 30,5% ovih čitanja identifikovano je kao transkripti pune dužine.
FAlternativna analiza izoforme velike dužine RNA (FLAIR) je razvijena da generiše skup izoforma visoke pouzdanosti.FLAIR se može sažeti kao:
Nanopore reads alignment: identifikovati opštu strukturu transkripta na osnovu referentnog genoma;
Skorekcija spoja plice: ispraviti greške sekvence (crveno) sa mjestom spajanja bilo od označenih introna, introna iz podataka kratkog čitanja ili oboje;
Collapse: sumirajte reprezentativne izoforme na osnovu spojnih lanaca (skup prvog prolaza).Odaberite isofom visoke pouzdanosti na osnovu broja pratećih čitanja (prag: 3).
Slika 1. FLAIR analiza za identifikaciju izoforma pune dužine povezanih s mutacijom SF3B1 u CLL-u
FLAIR je identifikovao 326.699 visokopouzdanih spojenih izoforma, od kojih su 90% nove izoforme.Utvrđeno je da su većina ovih nenaglašenih izoforma nove kombinacije poznatih spojeva (142,971), dok su ostale nove izoforme sadržavale ili zadržani intron (21,700) ili novi egzon (3594).
Ldugo-čitane sekvence omogućavaju identifikaciju mutantnih SF3B1-K700E -promijenjenih mjesta spajanja na nivou izoforme.Utvrđeno je da su 35 alternativnih 3'SS i 10 alternativnih 5'SS značajno različito spojeni između SF3B1-K700E i SF3B1-WT.33 od 35 izmjena su novootkrivene dugo čitanim sekvencama.U Nanopore podacima, distribucija udaljenosti između SF3B1-K700E-promijenjenih 3'SS-ova do vrhova kanonskih lokacija je oko -20 bp, što se značajno razlikuje od kontrolne distribucije, slično onome što je prijavljeno u sekvencama kratkog čitanja CLL-a.Analizirane su izoforme gena ERGIC3, gdje je nova izoforma koja sadrži proksimalno mjesto spajanja pronađena u većoj količini u SF3B1-K700E.I proksimalni i distalni 3'SS bili su povezani sa različitim AS obrascima koji su generirali više izoforma.
Slika 2. Alternativni 3′ obrasci spajanja identificirani s podacima sekvenciranja nanopora
Analiza upotrebe IR događaja dugo je bila ograničena u analizi zasnovanoj na kratkom čitanju zbog povjerenja u IR identifikaciju i kvantifikaciju.Ekspresija IR izoforma u SF3B1-K700E i SF3B1-WT kvantifikovana je na osnovu sekvenci nanopora, otkrivajući globalnu smanjenje IR izoforma u SF3B1-K700E.
Slika 4. Intenzitet poljoprivrede i mrežna povezanost u tri poljoprivredna sistema (A i B);Analiza slučajnih šuma (C) i Odnos između intenziteta poljoprivrede i kolonizacije AMF-a (D)
Slika 3. Događaji iznajmljivanja introna su snažnije regulirani u CLL SF3B1-K700E
Tehnologija
Nanopore Long-read Sequencing
Nanopore sekvenciranje je tehnologija sekvenciranja električnog signala u realnom vremenu s jednom molekulom.
Ddvolančana DNK ili RNA će se vezati za nanoporozni protein ugrađen u biofilm i odmotati se pod vodstvom motornog proteina.
DNA/RNA lanci prolaze kroz protein nanopore kanala određenom brzinom pod dejstvom razlike napona.
Molekule generiraju različite električne signale prema kemijskoj strukturi.
Real-time detekcija sekvenci se postiže pozivanjem baze.
Izvođenje sekvenciranja transkriptoma pune dužine
√ Zasićenost podataka
Potrebno je 7 puta manje čitanja za postizanje uporedive zasićenosti podacima.
√ Identifikacija strukture transkripta
Identifikacija različitih strukturnih varijanti uz konsenzus punu dužinu čitanja svakog transkripta
√ Diferencijalna analiza na nivou transkripta -Otkrivanje promjena skrivenih kratkim čitanjima
Referenca
Tang AD, Soulette CM, Baren MJV, et al.Karakterizacija transkripta pune dužine mutacije SF3B1 kod hronične limfocitne leukemije otkriva smanjenje regulacije zadržanih introna[J].Nature Communications.
Tech and Highlights ima za cilj dijeljenje najnovije uspješne primjene različitih tehnologija sekvenciranja visoke propusnosti u različitim istraživačkim arenama, kao i briljantnih ideja u eksperimentalnom dizajnu i rudarenju podataka.
Vrijeme objave: Jan-08-2022