TRANSKRIPTOMIKY
Příroda
KOMUNIKACE
Charakterizace transkriptu plné délky mutace SF3B1 u chronické lymfocytární leukémie odhaluje downregulaci zadržených intronů
Celovečerní přepisy|Sekvenování nanopórů|Alternativní izoformní analýza
Pozadí
SOmatické mutace ve sestřihovém faktoru SF3B1 se široce uvádí, že se spojují s různými rakovinami, včetně chronické lymfocytární leukémie (CLL), uveálního melanomu, rakoviny prsu atd. Kromě toho krátké transkriptomické studie odhalily aberantní sestřihové vzory vyvolané mutacemi SF3B1.Studie o těchto alternativních sestřihových vzorech se však dlouho omezovaly na úroveň událostí a nedostatek znalostí na úrovni izoforem kvůli omezení krátkých sestavených přepisů.Zde byla představena platforma pro sekvenování nanopórů pro generování transkriptů v plné délce, což umožnilo invertigaci na izoformách AS.
Experimentální design
Experimenty
Seskupení:1. CLL-SF3B1(WT) 2. CLL-SF3B1(mutace K700E);3. Normální B-buňky
Strategie sekvenování:sekvenování 2D knihovny MinION, sekvenování 1D knihovny PromethION;krátká data ze stejných vzorků
Sekvenční platforma:ONT MinION;ONT PromethION;
Bioinformatická analýza
Výsledek
Acelkem 257 milionů čtení bylo generováno ze 6 vzorků CLL a 3 B-buněk.V průměru 30,5 % těchto čtení bylo identifikováno jako přepisy v plné délce.
FAlternativní analýza izoforem RNA (FLAIR) plné délky byla vyvinuta za účelem vytvoření sady vysoce spolehlivých izoforem.FLAIR lze shrnout takto:
Nanopore reads alignment: identifikovat obecnou strukturu transkriptu na základě referenčního genomu;
Skorekce plice junction: opravte chyby sekvence (červená) se sestřihovým místem buď z anotovaných intronů, intronů z krátkých dat nebo obou;
Collapse: shrnutí reprezentativních izoforem na základě spojovacích řetězců (sada prvního průchodu).Vyberte vysoce spolehlivý isofrom na základě počtu podpůrných čtení (Threshold: 3).
Obrázek 1. Analýza FLAIR k identifikaci celodélkových izoforem spojených s mutací SF3B1 u CLL
FLAIR Identifikováno 326 699 vysoce spolehlivých sestřihových izoforem, z nichž 90 % jsou nové izoformy.Bylo zjištěno, že většina z těchto nekomentovaných izoforem jsou novými kombinacemi známých sestřihových spojení (142 971), zatímco zbytek nových izoforem obsahoval buď zadržený intron (21 700) nebo nový exon (3594).
Long-read sekvence umožňuje identifikaci mutantních SF3B1-K700E-změněných sestřihových míst na úrovni izoforem.Bylo zjištěno, že 35 alternativních 3'SS a 10 alternativních 5'SS jsou významně rozdílně sestřižené mezi SF3B1-K700E a SF3B1-WT.33 z 35 změn bylo nově objeveno pomocí dlouhých sekvencí.V datech Nanopore je distribuce vzdálenosti mezi 3'SS změněnými SF3B1-K700E k vrcholům kanonických míst kolem -20 bp, což se významně liší od kontrolní distribuce, podobné tomu, co bylo hlášeno u krátkých sekvencí CLL.Byly analyzovány izoformy genu ERGIC3, kde nová izoforma obsahující proximální sestřihové místo byla nalezena hojněji v SF3B1-K700E.Jak proximální, tak distální 3'SS byly spojeny s odlišnými AS vzory generujícími více izoforem.
Obrázek 2. Alternativní 3′ sestřihové vzory identifikované s daty sekvenování nanopórů
Analýza použití IR události byla dlouho omezena v analýze založené na krátkém čtení kvůli důvěře v identifikaci a kvantifikaci IR.Exprese IR izoforem v SF3B1-K700E a SF3B1-WT byla kvantifikována na základě nanopórových sekvencí, což odhalilo globální down-regulaci IR izoforem v SF3B1-K700E.
Obrázek 4. Intenzita zemědělství a síťová konektivita ve třech zemědělských systémech (A a B);Náhodná analýza lesa (C) a vztah mezi intenzitou zemědělství a kolonizací AMF (D)
Obrázek 3. Události zadržování intronů jsou silněji downregulovány u CLL SF3B1-K700E
Technika
Nanopore Long-read Sequencing
Nanopore sekvenování je technologie sekvenování elektrických signálů v reálném čase s jednou molekulou.
Ddvouvláknová DNA nebo RNA se bude vázat na nanoporézní protein uložený v biofilmu a odvíjející se pod vedením motorického proteinu.
DŘetězce NA/RNA procházejí proteinem nanopórového kanálu určitou rychlostí při působení rozdílu napětí.
Molekuly generují různé elektrické signály podle chemické struktury.
Rdetekce sekvencí v reálném čase je dosaženo voláním báze.
Provedení sekvenování transkriptomu v plné délce
√ Sytost dat
K dosažení srovnatelné saturace dat je potřeba 7krát méně čtení.
√ Identifikace struktury přepisu
Identifikace různých strukturních variant s konsensuálním čtením plné délky každého transkriptu
√ Diferenciální analýza na úrovni přepisu - Odhalte změny skryté krátkým čtením
Odkaz
Tang AD, Soulette CM, Baren MJV a kol.Charakterizace transkriptu plné délky mutace SF3B1 u chronické lymfocytární leukémie odhaluje downregulaci zadržených intronů[J].Příroda komunikace.
Tech and Highlights si klade za cíl sdílet nejnovější úspěšnou aplikaci různých vysoce výkonných sekvenačních technologií v různých oblastech výzkumu a také skvělé nápady v experimentálním designu a dolování dat.
Čas odeslání: leden-08-2022