転写産物
自然
コミュニケーション
慢性リンパ性白血病におけるSF3B1変異の完全長転写産物の特徴付けにより、保持されたイントロンの下方制御が明らかになった
全長トランスクリプト|ナノポアシーケンシング|代替アイソフォーム分析
背景
Sスプライシング因子 SF3B1 のオーマ細胞変異は、慢性リンパ性白血病 (CLL)、ブドウ膜黒色腫、乳がんなどを含むさまざまながんと関連していることが広く報告されています。さらに、ショートリード トランスクリプトーム研究により、SF3B1 変異によって誘導される異常なスプライシング パターンが明らかになりました。しかし、これらの選択的スプライシングパターンに関する研究は長らくイベントレベルに限定されており、ショートリードアセンブルされた転写産物の限界によりアイソフォームレベルの知識が不足していました。ここでは、完全長転写産物を生成するためにナノポア シーケンシング プラットフォームが導入され、AS アイソフォームの研究が可能になりました。
実験計画
実験
グループ化:1. CLL-SF3B1(WT) 2. CLL-SF3B1(K700E 変異);3. 正常なB細胞
シーケンス戦略:MinION 2D ライブラリ シーケンス、PromethION 1D ライブラリ シーケンス。同じサンプルからのショートリードデータ
シーケンスプラットフォーム:オントミニオン。ONTプロメチオン。
バイオインフォマティクス分析
結果
あ合計 2 億 5,700 万のリードが 6 つの CLL サンプルと 3 つの B 細胞から生成されました。これらのリードの平均 30.5% が完全長転写物として識別されました。
FRNA の完全長代替アイソフォーム分析 (FLAIR) は、信頼性の高いアイソフォームのセットを生成するために開発されました。FLAIR は次のように要約できます。
Nアノポアはアライメントを読み取ります。参照ゲノムに基づいて一般的な転写構造を特定します。
Sプライスジャンクションの修正: アノテーション付きイントロン、ショートリードデータのイントロン、またはその両方からのスプライス部位による配列エラー (赤) を修正します。
Collapse: スプライス結合鎖に基づいて代表的なアイソフォームを要約します (ファーストパスセット)。サポートされるリード数 (しきい値: 3) に基づいて、信頼性の高い isofrom を選択します。
図 1. CLL における SF3B1 変異に関連する全長アイソフォームを特定するための FLAIR 解析
FLAIR は 326,699 個の高信頼性スプライシング アイソフォームを特定し、その 90% が新規アイソフォームでした。これらの注釈のないアイソフォームのほとんどは、既知のスプライス結合 (142,971) の新規な組み合わせであることが判明しましたが、残りの新規アイソフォームには、保持されたイントロン (21,700) または新規エクソン (3594) が含まれていました。
Long-read 配列により、変異体 SF3B1-K700E で変化したスプライス部位をアイソフォームレベルで同定できます。35 個の代替 3'SS と 10 個の代替 5'SS が、SF3B1-K700E と SF3B1-WT の間で著しく異なってスプライシングされることが判明しました。35 個の変化のうち 33 個はロングリード配列によって新たに発見されました。ナノポアデータでは、SF3B1-K700E で改変された 3'SS から標準部位ピークまでの距離の分布は約 -20 bp であり、CLL ショートリード配列で報告されているものと同様、対照分布とは大きく異なります。ERGIC3 遺伝子のアイソフォームが分析され、近位スプライス部位を含む新規アイソフォームが SF3B1-K700E でより豊富に見つかりました。近位および遠位の 3'SS は両方とも、複数のアイソフォームを生成する区別された AS パターンと関連していました。
図 2. ナノポア配列データで特定された選択的 3' スプライシング パターン
IR イベントの使用分析は、IR の識別と定量化に対する信頼性のため、ショートリードベースの分析では長らく制限されてきました。SF3B1-K700E および SF3B1-WT における IR アイソフォームの発現はナノポア配列に基づいて定量され、SF3B1-K700E における IR アイソフォームの全体的なダウンレギュレーションが明らかになりました。
図 4. 3 つの農業システム (A および B) にわたる農業強度とネットワーク接続性。ランダムフォレスト分析 (C) および農業強度と AMF 定着との関係 (D)
図 3. CLL SF3B1-K700E ではイントロン保持イベントがより強く下方制御されています
テクノロジー
ナノポアロングリードシーケンシング
Nアノポアシーケンスは、単一分子のリアルタイム電気信号シーケンス技術です。
D二重鎖 DNA または RNA は、バイオフィルムに埋め込まれたナノ多孔質タンパク質に結合し、モータータンパク質の導きで巻き戻ります。
DNA/RNA鎖は、電圧差の作用下で一定の速度でナノポアチャネルタンパク質を通過します。
M小分子は、化学構造に応じて異なる電気信号を生成します。
Rシーケンスのリアルタイム検出はベースコールによって実現されます。
全長トランスクリプトームシーケンスのパフォーマンス
√ データ飽和
同等のデータ飽和に達するまでに必要な読み取り回数が 7 倍少なくなります。
√ 転写構造の同定
各転写産物のコンセンサス全長読み出しによる多様な構造変異体の同定
√ 転写レベルの差分分析 - ショートリードに隠された変更を明らかにする
参照
Tang AD、Soulette CM、Baren MJV 他慢性リンパ性白血病におけるSF3B1変異の全長転写産物の特徴付けにより、保持されたイントロンの下方制御が明らかになった[J]。ネイチャーコミュニケーションズ。
技術とハイライト は、実験計画やデータマイニングにおける素晴らしいアイデアだけでなく、さまざまな研究分野におけるさまざまなハイスループットシーケンス技術の最新の成功した応用を共有することを目的としています。
投稿時刻: 2022 年 1 月 8 日