Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
このプルリクエストでは、STARを用いた解析時に
Chimeric.out.sam
だけからでは検出できない融合遺伝子の検出を、STARのSJ.out.tab
およびAligned.out.bam
を用いることで補完するフィルタを実装します。隣接する遺伝子間での融合遺伝子のように比較的近距離で生じたキメラ遺伝子は
Chimeric.out.sam
に捕捉されないことがあります(たとえば、STIL-TAL
など)。SJ.out.tab
はSTARによって検出されたスプライシングジャンクションがリストアップされた出力ファイルで、Chimeric.out.sam
に捕捉されない融合遺伝子がスプライシングジャンクションとしてSJ.out.tab
に捕捉されることがあります。このフィルタの実装では、以下の5ステップにより
SJ.out.tab
から融合遺伝子候補のスプライシングジャンクションを抽出し、そのスプライシングジャンクション付近にマッピングされたアライメントをAligned.out.bam
から読み込み解析することで融合遺伝子検出を補完します(これらの主な処理はShortRangeChimeraFilter
クラスで実装しています):SJ.out.tab
に出力されたスプライシングジャンクションのうち、始端と終端の遺伝子が異なるものを融合遺伝子候補のスプライシングジャンクションとして抽出Aligned.out.bam
から読み込み、スプライシングと同じ位置にギャップを持つアライメントを融合遺伝子をサポートするアライメントとして抽出Chimeric.out.sam
と同様にparseJunctionInfo.parseJuncInfo_STAR
に入力として渡し、その結果をChimeric.out.sam
の結果とマージする(以降は従来と同じ処理)ステップ3および4は、fusionfusionにアライメントの3つ組(primary, supplementaryおよびそれらのペア)が融合遺伝子をサポートしていると認識させるために必要です。
なお、この変更では
--star
オプションの意味を変更しているため、ユーザレベルの後方互換性が維持されません。従来、--star
オプションはChimeric.out.sam
のファイルパスを指定していましたが、この変更によりSTARの出力結果ファイル群のプレフィックス(STARの--outFileNamePrefix
オプションに指定する値)を指定する必要があります。