最近ではNGSに使用されるindexは、Unique Dual Index(UDI)と呼ばれるものが多くなりました。本記事ではUDIなどindexの種類と違い、またUDIの利点を知る上で重要なindex hoppingに関して解説します。
Single Index(シングルインデックス・SI)
アダプターの片側のみindex配列が付加されています。indexの技術が導入された当初は、後述するDual Indexの技術がありませんでした。
Dual Index(デュアルインデックス・DI)
アダプターの両側にindex配列が付加されています。シーケンサーのスペックが上がりデータ出力量が多くなるにつれ、両側にindexを付加したDual Index(DI)が開発され、より多くのサンプルを識別/解析出来るようになっています。またDual Indexは、後述するCombinatorial Dual Index(CDI)と、Unique Dual Index(UDI)の2種類に大きく分かれます。
Combinatorial Dual Index(CDI)
i5とi7(左側と右側)の組み合わせで、振り分け可能なサンプル数を増やします。index primerの合成コストを抑えながら、indexの組み合わせ数を増やすことが出来ます。
Unique Dual Index(UDI)
i5とi7(左側と右側)すべてで異なるindex配列を使用します。下記index hoppingの問題を大幅に低減することが可能です。Dual Indexは当初Combinatorial Dual Index(CDI)が多かったのですが、index hoppingの問題が見つかった最近では、Unique Dual Index(UDI)が主流となっています。
index hopping(インデックスホッピング)
複数ライブラリーをプールした際にindexの組み換えが起こり、別のライブラリー由来のシーケンス結果が含まれてしまう現象です。Illuminaシーケンサーの、比較的新しい機種で採用されている方式(Patterned Flow Cell)で高い割合で発生したため、NGS業界では一時期大きな話題となりました。
Single Index(SI)やCombinatorial Dual Index(CDI)では、片側のindexが入れ替わると、シーケンス結果を異なるサンプルの結果として認識してします恐れがあります。
・Combinatorial Dual Index(CDI)とindex hopping
発生する頻度は〜数%のため重要な問題ではないと思うかもしれませんが、臨床への利用が期待されているNGSでは、文字通り死活問題となります。本来は重篤な疾患を持つ患者さんを見逃してしまったり、健全な患者さんに対して副作用の強い薬を投与するケースが発生するかもしれません。
Unique Dual Index(UDI)では、各サンプルに対してi5とi7の配列が個別のため、片側が入れ替わった場合はindex hoppingだと認識することが可能です。ごく稀に同じi5とi7のindex組み合わせが別サンプルに割り当てられる可能もありますが、頻度は非常に少ないです。
・Unique Dual Index(UDI)とindex hopping
下記の論文では、Combinatorial Dual Index(CDI)で110,180リードまたは1,121,074リードのindex hoppingが発生した実験系において、Unique Dual Index(UDI)を使用すると1リードのみになったことを示しています。
もちろんindex hoppingの問題が0%でない以上、臨床現場では問題となります。他の方法も組み合わせて、世界中の研究者や臨床現場では0.0%となるよう日々研究・開発を続けています。
以上indexの技術も、シーケンサーのデータ量向上やトレンドにあわせて、進化してきているようです。
また最近ではアダプター配列中に分子バーコード(Unique Molecular Identifier: UMI)を使用する技術も一般的になってきています。