NGS(次世代シーケンス)実験では、結果を取得するまで、サンプルの抽出からライブラリー調製、NGSによるランとその解析など、多くの工程が存在します。
本記事ではNGS実験工程のうち、シーケンス自体の評価と判断を行うポイントに関して紹介します。なお本記事のシーケンスはIllumina機器を想定しています。
クオリティスコア(Qスコア)とは
シーケンスランによって解析された各塩基の正確性の指標です。シーケンス時にあわせて出力されます。Q10から下記の正確性で表記され、高品質とされるQ30以上の塩基の割合が高いほど良いシーケンスとなります。Q30が90%以上となることが望ましいですが、リード(シーケンス長)が長い場合などはQスコアが下がります。
エラー率 | 意味 | |
Q10 | 10% | 90%の確率でその塩基は正確と判断 |
Q20 | 1% | 99%の確率でその塩基は正確と判断 |
Q30 | 0.1% | 99.9%の確率でその塩基は正確と判断 |
Q40 | 0.01% | 99.99%の確率でその塩基は正確と判断 |
Qスコアが下がる要因1:クラスター密度
シーケンサーにロードしたライブラリー量が適切でない場合、クラスター密度が高/低くなり、Qスコアが下がります。シーケンス前のライブラリーは正しく測定することが重要です。
Qスコアが下がる要因2:塩基の偏り
シーケンスされる塩基配列に偏りがあると、Qスコアが下がります。全ゲノム解析などサンプル配列にバラつきがある場合は問題になりませんが、アンプリコンシーケンス等のターゲットシーケンスで、ターゲット配列が短い場合はPhiXの追加を検討する必要があります。
Qスコアが下がる要因3:試薬管理
Qスコアに限らずですが、適切なシーケンスを行うためには、試薬を適切に管理・運用する必要があります。試薬はマニュアルに従った温度で管理し、期限内に使用します。またwashが不十分な場合など適切に操作しないと、コンタミや詰まりによりシーケンスが正しく進みません。
Illuminaシーケンサーでは、上記Qスコアとその原因となるクラスター密度や塩基の偏り、他にもランが疑わしいサイクル、流路の不具合などを確認することが出来ます。ランの品質の確認・改善方法を知ることは、自信を持ったデータ取得に重要です。