下記の記事でリード数とカバレッジの違いに関して簡単に説明しましたが、本記事ではNGS(次世代シーケンス)におけるリード数に関して、より詳細に解説します。
上記の記事でも解説しましたが、NGSにおけるリード数は、文字通りリードの数となります。
カバレッジではなくリード数が指標として使用されるケースとして、RNA-Seqによる発現解析があります。RNA-Seqによる発現解析では、サンプルや各遺伝子のリード数を比較して、解析を進めていきます。
またリード数はより多く取得するほど精度が高く、また頻度の低いバリアントも確実に検出できるようになります。
対してリード数が足りないと、リード数の差が十分につかず本来は差が観察されるはずの結果が確認出来なかったり、発現量が低い遺伝子などはそもそも検出できない場合もあります。
ただしリード数は多ければ多いほど良いというわけではなく、多くのリード数を取得するためには、それだけシーケンスのデータ量が必要になり、コストが高くなるということです。不必要に多くのリードを取得すると無駄なコストが発生するので、取得したい実験結果に必要なリード数を確認し、実験を行うことが重要です。