Error: qual length () differs from seq length () for fastq record !

CAGE-seqのマッピングをするときに、
Cutadapt, rRNAdust, removeNをかませるとたまに長さがあわない配列や、クオリティスコアのない配列が混ざってきて、結果タイトルのエラーに出くわす。

しかもなったりならなかったりして大変困るので、長さがあっている配列(とスコア)だけ抜き出すワンライナーとスクリプトを書いたのでおいておきます。





check_read.pyを保存して、ターミナルにcheck_qs.shをぺたっとしてくだし。 @SRRから始まる4行を抽出して、長さが違うものはpythonスクリプトで捨てます。 SRRXXXXXX_extracted.fastqが訂正されたfastqファイルになる予定です。

コメント

このブログの人気の投稿

再現性なんてないさ(?)

旧姓を失った研究者が海外でも活躍するためには

WLSのssh