之前尝试处理宏基因组测序数据,使用metawrap开始binning的时候遇到了下面这个报错:mapping生成sam文件时出现[mem_sam_pe]pairedreadshavedifferentnames错误
就是序列文件中,名字本来应该对应的,结果对应不上
可能是使用KneadData进行质量控制和去宿主的时候带来的问题
上面这个说法只是一个假设,要验证的话可以将原始数据用metawrap包装的质控和去宿主软件跑一遍,看看会不会出现同样的报错
当时遇到这个问题后,寻找了很久,发现了重命名的这个方法,如下:
condainstall-cbiocondabbmap##用以下命令修复:bbrename.shin1=read1.fqin2=read2.fqout1=renamed1.fqout2=renamed2.fq##对于多个fq文件,可以用以下命令:whilereadlinedonohupbbrename.shin={line}_R1.fqin2={line}_R2.fqout={line}_R1.sh.fqout2={line22}_R2.sh.fqdonename.txt#####其中,name.txt指的是包含sample名字文件
实测是可以解决报错的,但是zhang胸提出:这种强制给序列重新命名的方法,会不会造成分析结果不准(或者说结果不符合实际)
仍有待考证,但是如果使用metawrap自带的质控软件可以避免这个报错,那是再好不过了。
最近更新
推荐文章