1. 一般传到SRA的数据都是去接头的 clean data,方便共享给其他科研人员。 但是也有一些科研人员,乱传数据。
2. 向作者咨询: 你可以发邮件给作者,询问数据的接头序列
3. 从建库信息着手: 这个稍微麻烦一些,你首先需要知道序列是什么机器测序的,大概是什么建库,因为如果采用的是建库试剂盒的话,接头序列可以在对应试剂盒的说明文档中有
4. 自己手动查找: 打开fastq 序列,看看每条序列前后的序列是否有一些共同的序列,也可以跑一下fastqc ,他能检测常用的一些接头序列
如何正确的向NCBI传输数据,可以看看《数据上传NCBI》课程。