常年混迹于生物测序行业,每天见的最多的是各种各样的生物样品,干的最多的就是区分样品,一千个样品有一千种命名方式:有用阿拉伯数字顺序下来的;有用汉字的;有名中带特殊字符的。殊不知,如此命名已经给你的实验埋下了隐忧。 我见过样品6/9不分的;O/0混淆的;有数字重复难以区分样品的;更有因样品名重新分析的。看得多了愈发感觉到样品命名的重要性。
下面我就再絮叨下样品命名几点注意事项,有需要的老师可以转发给您的研究生,好的实验是从一个好名字开始的!
1. 唯一性:
在同一批次或不同批次样品中不能出现相同或相近的命名,为避免不小心出现重复命名,尽量不要用纯数字当做样品名,以及注意以下几种情形:1). 字母“o”和数字“0”、字母“Z”和数字“2”在样本名称中不要同时出现, 小写字母"l”和数字“1”在样本名称中尽量不要同时出现,大写字母可区分;2). 小写字母“q”和数字“9”在样本名称中尽量不要同时出现,大写字母可区分。2. 完整性样品名应包含样本的基本信息比如:样本来源、处理方法、采样时间等信息,这样不仅便于自己梳理样品,也利于他人(试验人员、审稿人、读者)理解你的样品含义。如野生型(wild type)材料苗期(seedling stage)叶片(leaf)取三次生物学重复,可以用缩写:WT-S-L-1/2/3表示。3. 一致性一个实验,无论样本多少,所有样本都应遵循同一个命名规则,这样易于排查样品及理解数据结果。
4. 不要有特殊字符
由于生信分析系统和程序的要求,样品名称中不能有汉字,只能包含字母、数字和“-”,且不能以数字开头,名字长度不能超过8个字符;名称中不能有:罗马数字I、II、III、IV等及ASCII码中的空格、@、*、+、/、#、$、!、&、%、△、①、>、<等。样品命名看似小事一件,却在细节中影响着你的实验,尤其在样品数多、处理复杂的实验设计中,糟糕的样本命名极易造成样品缺失、重复以及数据可读性差;另外样本命名从一开始就应认真对待,一次性符合后期分析及发表文章的要求,这样可以避免后期更改命名的麻烦和匹配错误。
其实还有另一方面经常被我们忽略,样本命名不仅是自己能看明白,还要能让实验人员、数据分析人员,甚至审稿人、读你文章的人以及对你的实验感兴趣的人易于看明白;如此看来,样本科学的命名确实是一件非常重要的工作,是一项优秀的科学实验的开始!
小伙伴们,你是怎样对待样本命名的呢?希望你已习惯优秀!
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?多学点数据处理技能:学习链接:转录组标准分析后的数据挖掘
6. 学生物的必学生信技能:linux系统入门
7. 学生物的必学生信技能:Perl语言入门到精通
8. 学生物的必学生信技能:perl语言高级编程
6. 更多学习内容:linux、perl、R语言画图,更多免费课程请扫描下方二维码:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!