1、DNA标记命名法
关于DNA水平上检测到的遗传标记,最常见的包括插入/删除、基于pcr检测单核苷酸多态性(如KASP标记)、全基因组阵列(如SNP芯片)或直接测序(如ddRAD或skimGBS)。还包括与DNA探针杂交检测到的DNA标记[如RFLPs(限制性片段长度多态性)]和、引物扩增[如RAPDs(随机扩增多态DNA)]、STSs(序列标记位点,包括测序RFLP克隆检测到的位点、RAPDs的测序和克隆)和简单序列重复(SSRs)。基本符号
我们根据过去几年出版物中命名的标记及其来源做出整理,发现了无论标记的确切名称是什么,均需提供以下共同信息: i.检测所使用的平台(如KASP、Illumina array、Axiom array、skimGBS),
ii.引物序列(如KASP)或SNP位置周围的100bp,
iii.目前基于中国春参考基因组组装和基因模型的多态性坐标,
iv.在可能的情况下,标记信息应存储在一个公共可访问的数据库中(例如,GrainGenes,EnsemblPlants,CerealsDB)。
已知蛋白编码基因的SNP和衍生标记
在可能的情况下,ATG起始密码子的相对位置、除内含子外的位置和核苷酸多态性都应该包含在标记名称中(当起始密码子位于下游时)。例如,GW2-B1基因中2504 bp存在C/T多态性,可将该基因命名为GW2-B1_C2504T。如果该基因存在多个转录本亚型,则应取消作为参考的亚型,以便确定多态性在编码序列中的位置。在小缺失的情况下,可以用缺失序列的起始、结束和“del”来命名。(例如,GW2-B1在53~72bp区间内缺失20个核苷酸可以命名为GW2-B1_53_72del。如果重点是一个氨基酸替换(例如,在蛋白质1152bp处发生由丝氨酸(S)到苯丙氨酸(F)的替换,可以命名为S1152F,衍生的KASP标记可以写为Kasp_Sr13a_S1152F。过早终止密码子应用星号表示(*;例如GW2-B1_C2510*)。如果氨基酸名称可能与核苷酸(半胱氨酸和胞嘧啶、苏氨酸和胸腺嘧啶、甘氨酸和鸟嘌呤、丙氨酸和腺嘌呤)相混淆,则应使用氨基酸的三个字母编码。SNP和衍生标记——匿名DNA序列
从过往刊物来看,这些命名基于实验室或项目代码,再加上实验室连续的数字,例如,悉尼大学植物育种研究所巴黎实验室命名的第85个标记被命名为sunKasp_85。我们建议对SNPs的命名法可以采取如表1的指导方针。例如,CHS21_6A001234567将是一个基于中国春(CHI)2.1版本组装的SNP,位于6A染色体,碱基对位置为1234567。表1 SNPs命名法
2、控制数量特征的位点和等位基因的符号
通过分离分析所鉴定的基因
通过分离分析鉴定的控制数量性状的位点和等位基因的符号应符合小麦基因符号化的推荐规则。数量性状位点(QTL)
QTL是控制数量性状的位点,其等位基因没有不连续的变异或明确的分离模式,它们通过与一个或多个连锁标记的关联来识别。基本符号
位点符号
“Q”后面应该有一个性状指示符、一个句号、一个实验室指示符、一个连字符(−)和QTL所在的染色体。性状指示符最好是三个字母,首字母大写。在同一条染色体上识别的同一性状的不同QTL命名相同,需在染色体命名后添加一个句号和一个阿拉伯数字。所有字符均为斜体。例如,QYld.psr-7B.1和QYld.psr-7B.2是由 John Innes Centre在7B染色体上命名的两个产量相关QTL。在7B的图谱上,这两个QTLs可以缩写为QYld.psr.1和QYld.psr.2。等位基因符号
QTL位点上的等位基因应在位点命名后用小写斜体字母表示。3、致病性病虫害反应基因命名
命名法
由赋予抗性的等位基因(包括一些可能遗传为隐性等位基因)命名,首字母大写。此外,个体等位基因的优势可能随环境、遗传背景和病原体的特定培养而不同。疾病/害虫反应基因的符号被许多学科的人使用,经常通过口头交流,优势关系并不清楚。那些首字母最初用小写字母指定的抗性等位基因往往用大写字母误读。例如,对于Sr17,通常是隐性抗性等位基因Sr17,最初被指定为sr17,但在一些报告中并不统一。产生多种病虫害反应的基因位点
如果对多个疾病应答位点产生抗性的基因之间没有发生重组,则应根据病虫害分别指定该基因,如PM1、SR15和LR20。突变和克隆表明,PM1是一个不同的位点。重组后的反应位点
当两个与病原体反应密切相关的因子之间发生重组时,重组的“等位基因”可以被命名为不同指定的等位基因的组合,例如通过结合Lr14a和Lr14b获得的重组的等位基因被命名为Lr14ab。其命名是作为组合还是作为单独的基因应由研究人员自行决定。建议以1个交叉单位的最大值命名为“等位基因”。病原体中相应基因的命名
虽然需要考虑病原体和害虫中相应基因的统一象征,但目前并没有提出任何建议。从小麦的角度来看,AvrLr14a可能是可以接受的,但将小麦作为不同生物体的专家可能有其他的意见。4、蛋白质和酶变异的基因命名指南
小麦中的大多数特征蛋白质和酶是由与其他物种中研究的基因同源的基因编码的,因此根据“具有相似表型缺陷的基因”部分命名。这些基因的等位基因经常被分子表型(在“等位基因”部分)使用一系列互补技术(包括1维和2维蛋白质电泳、质谱、色谱、DNA标记和/或DNA测序)识别,因为在许多情况下,使用单一方法区分等位基因是不同的;例如,需要四种方法(SDS-PAGE,IEF x SDS-PAGE,MALDI-TOF-MS和PCR)来区分三个GLU-3位点的等位基因。一般来说,非功能DNA变异(编码区的同义变异)将被指定为单倍型(_h1,_h2等)。相比之下,例如,蛋白质电泳不能识别DNA测序显示的条带之间的迁移差异,这些变异可以直接作为等位基因(非同义变异)。单倍型的应用可以用注释来解释;例如,将单倍型转换为多个位点的等位基因组合,如(i)GLU-1-1和GLU-1-2位点的等位基因编码的谷蛋白亚基组合,以及(ii)GLU-3和GLI-1位点的等位基因组合。对单个基因的基因模型识别将被纳入目录。相反,该目录中的位点/基因名称将与基因产物(例如,高分子量谷胱甘肽、ω-胶质蛋白、醇脱氢酶)一起被纳入可用的测序参考基因组中。鼓励参照小麦的基因命名法的交叉引用对其他生物进行遗传命名。5、种质
小麦是一种重要的食品和工业作物,是一种异源多倍体生物。种质是基因目录的关键组成部分,预计与任何正式命名的基因相关的种质将被明确地删除,并参考国际上可获得的种质收集。这一收集必须在联合国粮食及农业组织《粮食和农业植物遗传资源国际条约》的框架内,在世界范围内进行。研究锈病、白粉病和其他小麦疾病的专家采用了基因名称发表前批准和保证种质可用性的程序,作为永久基因名称的基础。当不能确定特定的参考种质时,我们鼓励使用临时名称。6、讨论
以上命名法为小麦中基因和基因组区域的一致命名提供了一个更新的框架,在适应过往标记命名习惯的同时也适应基因组学和生物技术的新进展。随着时间的推移,这些命名法也可能被大麦、黑麦、小黑麦和燕麦研究者所采用,它们在破译其基因组序列方面也取得了类似的进展;一套共同的命名法将有助于在这些谷物之间转移知识,它们共享密切的系统发育关系和共同的育种目标。我们鼓励小麦科学研究者们采用这些命名方法,在研究成果展示时提供有关基因、等位基因、单倍型、标记和QTL命名的必要信息,也期望在重要农艺性状基因挖掘方面继续取得重要进展。