TAG |小麦基因命名法更新指南

文摘   2024-09-02 20:00   陕西  

2023年通过在小麦基因符号目录服务的小麦科社区成员的密切支持下,以及在小麦倡议的赞助下,多方合作完成了小麦基因命名规则的更新。并且在Theoretical and Applied期刊发表了题为“Updated guidelines for gene nomenclature in wheat”研究论文。他们提供了一套更新的小麦基因命名指南,该指南已得到小麦研究界的认可。小麦研究界今后使用这些指南,以促进独立研究数据的整合,通过更广泛和更有效地使用文本和数据挖掘方法,这最终将有助于进一步加速小麦研究和育种。

研究背景

小麦是世界上种植最广泛的谷物,其生产的谷物约占全球蛋白质和热量消耗的 20%。小麦产量的可持续性依赖于育种,育种致力于通过改善病原体抗性、非生物胁迫耐受性、最终使用质量和产量潜力等性状来维持和提高粮食产量。传统上,小麦的基因命名是基于形态或表型特征,这些特征在遗传上被映射为离散的遗传单位或基因座。因此,基因座被定义为基因、限制性位点、断点、插入或其他可区分特征所在的可变大小的染色体位点。最近,小麦、其祖先和密切相关物种的参考序列和全基因组序列的组装,以及对基因表达的进一步了解,促进了基因座下分子序列的识别。这些进展为小麦科学带来了令人兴奋的阶跃变化,并鼓励基于其他物种描述的同源物来分析小麦基因功能的研究。随着突变体群体的产生和转化能力的提高,增强了我们检查基因功能的能力,作者预计将会出现大量新的突变体。基因座在未来几年被发现并报告。基于报告基因座的预期扩展,作者提出了一套更新的指南,用于指定基因的名称和符号,供小麦界采用。在这里,作者描述了在小麦中使用基因符号的更新指南,其基础是(i)根据形态或表型特征识别的基因座名称(在“赋予形态、生理和谷物质量特征、蛋白质和基因的符号化的推荐规则”中) 疾病/害虫抗性”部分)或(ii)一旦潜在基因已被识别(即克隆)以及通过与其他物种的序列相似性识别的基因(通常没有报告的表型)的基因命名法(在“生化分子命名法指南”中) 小麦和相关物种中的位点”部分)(图1)。作者还提供相关遗传实体和大分子的命名指南,包括基因复合体(在“基因复合体”部分)、假基因(在“假基因”部分)、蛋白质(在“蛋白质”部分)、DNA 标记(在“符号”中)  DNA标记”部分)、数量性状基因座(“控制数量性状的基因座和等位基因的符号”部分)、害虫和病原体反应基因(“病原病害反应基因命名指南”部分)  ,以及谷物蛋白质和酶(在“蛋白质和酶变异的基因命名指南”部分)。

图1 小麦基因命名法的一般流程;虽然基因可以定义为具有已知或预测功能或表型的 DNA 片段,而等位基因可以定义为基因序列的变异,但作者采用了 McCouch 等人的优先顺序。根据功能/表型区分“等位基因”与序列变体或“单倍型”

基因名称

该名称应简要描述与由于基因座的突变或等位基因形式而呈现的表型相关的主要特征,例如 参与开花春化反应的基因被命名为春化(VRN),那些降低植物高度的基因被命名为降低高度(RHT)。除了一些经典的基因名称(例如 Q、C、s)外,应避免使用单字母名称。

基因名称的格式

在命名遗传因素时应优先考虑罗马字母和阿拉伯数字。源自其原始名称的遗传因素的符号应以斜体或独特类型的罗马字母书写。基因座名称应以大写斜体书写(例如 SR9、VRN-A1);显性或半显性等位基因的名称和符号应以大写首字母 (Sr9a) 开头,隐性等位基因的名称和符号应以小写字母 (sr9sr9a) 开头(对于例外情况,另请参阅《生化和 DNA 位点符号的特殊规则》  “生化命名法”和“指定相似大分子结构的基因”部分,以及“病原和害虫反应基因命名指南”部分中的宿主:病原体/害虫系统)。同样,对于 VRN-A1 基因座,显性或半显性等位基因应为 Vrn-A1,隐性等位基因应为 vrn-A1。尽可能将符号中使用的所有字母和数字写在一行上;应避免使用上标或下标,除非用于指定小麦野生近缘基因组。

符号化

加号 (+) 不会用于小麦遗传因素的符号化。在描述单个基因的杂合条件或等位基因是共显性的情况下,则应该用斜杠分隔每个等位基因来书写基因型。例如,VRN-A1 的杂合基因型应表示为 Vrn-A1/vrn-A1;杂合的共显性基因型可以表示为Sr13a/Sr13b

具有相似表型效应的基因

具有表型相似作用的两个或多个基因应由共同的基本符号指定。非等位基因位点(模拟基因、聚合基因等)将根据两个程序进行指定:一,在顺序聚合基因系列中,阿拉伯数字紧跟在基因符号后面,例如 SR9、SR10、SR11。二, 在直系同源集合中,基本符号后跟连字符(“-”),后跟采用可接受的基因组符号形式的基因座名称和由阿拉伯数字表示的同源集合编号,例如 VRN-A1 表示第一个春化 (VRN) 组的 A 基因组成员。VRN-B1 将指定第一个 VRN 组的 B 基因组成员。另一方面,VRN-A2 表示第二个 VRN 组的 A 基因组成员。这些数字的顺序应参考其发现顺序,如果在一份出版物中报告了多个数字,则它们应遵循基于染色体位置的升序。重要的是,染色体名称不应包含在基本符号中,例如 位于 5A 染色体上的 VRN-A1 不应命名为 VRN-5A、VRN1-5A 或类似名称。不同的等位基因或独立突变起源的等位基因由基因座名称或数字后面的小写罗马字母指定,例如 Sr9aVrn-A1a(参见“等位基因”部分)。

临时符号名称

如果连锁数据不可用或不确定,则提供临时符号,可用于在更全面的遗传分析之前或在无法免费获得适当的种质的情况下命名基因座。这些名称应由基本轨迹符号 (SR) 组成,后跟品系的缩写(最多 3 个字母)(例如 Fr 代表联邦)以及代表轨迹的阿拉伯数字,例如 SRFr1、SRFr2等是指小麦品种联盟(Fr)中对禾本科柄锈菌有反应的两个位点。建议根据早期的表型或基因数据检查其他实验室(例如 SRFr3)的记录。






 最新文章