正向遗传学筛选是分析基因功能的绝佳工具,但经常需要使用图位克隆来鉴定因果基因。这需要耗费大量时间。这一直是植物学和基础研究的瓶颈。随着DNA测序技术进步,群体测序的成本逐步下降促进了反向遗传学研究的发展。基因冗余使得突变负荷非常高,1 Kb范围内可能有35-40种突变,并且在~1200和~1500个品系的群体中每个基因有~22-23个错义或是截短突变。罗汉斯特研究中心植物科学首席科学家Peter J. Eastmond近日在植物学顶级期刊Plant Biotechnology Journal上发表了名为 “Burden tests can be used to map causal genes for a simple metabolic trait in an exome-sequenced polyploid mutant population” 的文章。该研究分析结果表明,负荷检验在不需要图位克隆的情况下能识别六倍体小麦突变体库 (Cadenza 突变体库) 中的致病性基因。
罕见变异很难被检测。负荷检验工作原理是将一个基因内的多种变异转换为一个数值。这使得所选择的变异大多是因果关系,并且具有相同的方向和幅度。这种假设很可能适用于突变种群,因为因果变异通常有害并通过序列分析能预测其严重程度。
为了研究负荷检验是否可用于Cadenza 群体,作者从1188个外显子测序系中选择了M4 (caryopses) 并利用气相色谱检测其不饱和脂肪酸 (ω-6DE) 的比例。图1a 总结了其分析流程。这些突变被赋予同等权重,包含新的终止密码子,起始密码子损失,剪切供体和受体变异以及SIFI分数<0.05的非同义突变。作者随后利用GAPIT中的单点线性模型 (CMLM) 检测了基因的负荷检验。
作者鉴定了与ω-6DE相关的三个基因和两个三联体 (P<0.05) 并用了Bonferroni 校正 (Figure 1b,c & S1). 第一个三联体包含的三个基因分别是TraesCS6A02G280000, TraesCS6B02G309400 and TraesCS6D02G260200 并且预测结果表明其为能编码脂肪酸脱脂酶2 (FAD2) 的同源物. 第二个三联体 (TraesCS7A02G378300, TraesCS7B02G280100 和 TraesCS7D02G375100) 被认为是ROD1的同源基因,它能为FAD2提供底物。TaFAD2和TaROD1的转录本在小麦中的平均长度约为1.6Kb和1.5Kb,分别编码390和300个氨基酸残基的蛋白质。
总而言之,基于基因和同源物的负荷检验可以在外显子组测序群体中确定一个简单代谢性状的因果基因。许多罕见变异的关联分析方法已经被开发出来,包括具有更复杂的加权的负担测试、方差分量和组合测试。总的来说,由更少 (和更大) 的基因控制的更多可遗传性状将可能更适合于使用负荷测试进行遗传剖析。四倍体小麦和许多其他多倍体作物,如油菜(Brassica napus) 和假亚麻 (Camelina sativa) 的突变种群也可能适用于负担测试。
文章来源:植物生物技术Pbj
官网链接:plant.biorun.com