表型收集也可以批量化?

本文内容速览:

《表型收集也可以批量化?》

开展基因功能研究的科研人员,想必肯定了解过转录组学、表观组学、代谢组学及蛋白质组学等等。在这里想跟大家介绍另一种组学——表型组学,伯小远在往期的推文“揭秘植物表型-通过相关指标明确基因功能”中为大家介绍了常见的植物表型考察的指标。给表型考察加上“高通量”,又会给我们带来怎样的惊喜呢?现在让我们一起走进表型组学吧。
01
表型组学的概念
表型组学最早在20世纪90年代由美国凯斯西储大学流行病学和生物统计学专家Nicholas Schork在疾病研究中提出,自此针对人、动物和植物单一或系列表型的研究开始受到广泛关注。

植物表型研究始于20世纪末,其核心是获取高质量、可重复的性状数据,进而量化分析基因型和环境互作效应(genotype-by-environment interactions, GxE)及其对产量、质量和抗逆等相关主要性状的影响。相对于单一性状的检测,植物表型组检测有数据量大,数据采集快速、准确,可以将一个性状分割成多个性状来检测等特点,为高通量、快速和系统地研究基因组和表型组提供了可能,为植物研究提供了全面的科学证据(周济等, 2018)。
02
表型组学数据获取的方法
高通量图像采集技术的快速发展,使得我们能够观察植物各组织随环境和时间变化的动态过程,实现对环境变化的监测,并捕捉记录不断生长变化的植物信息。

图像采集技术按照图像的性质可分为二维成像技术和三维成像技术,不同的图像采集技术对应采集不同的表型参数,在实践中需要考虑应用场景及成本等因素来选择合适的成像技术,表1列举了常用的图像成像技术及常用的参数(杨文庆等, 2022)。

表1 常用的植物表型成像技术,改编自(杨文庆等, 2022)。

《表型收集也可以批量化?》

其中三维成像技术由于能够更直接地测量植物的形态,因而得到了广泛应用。在表征对象的三维结构时,主要有以下两种方法:主动方法使用诸如激光雷达之类的主动传感器来直接捕获三维点云,该点云代表植物在三维空间中每个部分的坐标;被动方法使用被动传感器(相机等),从多角度采集二维图像来推导出三维点云。

在对植物的三维点云进行分析时,一个必要的步骤是将点云转换为几何图形,进而提取植物器官的几何特征。2021年4月,庆应义塾大学的Ryuhei Ando、东京电机大学的Yuko Ozasa和东京大学的Wei Guo在Plant Phenomics杂志上发表了一篇题为“Robust Surface Reconstruction of Plant Leaves from 3D Point Clouds”的研究论文,该研究开发了一种叶片表面重建的方法。利用大豆和甜菜进行该方法性能评估,发现能够成功采集到三维点云并对叶片表面进行重建(图1)。

《表型收集也可以批量化?》

图1 叶片表面重建对噪声和缺失点的评价结果(Ryuhei et al., 2021)。
2021年8月,中国农业科学院蔬菜花卉研究所金黎平课题组联合中国科学院湖州技术研究与产业化中心李波课题组在Biosystems Engineering杂志上发表了一篇题为“Quantitative potato tuber phenotyping by 3D imaging”的研究论文。研究团队介绍了一种三维成像分析方法,基于所采集的三维点云的曲率来评估马铃薯芽眼的数量和深度。

通过对6个马铃薯品种的6个形状一致性的相关性状及其形状指数进行了测定,证明了三维图像分析技术可以高精度地估计土豆芽眼的数量和深度。此外,3个形状一致性特征可以为区分品种提供有力的支撑。

《表型收集也可以批量化?》

图2 点云生成的马铃薯块茎表面的三维网格(a)和标记识别芽眼(b)(Liu et al., 2021)。

《表型收集也可以批量化?》

图3 用于形状一致性相关性状测量的马铃薯块茎的俯视图和侧视图(Liu et al.,2021)。

植物高通量表型数据的获得,离不开植物表型信息收集平台的搭建。全球范围内,已有超过一百套大型表型平台正在运行中,最具有代表性的包括澳大利亚国家植物表型设施“植物加速器”、英国国家植物表型中心、德国Julich表型研究中心及德国IPK温室自动传送表型平台等。国内的大型表型分析设施建设仍处于起步阶段,我国首个大型表型分析平台是华中农业大学与华中科技大学合作研制的一套水稻表型平台—HRPF表型平台,并于2014年开始启用(胡伟娟等, 2019)。

植物表型采集平台主要包括田间型和温室型。田间作物位置固定,一般通过移动传感器的方式获取表型信息,常用的平台包括车载式平台、自走式平台、无人机平台以及飞机、卫星等。传送带平台和轨道式平台是比较常见的温室表型采集平台,传送带平台通过传送带将作物传送到成像区域成像,轨道式平台通过移动传感器实现在作物原位置上采集表型数据。表2给大家汇总了不同平台类型的特征。

表2 常见植物表型信息采集平台,改编自(杨文庆等, 2022)。

《表型收集也可以批量化?》

依托以上植物表型信息采集平台,众多科研发现已经进入我们的视野,为研究工作带来了新的启示和方向。2021年6月,华中农业大学作物遗传改良全国重点实验室代明球课题组联合杨万能课题组在Genome Biology杂志上发表了一篇题为“Using high-throughput multiple optical phenotyping to decipher the genetic architecture of maize drought tolerance”的研究论文。该研究就是利用华中农业大学和华中科技大学合作开发的HRPF表型平台,并结合高光谱、微型CT及RGB多光学成像技术对368份玉米自然群体材料在多个生长时期、正常浇水和干旱胁迫下的表型进行连续无损检测,获得了丰富的与干旱胁迫响应相关的图像性状(图4),结合全基因组关联(GWAS)分析鉴定到大量与干旱胁迫相关的候选基因和QTLs,构建了基因-表型关联网络(图5)。

《表型收集也可以批量化?》

图4 结合高通量表型和GWAS研究玉米抗旱性(Wu et al., 2021)。(A)表型平台及实验设计。左图为温室D52条件下水份充足(Well-watered,WW)和干旱胁迫(Drought stress,DS)条件下玉米群体的生长情况;中、右为不同时间点WW和DS条件下RGB、高光谱(HSI)和CT扫描仪捕获的图像(D25-D98);(B)使用本研究开发的程序进行HSI、CT和RGB图像分析和图像性状i-traits计算;(C)干旱胁迫相关图像性状筛选和后续功能基因挖掘。
通过筛选获得干旱胁迫相关的图像性状i-traits之后,利用GWAS鉴定到2318个与干旱胁迫相关的候选基因;结合候选基因通路富集分析结果构建了基因和图像性状i-traits的关联网络(图5)。

《表型收集也可以批量化?》

图5 基于图像性状i-traits的GWAS的关联和候选基因的分析(Wu et al., 2021)。(a)基因和图像性状i-traits的关联网络;(b)候选基因在糖代谢通路富集;(c)候选基因在磷酸肌醇代谢通路富集。
研究团队为了验证候选基因在调控光谱表型和抗旱性上的生物功能,在候选基因中筛选、确定了两个未知具体抗旱功能的基因ZmcPGM2(参与糖代谢)和ZmFAB1A(参与磷酸肌醇代谢)进行基因抗旱功能研究,研究结果表明挑选的这两个基因能够调控相应表型并负调控玉米抗旱。由于篇幅有限,在这里就不再详细展示了,感兴趣的小伙伴可以自行下载文章阅读。这一研究的结果向我们表明了高通量表型分析结合GWAS是一种剖析复杂性状遗传结构和克隆相关基因的新颖而有效的方法。

2024年10月,浙江大学生物系统工程与食品科学学院岑海燕课题组在Plant Phenomics杂志上发表了一篇题为“Phenotyping of Panicle Number and Shape in Rice Breeding Materials Based on Unmanned Aerial Vehicle Imager”的研究论文。研究团队对以往的无人机平台进行改良,开发出了一种基于无人机图像的全自动化、高通量的田块分割和稻穗计数方法,并且能够同时对不同稻穗进行弯曲度分类,为育种学家提供数字化的稻穗表型信息。

研究团队在15m的高度拍摄水稻冠层图像(图6),图像拼接后使用基于Mask R-CNN的田块边界自动识别算法Plot-Seg将大田图像分割成小区尺度的子图(图7),并根据齐穗-成熟时间将其分为3个生长阶段,而后根据集成多路径Transformer的稻穗识别网络Panicle-ViT准确检测单位面积稻穗数目(图8)。

《表型收集也可以批量化?》

图6 位于中国浙江省杭州市中国水稻研究所,水稻播种后98天(A)和中国浙江省嘉兴市农业科学院,水稻播种后104天(B)的水稻冠层图像(Lu et al., 2024)。

《表型收集也可以批量化?》

图7 小区田块分割流程图,通过 Mask R-CNN在农业遥感图像中进行批次分割(Lu et al., 2024)。

《表型收集也可以批量化?》

图8 Panicle-ViT架构图(Lu et al., 2024)。

03
植物表型组学的应用
植物表型数据获取技术,表型观测平台在科研工作者的努力中,一直在不断地更新,不断的向更优化的方向发展。那植物表型组学的应用方向都有哪些呢?在这里跟大家重点介绍两个方向的应用,一是智慧农业方面的应用,二是种质资源和基因解析方面的应用。
智慧农业
智慧农业是指现代科学技术与农业种植相结合,从而实现无人化、自动化和智能化管理。将物联网技术运用到传统农业中去,运用传感器和软件通过移动平台或者电脑平台对农业生产进行控制,使传统农业更具有“智慧”,除了精准感知、控制与决策管理外,从广泛意义上讲,智慧农业还包括了农业电子商务、视频溯源防伪、农业休闲旅游和农业信息服务等方面的内容。

想必大家读到此处也明白了表型组学在实现智慧农业方面的作用。比如利用表型组学的技术手段进行稻田的格田治理、水稻倒伏面积和倒伏程度检测、针对水稻田基于长势监测的施肥建议、水稻最佳割晒时间预测、基于云平台的某地区作物产量预报、自然灾害后农田作物灾情分级与定损评估等等都是可以实现的。
种质资源和基因解析
表型组学通过高通量和高分辨率的表型分析工具,能够提供大量关于植物结构、发育、组成和性能的数据,这些数据可以与基因型数据相结合,通过GWAS等方法,挖掘与特定性状相关的基因。

2020年6月,北京市农林科学院赵春江课题组联合郭新宇课题组在Plant Biotechnology Journal杂志上发表了一篇题为“Dissecting the phenotypic components and genetic architecture of maize stem vascular bundles using high-throughput phenotypic analysis”的研究论文。该研究利用显微电子计算机断层扫描(CT)表型技术结合GWAS分析,在玉米中鉴定到调控维管束数目、维管束分布密度等性状的特异候选基因。

研究团队基于480份自交系茎秆基部第3节维管束显微表型数据(图9),分析了关联群体亚群中茎秆维管束的表型变异;构建表型大数据统计分析流程,通过数据质控、正态分布检测、相关性分析、聚类分析、遗传力计算等,挖掘和萃取高遗传力、高识别度、高贡献性的维管束关键表型指标(Key Feature)30项;结合已获得的关联分析群体的基因型信息开展GWAS分析,鉴定到调控30项茎秆显微表型性状的1562个显著SNPs位点,筛选到调控维管束数目(VBNum)、维管束面积(VBAvArea)、维管束分布密度(PZVBDensity)等20项性状的84个特异候选基因(图10),发现相关候选基因属于细胞壁代谢调控酶、转录因子、蛋白激酶类和逆境相关基因,为茎秆维管束的遗传机理解析提供了新的基础理论。

《表型收集也可以批量化?》

图9 不同自交系茎横切面CT扫描图像及VesselParser 4.0软件对应的处理图像(Zhang et al., 2021)。第二行:功能区分割结果,表皮边界(蓝色)、外围(绿色)和内区(红色)用不同颜色标注。第三行:维管束分割结果,根据维管束面积进行K均值聚类,每类(共5类)用不同颜色标注。

《表型收集也可以批量化?》

图10 30项维管束关键表型-基因型调控网络图(Zhang et al., 2021)。性状和基因以不同的形状和大小呈现。30个大八边形节点中,21个绿色节点代表茎横切面、功能区几何形态特征和维管束数量特征,5个蓝色节点代表维管束面积特征,其余3个紫色节点代表维管束分布特性。基因以小圆形节点表示,不同颜色代表不同属性。红色圆形节点代表多个性状重叠的基因;浅灰色圆形节点代表基因仅与特定性状有相关性。
2022年12月,中国农业科学院生物技术研究所张春义课题组联合普莉课题组在Plant Biotechnology Journal杂志上发表了一篇题为“A spatiotemporal transcriptomic network dynamically modulates stalk development in maize”的研究论文。该研究结合表型数据和预测模型,揭示调控玉米节间发育的基因表达模式,发掘了一批参与节间数和节间长度形成的候选基因。

为了鉴定玉米快速伸长期的关键调节基因,研究团队选择5个代表性的节间进行深入的差异基因表达分析,分别鉴定了分生阶段和延长阶段的关键转录因子,例如BES1、NF-YC在节间延长阶段表达上调等。进一步结合节间长、直径、周长和重量等数据进行WGCNA分析与表型预测,构建了第一个玉米时空特异全节间基因表达调控网络,鉴定了一批与表型高度相关的基因,主要参与激素调控、信号转导等生物学过程,预示着它们在玉米的株型改良育种中可能具有重要的应用价值,可作为株高形成相关的潜在生物标记。

《表型收集也可以批量化?》

图11 差异表达基因的动态清单协调节间生长和发育(Le et al., 2022)。
2023年2月,中国农业科学院生物技术研究所张春义课题组联合普莉课题组在Molecular Plant杂志上发表了一篇题为“Integration of high-throughput phenotyping, GWAS, and predictive models reveals the genetic architecture of plant height in maize”的研究论文。该研究基于三维全自动高通量表型分析平台,通过提取图像性状i-traits结合GWAS分析,解析玉米株高形成的动态遗传基础和调控网络。

作者首先搭建了玉米高通量表型组平台(HTP),并对228份玉米自然群体材料全生育期株高相关性状变化进行动态检测,共获得了24.4万张图像,通过自主研发的图像处理程序提取出77个图像性状i-traits(图12),其中包括49个形态相关性状、20个生物量相关性状和8个生长速率相关性状。

《表型收集也可以批量化?》

图12 玉米各发育阶段高通量自动表型分析平台(Wang et al., 2023)。(A)玉米在图像室中播种、培养和图像采集;(B)从三个视图采集图像;(C)图像分析软件显示了图像处理的七个步骤:图形分割、色彩空间转换、阈值过滤器、污染移除、选择感兴趣区域、轮廓草图和骨架提取;(D)来自HTP的数据处理结合基因组测序和GWAS分析;(E)使用基因突变对一个候选基因进行功能验证;(F)显示基于机器学习的玉米株高预测模型的程序。
利用1.25M分子标记对检测的77个图形性状和20个田间性状进行GWAS分析(图13),共鉴定到4945个显著SNPs和1974个候选基因。结合候选基因通路富集分析结果构建了基因和图像性状的关联网络,并鉴定到13个与株高性状关联的关键基因。

《表型收集也可以批量化?》

图13 基于HTP的株型相关GWAS及性状与SNP间的关联网络(Wang et al., 2023)。
作者选择了ZmVATE,进一步验证了其在调控株高发育的功能(图14)。在B73突变体库鉴定出zmvate突变体,与野生型相比,zmvate突变体的株高、穗位高、雄穗长度和节间长均有所降低,但叶片长度、数量和角度均无显著差异。

《表型收集也可以批量化?》

图14 ZmVATE突变导致玉米矮化(Wang et al., 2023)。

小远叨叨
植物表型组大数据技术及其装备正处于快速发展阶段,我国在作物表型高通量信息获取与解析方面已积累了一定的经验,并在多个领域取得了显著进展。随着机器人技术、人工智能技术、传感器技术和高通量成像技术的不断发展,表型研究实现了以前靠人工无法实现的事情。此外,我国在作物表型信息采集手段、多传感器时空同步采集、多模态数据融合处理和实时在线解析等方面的技术突破,将为育种、栽培和农业实践提供更为精准、高效的基于大数据的决策支持。

References:

周济, Tardieu F, Pridmore T等.植物表型组学:发展、现状与挑战[J].南京农业大学学报, 2018,41(4): 580-588.

杨文庆, 刘天霞, 唐兴萍,等.智慧农业背景下的植物表型组学研究进展[J].河南农业科学,2022,51(7): 1-12.

胡伟娟, 凌宏清, 傅向东.植物表型组学研究平台建设及技术应用[J].遗传, 2019,41(11): 1060-1066.

Ryuhei Ando, Yuko Ozasa, Wei Guo. Robust Surface Reconstruction of Plant Leaves from 3D Point Clouds. Plant Phenomics. 2021.

Liu J., Xu X., Liu Y., et al. Quantitative potato tuber phenotyping by 3D imaging[J]. Biosystems Engineering, 2021, 210(6):48-59.

Wu X, Feng H, Wu D, et al. Using high-throughput multiple optical phenotyping to decipher the genetic architecture of maize drought tolerance. Genome Biol. 2021;22(1):185.

Lu X, Shen Y, Xie J, et al. Phenotyping of Panicle Number and Shape in Rice Breeding Materials Based on Unmanned Aerial Vehicle Imagery. Plant Phenomics. 2024;6:0265.

Zhang Y, Wang J, Du J, et al. Dissecting the phenotypic components and genetic architecture of maize stem vascular bundles using high-throughput phenotypic analysis. Plant Biotechnol J. 2021;19(1):35-50.

Wang W, Guo W, Le L, et al. Integration of high-throughput phenotyping, GWAS, and predictive models reveals the genetic architecture of plant height in maize. Mol Plant. 2023;16(2):354-373.

Le L, Guo W, Du D, et al. A spatiotemporal transcriptomic network dynamically modulates stalk development in maize. Plant Biotechnol J. 2022;20(12):2313-2331.

图文来源:伯远生物公众号

《表型收集也可以批量化?》

点赞

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注