【科研知识】高通量测序之应用

综述
高通量测序(High-Throughput Sequencing)又名下一代测序(Next Generation Sequencing,NGS),是相对于传统的桑格测序(Sanger Sequencing)而言的。 根据研究发展阶段来分,NGS应用可以分为5个阶段:种质资源评估时期、基因定位时期、基因组测序时期、基因功能机制研究时期和功能基因应用时期。

1) 种质资源评估时期:主要是依赖分子标记来评估遗传多样性,筛选核心种质,增加种质资源开发的利用价值,提高效率;

2)基因定位时期:在种质资源评估时期获得一些遗传差异大,性状变异大的材料来构建资源群体和作图群体,通过GWAS或遗传作图方法来定位基因座;

3)基因组测序时期:控制性状基因座的定位只是得到一个标记区间,要想知道控制该性状的基因或者调控元件,需要进一步测序基因组,确定是哪个基因或者哪个调控元件发生变异导致性状变异;

4)基因功能机制研究时期:在确定了功能基因或者功能元件后,需要进一步确定该基因或调控元件是如何影响到最终的性状;

5)功能基因应用时期:确定了导致性状差异的遗传变异后,可以开发成诊断标记或者育种芯片应用于医学诊断和遗传育种。

分类介绍
1、种质资源评估

种质资源评估可以利用传统的SSR标记技术或基于高通量测序的RAD技术。前者所需要的SSR开发,可以先通过基因组denove测序然后拼接成scaffold序列,再利用MISA软件寻找SSR设计引物[1],也可以通过转录组测序拼接转录本,再通过转录本开发SSR引物[2]。RAD技术是利用基因组酶切位点保守的特征,针对特定长度的片段进行测序,从而获得多态性SNP标记的技术[3]

通过SSR或RAD技术获得分型数据后,再对种质资源进行遗传多样性评估,对个体间的亲缘关系进行比较,获得个体间的遗传距离矩阵,进而构建进化树。再根据一定的阈值筛选有代表性的个体作为核心种质资源[4]

2、基因定位

在基因组还没有测序之前,可以针对一些特殊的种质资源,进行性状控制位点的定位。主要针对遗传作图群体和自然群体,分别进行QTL定位分析和全基因组关联分析。遗传作图群体的亲本选择一般要求遗传差异大、性状差异大、差异性状多(一个群体可以做多个性状的QTL定位)。针对遗传作图群体的QTL定位目前有两种技术路线可以选择:

1)对作图群体所有个体进行基因组分析和性状统计[5]

2)利用BSA方法,将某一性状的极端个体混合,再找关联的分子标记,但条件是该物种已有参考基因组[6];性状可以是传统的农艺性状(株高、产量、开花期、含油量、千粒重等),也可以是分子表型(基因RNA表达量[7]、代谢产物[8]、区域可及性[9]等)。

3、基因组测序

基因组测序最基础的工作是将某一个代表性个体进行denovo测序,再将重复序列和功能基因(mRNA基因,miRNA基因, lncRNA基因)及功能元件(enhancer、 promoter、 5’UTR、 3’UTR)注释出来。目前普遍采用三代Pacbio或ONT长读长平台测序,再结合Hi-C技术获得基因组互作关系数据,组装获得较完整的基因组序列。一般基因组都会存在较多的重复序列,在功能基因注释之前,先将重复序列注释出来,然后将重组序列屏蔽,再将编码基因注释出来。在传统的基因组基因注释中,普遍只做了mRNA基因的注释,而没有将miRNA和lncRNA注释出来,miRNA和lncRNA基因在基因的表达调控中也起着重要的作用。有些也没有对基因组的功能元件进行注释,包括增强子(H3K27ac和H3K9ac的ChIPseq可以检测增强子)和启动子(CAGE-seq可以检测启动子)等,特别是增强子,其存在近端增强子和远端增强子,远端增强子一般会跨过一个基因或多个基因对目标基因起调控作用。

物种形成的过程也伴随着物种分化的过程,在不断经历着基因组加倍和二倍化的过程,通过比较基因组的分析,可以揭示基因组进化的痕迹,探索物种的性状形成的遗传基础。通过同一物种不同品种的基因组分析,可以挖掘出物种的核心基因和品种特有基因,为性状控制基因挖掘提供基础。

4、基因功能机制研究

通过QTL定位或者GWAS分析获得某个特定的候选基因与目标性状形成存在关联,然后还要弄清该基因是如何导致性状改变的,这涉及到调控通路或代谢通路的解析[10–12]。抗逆研究主要涉及的研究是抗逆机理解析,需要对调控通路进行解析,包括信号的感受器解析、信号转导过程等研究。用得较普遍的方法是先通过组学方法找到变化的基因,对胁迫前后的材料检测DNA甲基化差异(BS-seq),组蛋白修饰差异(ChIP-seq),mRNA表达差异(RNA-seq),miRNA表达差异(sRNA-seq),lncRNA表达差异,蛋白组差异,代谢组差异等,再利用整合组学数据分析手段解析调控元件与目标基因的关联[13]

5、育种芯片和诊断试剂盒

 通过QTL定位和GWAS分析获得候选的功能基因,或者通过系统生物学方法获得关键的上游关键基因,在经过功能验证以后,就可以转变成功能标记用于育种和医学诊断应用。针对农作物来说,在获得多个优势等位基因关联标记后,就可以通过聚合杂交育种集中到一个品系中,实现优势性状的聚合。某些疾病也是由于某些关键基因的异常表达导致,把这个关键基因的转录本设计一对引物,通过PCR手段即可检测该基因的表达,从而达到诊断相关疾病的目标。

6、数据库搭建

基因组数据库可以包含mRNA基因数据、miRNA基因数据、lncRNA基因数据、调控元件数据、SNP变异结果,indel变异结果,QTL定位数据、GWAS关联结果,eQTL定位结果等。表观多组学数据库可以包含基因组和基因数据及变异数据,ChIP-seq的peak结果,ATAC-seq的peak结果,RNAseq的表达结果,Hi-C的loop结果,BS-seq的甲基化结果等。

研究项目针对性
针对不同的研究团队,建议选用不同的研究方案,这样产生科研成果的成功率更高,具体总结如下:

《【科研知识】高通量测序之应用》

小远对NGS的应用做了一个相对全面的介绍,以及每一类应用适合什么样的研究团队也进行了分类,大家看完之后如果有相关的需求可以联系我们噢!

点击此处回答问卷
前3名填写问卷的人可以获得NGS业务1000元优惠券,先到先得,手速一定要快!

References:

1. Zhou X, Dong Y, Zhao J, Huang L, Ren X, Chen Y, et al. Genomic survey sequencing for development and validation of single-locus SSR markers in peanut (Arachis hypogaea L.). BMC genomics. 2016;17:1–14.

2. Dutta S, Kumawat G, Singh BP, Gupta DK, Singh S, Dogra V, et al. Development of genic-SSR markers by deep transcriptome sequencing in pigeonpea [Cajanus cajan (L.) Millspaugh]. BMC plant biology. 2011;11:1–13.

3. Yang G-Q, Chen Y-M, Wang J-P, Guo C, Zhao L, Wang X-Y, et al. Development of a universal and simplified ddRAD library preparation approach for SNP discovery and genotyping in angiosperm plants. Plant methods. 2016;12:1–17.

4. Muzzalupo I, Vendramin GG, Chiappetta A. Genetic biodiversity of Italian olives (Olea europaea) germplasm analyzed by SSR markers. The Scientific World Journal. 2014;2014.

5. Qiu D, Morgan C, Shi J, Long Y, Liu J, Li R, et al. A comparative linkage map of oilseed rape and its use for QTL analysis of seed oil and erucic acid content. Theoretical and Applied Genetics. 2006;114:67–80.

6. Imerovski I, Dedić B, Cvejić S, Miladinović D, Jocić S, Owens GL, et al. BSA-seq mapping reveals major QTL for broomrape resistance in four sunflower lines. Molecular Breeding. 2019;39:1–15.

7. Majewski J, Pastinen T. The study of eQTL variations by RNA-seq: from SNPs to phenotypes. Trends in Genetics. 2011;27:72–9.

8. Vosman B, Kashaninia A, van’t Westende W, Meijer-Dekens F, van Eekelen H, Visser RGF, et al. QTL mapping of insect resistance components of Solanum galapagense. Theoretical and Applied Genetics. 2019;132:531–41.

9. Sun W, Poschmann J, Del Rosario RC-H, Parikshak NN, Hajan HS, Kumar V, et al. Histone acetylome-wide association study of autism spectrum disorder. Cell. 2016;167:1385–97.

10. Xue W, Xing Y, Weng X, Zhao Y, Tang W, Wang L, et al. Natural variation in Ghd7 is an important regulator of heading date and yield potential in rice. Nature genetics. 2008;40:761–7.

11. Wang Q, Su Q, Nian J, Zhang J, Guo M, Dong G, et al. The Ghd7 transcription factor represses ARE1 expression to enhance nitrogen utilization and grain yield in rice. Molecular Plant. 2021.

12. Wang H, Jiao X, Kong X, Liu Y, Chen X, Fang R, et al. The histone deacetylase HDA703 interacts with OsBZR1 to regulate rice brassinosteroid signaling, growth and heading date through repression of Ghd7 expression. The Plant Journal. 2020;104:447–59.

13. Parvathaneni RK, Bertolini E, Shamimuzzaman M, Vera DL, Lung P-Y, Rice BR, et al. The regulatory landscape of early maize inflorescence development. Genome biology. 2020;21:1–33.

《【科研知识】高通量测序之应用》

点赞

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注