文献
文献解读 | 丹参酮生物合成中DNA甲基化的调控机制及丹参酮甲基化特征
【背景】
丹参(Salvia miltiorrhiza,S. miltiorrhiza)是一种具有重要经济价值和药用价值的模式药用植物,丹参的根会合成一组称为丹参酮(tanshinone)的二萜类亲脂性生物活性成分。丹参酮的生物合成和调控引起广泛关注。DNA甲基化变化在调控植物种子发育、茎和叶生长、春化、果实成熟和次级代谢等方面发挥着重要作用。然而丹参的甲基化组尚未得到分析,DNA甲基化在丹参酮合成过程中的调节机制仍然未知。
【样本类型】
S.miltiorrhiza 系 99-3丹参
【技术方法】
WGBS,RNA-seq,qRT-PCR,sRNA测序
【摘要】
本研究应用无偏好性的全基因组重亚硫酸盐测序(WGBS)分析了丹参根和叶的单碱基分辨率DNA甲基化组。比较分析揭示了CG、CHG和CHH序列的差异甲基化模式,以及DNA甲基化与基因和小RNA(sRNA)表达之间的关联。分析结果表明,低甲基化基因的表达水平较高,24nt sRNA(24-nucleotide sRNA)可能关键性参与丹参RdDM(RNA-directed DNA methylation)通路。DNA甲基化变异分析表明,CHH甲基化是造成差异的主要原因。GO富集分析表明,与March_root相比,hypoCHHDMR下游重叠基因在July_root的二萜生物合成过程显著富集。丹参酮生物合成相关酶基因如DXS2、CMK、IDI1、HMGR2、DXR、MDS、CYP76AH1、2OGD25和CYP71D373,在July_root基因启动子或下游区域中的CHH甲基化水平低于March_root。与March_root相比,July_root基因表达上调,DNA甲基化抑制剂5-氮杂胞苷的处理显著促进了丹参酮合成。研究结果揭示了DNA甲基化通过改变丹参酮关键酶基因启动子或下游CHH甲基化水平,在丹参酮生物合成中起重要调控作用。
【研究结果】
丹参DNA甲基化通路相关基因及整体DNA甲基化模式
为了揭示丹参DNA甲基化的特征及其调控作用,我们首先通过BLAST搜索拟南芥DNA甲基化途径相关基因,针对丹参99-3系全基因组进行分析。结果鉴定出39个基因,其中12个是先前报道的,而其他26个是新发现的(表1)。进一步的转录组分析表明,除了MORC6外,所有DNA甲基化途径相关基因都在丹参中表达(表1)。
为了便于甲基化分析,我们将丹参99 - 3系基因组通过连接21045个小支架构建成6个超级支架。图1a显示了superscaffold1至superscaffol5 DNA甲基化的全局格局,如图1a所示,在三种序列背景下,转座因子(TE)覆盖率与DNA甲基化水平呈正相关。相反,基因密度呈负相关(图1a)。详细分析TE区和基因区DNA甲基化水平发现,TE区甲基化水平明显高于基因区(图1b),证实了图1a的观察结果。基因区的mCG表现为转录起始/结束位点减少,而基因体和侧翼区域增加。mCHH和mCHG在侧翼区域升高,但在基因体中相对减少(图1b)。TE体内所有序列上下文的甲基化水平都高于上游或下游区域(图1b)。对丹参基因组中mC的进一步分析表明,四个CG亚背景具有相似的甲基化水平(图1d),尽管它们表现出不同的密度(图1c)。在CHG子环境中,CCG的密度和甲基化水平低于CAG和CTG(图1c和d)。在CHH子环境中,CAA的密度和甲基化水平最高,CCH (CCC、CCA和CCT)的甲基化水平低于CAH (H = A、T或C)和CTH(图1c和d)。
图1 丹参DNA甲基化图谱
DNA甲基化在基因表达中的作用
为了了解基因表达与DNA甲基化之间的关系,我们根据表达水平将基因分为五组。结果显示基因表达与DNA甲基化呈负相关,但基因体mCG与转录之间没有负相关(图2a)。这提示了DNA甲基化在基因表达中的调控作用,并暗示了DNA甲基化与基因表达之间的复杂性。最重的基因体mCG出现在中等高表达基因(10 < FPKM≤50)中(图2a)。这与以往对其他植物的研究结果一致。此外,在启动子和下游区域,高表达基因mCG水平较低,而在基因体区域,高表达基因(FPKM >50)和低表达基因(0 < FPKM≤1)mCG水平最低,mCG水平相对较低(图2b)。提示mCG参与的转录调控在侧翼区和基因体区存在差异。对于mCHG和mCHH,高表达基因的所有三个基因区域(基因启动子、下游和体)的甲基化水平均较低(图2b)。为了进一步分析DNA甲基化的作用,将基因分为高表达组和低表达组。比较了不同基因组区域的甲基化水平。结果表明,无论基因组区域如何,低表达基因在所有序列背景下都具有更高程度的DNA甲基化水平(图2c)。这些数据表明,在丹参中,DNA甲基化对基因表达产生功能限制。
图2 DNA甲基化在基因表达中的作用
sRNA与DNA甲基化的相关性
为了研究丹参sRNAs在DNA甲基化中的作用,我们利用高通量测序技术对March_root和July_root的sRNAome进行了测序。经过质量控制和适配器修剪,在March_root和July_root中分别获得12 126 660和11 303 818条干净reads。21-、22-和24-核苷酸的sRNAs在两种组织中最丰富(图3a)。mC和* mC的数量分别与24核苷酸sRNAs的胞嘧啶和鸟嘌呤数量密切相关(图3b)。最后,我们分析了整个基因组中2000-bp箱子内24-核苷酸sRNAs与环境特异性甲基化水平之间的相关性。CHH DNA甲基化与24-nt sRNA之间的相关性最高(图3c)。分布模式分析显示,丹参24核苷酸sRNAs优先位于启动子和基因的3≥f边缘区域(图3d)。它们在TE的5≥和3≥f边缘区域的分布与基因的启动子和3≥f边缘区域相当,而在TE小体区域,24核苷酸sRNAs的分布要高得多(图3d)。有趣的是,基因区域的24-nt sRNA在July_root中丰度高于March_root,而TE区域无明显差异(图3d)。综上所述,24个核苷酸的sRNAs可能是丹参RdDM通路的关键参与者。
图3 DNA甲基化与24nt sRNA的相关性
不同丹参样品DNA甲基化变化特征
我们计算了3个样本(包括March_root、July_root和July_leaf)中基因和TE区域的平均DNA甲基化水平。在两个根样品中,对称序列上下文(CG或CHG)在基因和TE区域的甲基化水平相当,而mCHH水平在七月根中低于三月根(图4a和b)。这表明mCHH在丹参根中的重要性。与July_root相比,July_leaf基因和TE区域的甲基化水平较低,对于mCHH序列上下文尤其如此(图4a和b)。当计算全局甲基化水平时,也观察到类似的趋势(图4c)。考虑到基因表达与DNA甲基化之间的负相关关系(图2),这些结果表明,紫檀叶中的基因表达通常比丹参根中的基因表达更活跃。
由于DNA甲基化差异可能是由现有mC的甲基化水平差异或总mC的数量差异造成的,因此我们比较分析了三种丹参样品的DNA甲基化水平和mC的数量。结果显示,与March_root相比,July_root的甲基化水平和mCHH的数量有所降低,而mCG和mCHG的甲基化水平和mCHH的数量相似(图4d和e)。这表明,mCHH的甲基化水平和mCHH的数量都是导致March_root和July_root DNA甲基化差异的原因。此外,在所有三个序列背景下,July_root中mCs的甲基化水平都高于July_leaf(图4d),而July_root中mCs的数量略低(图4e)。由此可见,紫檀根与紫檀叶DNA甲基化的差异主要与mC甲基化水平有关,而与mC数量无关。
图4 丹参全基因组DNA甲基化比较分析
DNA甲基化参与萜烯的生物合成和代谢
为了初步阐明高dmr和低dmr相关基因在启动子、基因体和基因下游的潜在功能,我们进行了GO富集分析。结果表明,与March_root相比,July_root的低dmr相关基因显著富集了萜类生物合成和代谢相关基因(图5),而高dmr相关基因则显著富集了更基本的代谢相关生物过程,如细胞氨基酸代谢过程和线粒体mRNA加工。这一结果与快速生长的丹参根系中萜烯的生物合成和代谢比March_root更活跃的事实相一致,而July_root中丹参酮的含量高于March_root进一步证实了这一点。由于July_root与July_leaf相比存在明显的DNA高甲基化,我们对不同基因区域的三个序列背景的hyperdmr相关基因进行了GO分析。参与叶片发育、叶绿素生物合成和代谢过程的基因在CG基因下游高度富集。对于其他不同基因组位置的上下文特异性dmr相关基因,执行细胞氨基酸生物合成过程、DNA修复、mRNA加工和碳水化合物生物合成过程的基因显著富集。这表明DNA甲基化可能是影响丹参叶片发育和生物学功能的重要调控因子。
图5 与March_root相比,July_root的 hypoDMR相关基因在生物学过程显著富集
mCHH在关键酶基因启动子和下游区域对丹参酮生物合成的调控
对于高dmr相关基因,HMGR1具有启动子相关的CHHDMR;DXR和CPS1均含有与基因体及其下游重叠的CHHDMR;CYP76AH3包括一个显示所有序列上下文差异甲基化的DMR和一个显示对称序列上下文差异甲基化的DMR,分别与基因启动子和小体以及小体和下游重叠(图6b和7b)。对于次dmr相关基因,CMK在基因体中含有一个CHGDMR;DXS2、CYP76AH1和CYP76AK1分别与下游基因存在CGDMR重叠;其余基因均与chhdmr相关。在chhdmr相关基因中,DXS2、CMK和IDI1有chhdmr相关启动子。其他基因,包括HMGR2、DXR、MDS、CYP76AH1、2OGD25和CYP71D373,与下游基因有CHHDMR重叠(图6b和7b)。
图6 丹参酮生物合成上游通路中的DMR相关酶基因
图7 丹参酮生物合成下游通路中的DMR相关酶基因
为了检测DNA去甲基化在丹参酮生物合成中的意义,将DNA甲基化抑制剂5-氮杂胞苷应用于丹参酮毛状根中。结果表明,经5-氮胞苷处理的毛状根比未处理的毛状根颜色更红(图8a)。利用超高效液相色谱法(UPLC)进一步测定隐丹参酮、丹参酮I、二氢丹参酮和丹参酮IIA,发现5-氮胞苷处理后,4种丹参酮的含量显著增加,特别是30 μM 5-氮胞苷处理的毛状根(图8b)。对照和30 μM 5-氮杂胞苷处理的丹参毛状根进行了全基因组亚硫酸盐测序。分析丹参酮生物合成途径基因的DNA甲基化和表达水平。结果显示,在5-氮杂胞苷处理下,几乎所有基因的DNA甲基化水平均下调,表达水平均上调。进一步的DMR分析表明,经5-氮胞苷处理的30 μM S中,所有鉴定的DMR相关基因均含有次dmrs。除CYP76AK1外的丹参毛状根。综上所述,DNA甲基化抑制剂处理可通过丹参酮生物合成途径基因的去甲基化促进丹参酮在丹参酮毛状根中的生成。
【小结】
本研究首次在丹参中绘制了单碱基分辨率的全基因组DNA甲基化图谱。结果表明, DNA低甲基化可以上调丹参的基因表达,24nt sRNA可能是RdDM通路的主要参与者。此外,DMC/DMR分析表明,差异甲基化主要发生在CHH序列中,与March_root相比,July_root中与hypoCHHDMR相关的基因在萜烯生物合成过程中富集。最重要的是,在July_root和March_root之间的14个DMR相关丹参酮生物合成酶基因中,包括DXS2、CMK、IDI1、HMGR2、DXR、MDS、CYP76AH1、2OGD25和CYP71D373在内的9个基因在July_root基因启动子区或下游区域表现出CHH低甲基化。进一步的DNA甲基化抑制剂处理促进了丹参毛状根中丹参酮的生物合成。总之,DNA甲基化可以通过丹参酮生物合成酶基因启动子和下游的CHH去甲基化来促进丹参酮的生物合成。本研究为丹参酮生物合成的表观遗传学调控机制提供了新的见解,将有助于进一步提高丹参活性化合物的产量。
【精品解读】
文献解读 | 大规模基因组和转录组学分析阐明鸡高产的遗传基础
精品解读 | 多糖结构与活性研究范例:蛋白组与微生物组联合揭示杜仲多糖延长果蝇寿命的分子机制
排版:野凌