Multiomics driven identification of glycosyltransferases in flavonoid glycoside biosynthesis in safflower
多组学驱动的红花类黄酮苷合成中的糖基转移酶鉴定
摘要
红花是一种重要的油料作物,因其花瓣中含有临床上有价值的类黄酮苷而在传统中医中使用了数千年。然而,由于缺乏高质量的参考基因组和在药用红花品种中关键生物合成途径基因的识别,这些化合物的生物合成及分子调控仍然未解。在本研究中,我们结合基因组学、比较基因组学、组织特异性转录组分析与生化分析,采用多组学综合策略,识别了红花类黄酮苷合成中的尿苷二磷酸糖基转移酶(UGTs)。我们组装并注释了药用红花品种“云红3”的高质量参考基因组。综合的比较基因组分析表明,红花中发生的全基因组三倍体事件有助于类黄酮生物合成途径相关基因的扩增。通过结合比较转录组分析与酶促反应,我们鉴定出11种新的UGT,这些UGT能够催化橙皮素查尔酮和苯氟醇转化为相应的O-糖苷。此外,我们概述了氢氧红花黄A(HSYA)生物合成的分子途径,特征是17种新鉴定的UGT,这些UGT具有有前景的催化活性,为HSYA的合成生产奠定了基础。我们的研究报告了药用红花中类黄酮苷合成的系统基因组和基因表达信息,并提供了调控HSYA生物合成机制的见解,这将有助于红花中类黄酮苷的遗传改良和合成生物工程设计。
1. 引言
红花(Carthamus tinctorius L.)是一种全球栽培的药用植物,因其具有治疗特性而受到推崇(Ekin 2005; Dordas and Sioulas, 2008)。干燥的管状红花花朵长期以来被用于促进血液循环、缓解血瘀、缓解月经痛,其使用首次记录在《开宝本草》中(Asgarpanah and Kazemivash, 2013)。现代医学研究已验证了红花的广泛药理活性,包括扩张冠状动脉,以及其抗凝、抗血栓、抗氧化和抗炎作用(Han et al., 2009; Zhou et al., 2014; Zhang et al., 2016; Li et al., 2019a; Li et al., 2019b)。红花的药用价值与其活性成分密切相关。截至目前,已有200多种化合物从红花植物中分离出来,包括类黄酮、精胺、生物碱、木质素、有机酸和类固醇(Kazuma et al., 2000; Yue et al., 2013; Hong et al., 2015)。多年的临床和药理学研究表明,这些化合物中的大多数可以影响心血管、大脑血管、神经和免疫系统,使其成为多种疾病的潜在药物(Asgarpanah and Kazemivash, 2013; Zhou et al., 2014; Zhang et al., 2016; Martin and Li, 2017)。
类黄酮衍生物是红花中最丰富的活性化合物,它们大多以糖苷的形式存在(Zhou et al., 2014)。根据其糖基化形式,约三分之二的类黄酮被分类为O-糖苷,包括橙皮素、山奈酮、槲皮素、木犀草素及其衍生物(Hattori et al., 1992; Lee et al., 2002; Qu et al., 2015)。一些与红色和黄色色素相关的其他糖苷被命名为奎诺查尔酮C-糖苷(Xian et al., 2022)。其中,氢氧红花黄A(HSYA)是最有价值的药用化合物(Yin and He, 2000; Yue et al., 2014; Li et al., 2017; Zhang et al., 2020)。特别是,HSYA已被作为红花药用价值的指标,列入《中华人民共和国药典》(2015年版)。它还被中国国家食品药品监督管理局批准为治疗心血管疾病的新药(Li et al., 2012; Ao et al., 2018; Sun et al., 2018)。
大多数植物天然产物,包括类黄酮,经历了各种后期修饰(例如糖基化、甲基化、酰化和羟基化)以形成其最终的复杂多样结构。糖基化是最常见的修饰之一(Alseekh et al., 2020)。糖基化化合物对植物的生长发育、代谢调节、激素平衡、授粉、内外毒素的解毒作用以及防御反应等至关重要(Vogt and Jones 2000; Jones and Vogt 2001; Stevenson et al., 2017; Brazier-Hicks et al., 2018)。此外,与其前体相比,活性成分的糖基化通常会增加其极性和药理活性(Luzhetskyy et al., 2008)。因此,糖基化化合物在医学、农业和其他工业中得到了广泛应用(Liu 2014; Hsu et al., 2018; Itkin et al., 2018; Khan et al., 2019)。
糖基转移酶通过将糖基从活化的糖基供体转移到受体上,对于类黄酮糖苷的后翻译修饰至关重要(Alseekh et al., 2020; Chung et al., 2020)。通常,糖基化发生在类黄酮骨架的C-3、C-6和C-7位点。糖的种类、糖苷键的位置和糖甙的差异,常常导致结构和功能上多样的类黄酮(Sato et al., 2006; Xie et al., 2014; Wang et al., 2020)。在类黄酮生物合成途径中,橙皮素查尔酮作为一个重要的前体,经历一系列修饰(例如糖基化),生成类黄酮和黄酮醇(Tohge et al., 2017)。它还被认为参与了奎诺查尔酮C-糖苷的生物合成,包括HSYA。尽管糖基化对于红花中类黄酮糖苷的生物活化至关重要,但糖基转移酶的克隆或鉴定较少。UGT酶如何修改橙皮素查尔酮生成糖苷仍不清楚。
测序技术的快速发展显著促进了药用植物遗传信息的探索和与疾病相关的基因位点的鉴定(Teng et al., 2018)。最近发布的红花染色体规模参考基因组为类黄酮生物合成提供了基因组学的见解(Wu et al., 2021)。先前的转录组学研究已鉴定出许多与类黄酮生物合成相关的候选基因,包括编码查尔酮合成酶(CHS)、UGT和查尔酮异构酶(CHI)的基因(Chen et al., 2020; Qiang et al., 2020; Wu et al., 2021)。然而,关于红花中UGT家族的进化和功能尚未进行系统分析。研究红花中类黄酮糖苷的糖基化面临的主要障碍包括药用品种的基因组资源有限以及缺乏已鉴定的功能性UGT。本研究中,我们采用了多组学策略,结合比较基因组学和组织特异性转录组分析,筛选了类黄酮糖苷特异性的UGT基因,随后通过体外酶促反应鉴定功能性UGT,并通过分子对接分析探索催化机制。我们鉴定了一系列候选UGT基因,其中17个与HSYA的生物合成途径相关。这些UGT基因中的11个编码的酶能够催化橙皮素查尔酮和苯氟醇生成相应的糖苷化合物。
2. 材料与方法
2.1 基因组组装
使用新鲜的红花叶片组织提取基因组DNA。通过SMRTBELL Express模板制备试剂盒2.0,制备了40 kb插入的PacBio SMRTbell文库。该SMRTbell文库在SMRT PacBio Sequel II平台上进行测序,获得了142.72 Gb的PacBio读取数据。使用CANU软件(版本1.8,GitHub - marbl/canu: A single molecule sequence assembler for genomes large and small.)对PacBio读取数据进行预处理并组装成contig,参数设置为“genome size=1.35G”(Koren et al., 2017)。为了纠正和填补拼接错误,使用组装器HERA(版本1.0)通过默认参数将contig更新为超contig(Du and Liang, 2019)。
采集了来自活植物的新鲜年轻叶片组织,按照BioNano Genomics的指南进行处理。使用BioNano植物组织DNA提取试剂盒(BioNano Genomics)从叶片中提取高分子量DNA,并使用DpnII内切酶(BioNano Genomics)进行荧光标记,基于BioNano Direct Label和Stain技术。经过超过两小时的室温染色后,将荧光标记的DNA加载到Saphyr芯片上,在BioNano Genomics Saphyr系统上扫描,获得了475.7 Gb的Bionano数据。这些数据用于辅助使用Bionano Solve软件(版本3.3)进行支架构建。通过Juicer和3D-DNA(Durand et al., 2016; Dudchenko et al., 2017)结合202.56 Gb的Hi-C数据,整合了最终的超contig和支架。
2.2 基因组注释
使用三种基因预测方法对红花基因组进行注释,包括原位预测、组装转录本和蛋白质同源物。在原位预测中,使用了四个程序,包括Glimmer-HMM、SNAP(版本2.3)、GeneMark-ET(版本4.57)和AUGUSTUS(版本3.3)(Korf, 2004;Majoros et al., 2004;Stanke et al., 2004;Ter-Hovhannisyan et al., 2008)。从Phytozome数据库(Phytozome v13)下载了C. cardunculus、S. lycopersicum、A. thaliana、C. nankingense、H. annuus、V. vinifera、L. sativa和T. kok-saghyz的注释蛋白质序列(Goodstein et al., 2012)。这些蛋白质序列用于通过GeMoMa(版本1.6.1)软件进行同源预测(Haas et al., 2008)。所有预测的基因模型通过EvidenceModeler(EVM)合并成一个非冗余的基因结构集(Haas et al., 2008)。总共预测了35,162个来自红花基因组的具有转录本支持的基因。基因功能注释通过与多个功能数据库进行比对,如Swiss-Prot、eggNOG(进化基因谱系:非监督的同源群)、NR(非冗余蛋白质序列数据库)、Pfam和GO(基因本体论)来完成。基因组组装和注释的完整性通过使用BUSCO(基准普遍单拷贝同源基因版本3.0.2)(embryophyta_odb10)(Simao et al., 2015)进行评估。我们使用LTR_FINDER(x86_64-1.0.5)和LTR_retriever(v1.9)软件(Xu and Wang, 2007;Ou and Jiang, 2019)扫描红花基因组中的长末端重复逆转录转座子(LTR-RTs)。其中,使用tRNAscan-SE(v1.3.1)(Lowe and Eddy, 1997)软件识别tRNA结构。使用INFERNAL(v1.1.2)软件(Nawrocki and Eddy, 2013)对非编码RNA进行注释。然后,通过对Rfam数据库进行比对,将非编码RNA分类为不同类型,包括miRNA、snRNA和snoRNA。
2.3 基因组进化与WGD事件分析
通过基于Blast的方法识别同源基因对,并使用MCscanX(版本1.0)(Wang et al., 2012)确定共线性同源基因。通过OrthoFinder(版本2.2.6)(Emms and Kelly, 2015)使用默认参数对同源基因家族和旁系基因家族进行分类。总共选择了195个单拷贝同源基因来构建系统发育树。通过MAFFT(v7.402)(Katoh et al., 2005)独立对每个基因家族的蛋白质序列进行比对。使用RAxML-NG(v. 0.9.0)(Kozlov et al., 2019)通过最大似然法(ML)构建系统发育树,采用最佳拟合模型GTR+G4,该模型由ModelTest-NG(Darriba et al., 2020)估计。通过PAML包(v4.9)中的MCMCTree程序估计物种间的分歧时间。采用TimeTree(http://www.timetree.org)中的葡萄和咖啡(111-131百万年)的分歧时间进行校准。GO和KEGG通路富集分析使用R(版本3.6.3)中的clusterProfiler包进行(Yu(111-131)-f30u7qv98bc5a654apf49mc46dgs8azoku8szm9deeapa6687gbhck60c345cg10b.xn--gokeggr(3-gd9nm6tmniroz6m0b0hbr68gohk8n6ijvict7a.6.xn--3)clusterprofiler(yu-c545a452e9s0q3goderub/) et al., 2012)。为了估算红花全基因组重复事件的时间,我们使用KaKs_Calculator(版本2.0)(Wang et al., 2010)中的YN模型计算红花共线性块基因的Ks值。应用8.25×10^-9的同义突变率来计算Asteraceae的WGDs年龄(Badouin et al., 2017)。基因家族的扩展或收缩通过CAFÉ(版本4.2)(De Bie et al., 2006)进行计算。
2.4 转录组测序与分析
新鲜的红花植物被分为五个组织:花、冠毛、苞片、叶和茎。所有样本立即在液氮中冷冻,并在-80°C下存储,直至RNA提取。每个组织采集三个生物学重复。使用EasyPure® RNA试剂盒(Trans,北京,中国)按照厂家说明提取这些组织的总RNA。使用NanoPhotometer®分光光度计(IMPLEN,加利福尼亚,美国)检查RNA纯度。使用Qubit® RNA Assay Kit在Qubit® 2.0 Flurometer(Life Technologies,加利福尼亚,美国)中测量RNA浓度。使用Bioanalyzer 2100系统的RNA Nano 6000 Assay Kit(Agilent Technologies,加利福尼亚,美国)评估RNA完整性。使用NEBNext® Ultra™ RNA Library Prep Kit for Illumina(NEB,美国)按照制造商的推荐构建cDNA文库。文库制备后,使用Illumina Hiseq X Ten平台进行测序,并生成双端读取。使用Hisat2将RNA-seq读取比对到红花基因组,并使用StringTie(版本2.0.3)(Kim et al., 2015;Pertea et al., 2015)将其组装为转录本。DESeq2(版本1.30.1)用于进行不同组织之间的差异基因表达分析,具有生物学重复。使用R(v4.0.3)软件绘制图中的热图。此外,通过Trinity(Grabherr et al., 2011)对RNA-seq数据进行转录本组装。这些转录本证据被映射到组装上,并通过程序化拼接对齐预测(PASA)(版本2.0.1)(Campbell et al., 2006)预测基因模型。转录组测序之前,使用了来自中国成都中医药大学中药资源特色研究所的红花管状花MeJA处理的转录组数据(Chen et al., 2020)。这些转录组数据在当前研究中进行了分析。
2.5 MYB转录因子的鉴定、系统发育与调控分析
使用Pfam蛋白家族数据库(Pfam is now hosted by InterPro)中的MYB(PF00249)隐马尔可夫模型(HMM)作为查询入口,对红花基因组的蛋白质数据进行HMM搜索(El-Gebali et al., 2019)。获取的蛋白质序列进一步通过使用Conserved Domain Search(https://www.ncbi.nlm.nih.gov/cdd/)网站资源工具进行确认(Lu et al., 2020),并与Pfam数据库中的注释蛋白进行比对。根据不同转录组数据中每个基因的reads,使用edgeR分析差异表达基因,比较组包括花-苞片、花-茎、花-叶和花-冠毛。然后,使用SPSS软件计算MYB转录因子基因与途径基因之间的皮尔逊相关系数,构建共表达调控网络,以追溯途径中的特定MYB基因。通过Cytoscape(Shannon, 2003)显示该网络。为了确定鉴定的MYB基因是否与类黄酮生物合成相关,我们从GenBank数据库下载了拟南芥、苹果、三花龙胆、番茄和杂交紫罗兰的所有已知MYB基因。使用CLUSTAL-X(Larkin et al., 2007)对蛋白质序列进行比对,并使用MEGAX(Kumar et al., 2018)在p-距离模式下构建邻接树,使用1000次自助法并进行完全删除。通过在线网站ITOL(iTOL: Interactive Tree Of Life)可视化树状图(Letunic and Bork, 2019)。
2.6 候选UGT基因的筛选与功能验证
根据基因功能注释信息和组织表达信息,我们筛选了187个全长候选UGT序列,这些序列具有保守的结构域且FPKM > 5。其中,23个UGT基因由于在花中的高表达水平被进一步筛选用于分析。我们对这23个UGT基因进行了体外功能鉴定,发现其中8个具有糖基转移酶活性。此外,我们还对候选UGT基因进行了同源序列比对,涉及先前文献中报道的各种糖基转移酶(Modolo et al., 2007;Brazier-Hicks et al., 2009;Schnable et al., 2009;Chen et al., 2015;Ito, Fujimoto et al., 2017;He et al., 2019;Mashima et al., 2019;Gao et al., 2020)。共筛选出了11个候选基因,最终鉴定出34个糖基转移酶。
使用DNAMAN生成多重序列比对,以可视化保守基序。为了进行系统发育树分析,从NCBI数据库下载了来自其他物种的UGT氨基酸序列,并使用ClustalW进行比对。然后,使用MEGA X软件通过1000次自助法迭代构建邻接树。使用PrimeScript 1st Strand cDNA合成试剂盒(Takara,大连,中国)制备红花的cDNA。设计引物后,我们克隆了共34个UGT基因,PCR产物根据Seamless Cloning Kit(Beyotime,上海,中国)协议,连接到N端MBP融合表达载体HIS-MBP-pET28a(HIS,组氨酸;MBP,麦芽糖结合蛋白)中。我们将成功测序的阳性菌株转化到大肠杆菌BL21(DE3)(Transgen Biotech,北京,中国)中,并在含有卡那霉素(50 μg·mL^-1)的Luria Bertani液体培养基中,37°C摇床培养,直到600 nm的光密度(OD600)达到0.6-0.8。然后,加入异丙基β-D-硫代半乳糖苷(IPTG)至最终浓度0.5 mmol·L^-1,培养在16°C,200 rpm条件下诱导16小时,表达重组蛋白。pET28a转化的大肠杆菌BL21(DE3)细胞作为对照平行处理。
为了研究CtUGT10的生化性质,采用Ni-NTA亲和层析法纯化重组CtUGT10。通过离心(10,000 g,4°C)收获重组细胞,然后用100 mmol·L^-1 Tris-HCl缓冲液(pH 8.0)重悬,并加入1 mmol·L^-1苯基甲基磺酰氟,使用冰水浴超声波破碎10分钟(每4秒震荡一次,暂停6秒)。样品裂解液在15,000 g,4°C离心40分钟以分离粗酶与细胞碎片。进行UGT活性测定,反应体系总量为100 μL,含100 mmol·L^-1粗酶缓冲液(pH 8.0)、1 mmol·L^-1 UDP-葡萄糖和0.1 mmol·L^-1受体底物,在37°C下反应12小时,反应结束后加入200 μL甲醇终止反应。通过离心(10,000 g,10分钟)去除沉淀的蛋白质,过滤后注入。
探索不同条件对酶活性影响的实验方法如下:
pH值的影响:最终浓度(总反应体积100 μL)如下:UDPG 2 mmol·L^-1,橙皮素查尔酮0.2 mmol·L^-1,加入20 μg纯化蛋白,50 mmol·L^-1缓冲液。不同pH值的缓冲液制备:50 mmol·L^-1柠檬酸-钠柠檬酸缓冲液(pH:4.0、5.0、6.0);50 mmol·L^-1磷酸氢二钠缓冲液(pH:6.0、7.0、8.0);50 mmol·L^-1 Tris-HCl缓冲液(pH:7.0、8.0、9.0);50 mmol·L^-1碳酸氢钠-碳酸钠缓冲液(pH:9.0、10.0、11.0)。反应在37°C下进行12小时,每组反应平行重复三次。
温度的影响:将UDPG和橙皮素查尔酮加入50 mmol·L^-1 Tris-HCl缓冲液(pH 8.0),最终浓度分别为2 mmol·L^-1和0.2 mmol·L^-1,加入20 μg纯化蛋白。反应总量为100 μL。设置不同的温度条件(25、30、37、40、45、50、55、65°C)反应12小时,每组反应平行重复三次。
二价金属离子的影响:将UDPG和橙皮素查尔酮加入50 mmol·L^-1 Tris-HCl缓冲液(pH 8.0),最终浓度分别为2 mmol·L^-1和0.2 mmol·L^-1,加入20 μg纯化蛋白。反应总量为100 μL,最终浓度为5 mmol·L^-1的二价金属离子。向缓冲液中加入不同的二价金属离子(Ba2+、Mg2+、Ca2+、EDTA),反应12小时,每组反应平行重复三次。
反应时间的影响:将UDPG和橙皮素查尔酮加入50 mmol·L^-1 Tris-HCl缓冲液(pH 8.0),最终浓度分别为2 mmol·L^-1和0.2 mmol·L^-1,加入20 μg纯化蛋白。反应总量为100 μL。在10分钟、30分钟、1小时、2小时、4小时、8小时、12小时、24小时、48小时和72小时后分别加入100 μL甲醇终止反应。每组反应平行重复三次。
酶动力学测定:在以下条件下进行酶动力学测定:(1)4 mmol·L^-1 UDPG(糖供体)、不同浓度的橙皮素查尔酮(底物)和20 μg纯化蛋白加入50 mmol·L^-1 Tris-HCl缓冲液(pH 8.0),37°C下孵育。反应总量为100 μL。橙皮素查尔酮的最终浓度为2.5、5、10、20、60、100、150、200、250、300 μmol·L^-1,反应5小时后加入100 μL甲醇终止反应。每组反应平行重复三次。(2)以4 mmol·L^-1橙皮素查尔酮作为底物,不同浓度的UDPG作为糖供体,与20 μg纯化蛋白在37°C下孵育,并添加50 mmol·L^-1 Tris-HCl缓冲液(pH 8.0),反应总量为100 μL。UDPG的最终浓度为4、8、20、60、100、150、200、250和300 μmol·L^-1,反应5小时后加入100 μL甲醇终止反应。每组反应平行重复三次。糖苷化产物通过超高效液相色谱-四极杆飞行时间质谱(UPLC/Q-TOF-MS,Waters,美国马萨诸塞州)使用Waters ACQUITY UPLC HSS T3分析柱(2.1 × 100 mm,1.8 μm)进行检测。数据分析使用MassLynx软件(版本4.1)。橙皮素查尔酮和UDPG的Km和Vmax通过GraphPad Prism 7.04软件计算。类黄酮糖苷化合物和UDP-葡萄糖的标准品购自源叶生物科技(上海,中国)。
2.7 分子对接
UGT的同源结构通过SWISS-MODEL进行预测。分子对接使用Autodock软件(版本4.2)进行(Morris et al., 2009)。将UDP-葡萄糖(UDPG)参考UGT/UDPG复合物的结晶结构结合构象,进行糖结合口袋的对接。对接结果通过PyMOL2软件进行可视化(Schrödinger et al., 2020)。
3. 结果
3.1 药用红花品种的基因组测序、组装和注释
为了全面探索与药用红花中类黄酮糖苷生物合成相关的UGT基因,我们选择了中国的优良药用红花品种“云红3”(图1,A-C)进行综合多组学研究,结合基因组学、比较基因组学、组织特异性转录组分析与生化分析(图1,D)。 “云红3”是一个长日照作物,原产于干旱环境,具有季节性降水(Guo et al., 2009)。其生长周期大约为3-5个月(从播种到成熟收获),具体周期根据不同地区、播种时间和环境条件有所变化。在中国,“云红3”主要在西北地区种植,其花瓣作为传统中医的宝贵材料被采收。红花的开花期较短,通常持续1到2天。从管状花中采收的花瓣在干燥和储存过程中逐渐从黄色转变为红色(图1,C)。与其种子(通常作为食用油的来源)不同,“云红3”的花瓣主要用于中医药中,具有促进血液循环和消除血瘀的作用。管状花中含有多种活性成分,包括类黄酮、生物碱、多烯烃、木质素和多糖。值得注意的是,“云红3”的干燥花瓣中含有高浓度的氢氧红花黄A(HSYA)。
图1. ‘云红3’的形态学和发育特征
(A) 红花中的活性成分。提供以下代表性的化学结构:(i)氢氧红花黄A(HSYA);(ii)N-[2-(5-羟基-1H-吲哚-3-基)乙基]阿魏酰胺;(iii)接骨木苷;(iv)6-羟基山奈酮-3,6,7-O-β-D-葡萄糖苷;(v)山奈酮-3-O-β-D-葡萄糖苷;(vi)红花黄A;(vii)槲皮素-3,7-O-β-D-葡萄糖苷;(viii)红花酮;(ix)红花奎诺苷A。 (B) 红花的解剖学细节,包括花、冠毛、苞片、叶和茎。 (C) 红花在不同阶段和田间的植物形态特征。 (D) 类黄酮糖苷合成中糖基转移酶的鉴定路线图。
为了生成‘云红3’的高质量参考基因组,我们结合了PacBio测序、Bio-nano和Hi-C分析。总共生成了135 Gb的PacBio长读数、475.5 Gb的Bio-nano读数和203.2 Gb的Hi-C数据,分别覆盖了红花基因组约123.9×、436.2×和186.4×(图S1和A,表S1)。最终组装的基因组(1.09 Gb)由134个超支架组成,超支架N50为88.49 Mb,contig N50为58.25 Mb(图2,A,表1)。随后,组装的序列被定位到12条假染色体(66.38–109.56 Mb),这些假染色体占组装基因组序列的96.42%(图S1和B,表S2)。红花基因组的GC含量为37.13%(表S3)。根据基准普遍单拷贝同源基因(BUSCO)评估基因组组装的完整性,结果显示,红花基因组中的92.8%的植物基因集是完整的(1,497个基因中的1,614个BUSCO)。因此,本文描述的基因组是迄今为止组装的最完整的红花基因组(表S4)(Wu et al., 2021)。de novo预测分析的结果显示,组装的红花基因组中65.15%的部分由重复元素组成,其中长末端重复(LTR)逆转录转座子最为丰富,占基因组的约34.34%(表S5)。具体而言,LTR Gypsy和LTR Copia被鉴定为两种主要类型,分别占基因组的28.12%和16.61%。
图2. 红花基因组的进化
(A) 基因组特征和染色体位置。红花基因组的景观(从外到内):染色体编号、GC含量、重复密度、基因密度和基因组共线性。GC含量以1 Mb窗口呈现(颜色渐变表示0.02–0.42)。重复密度以1 Mb窗口呈现(颜色渐变表示0.028–0.96)。基因密度以1 Mb窗口呈现(颜色渐变表示0–144)。 (B) 包含来自10个植物物种的195个单拷贝基因的系统发育树。基因家族的扩展和收缩分别用绿色和红色标记。全基因组复制(WGD)和全基因组三倍体(WGT)事件在树上标注。 (C) 红花及其他物种中共线性块中的同义替代率(Ks)分布,通过不同颜色的线条标出。 (D) 红花基因组中旁系基因的点图,展示了WGT(1-3号染色体关系用红圈标注)事件。 (E) 受串联重复事件影响的类黄酮生物合成途径基因的染色体位置。这些基因用蓝色标记。 (F) 受WGD事件影响的PAL基因的分布。染色体之间的连接表示共线性块中的基因。
Table 1. Details regarding the final C. tinctorius genome assembly and comparison with a published version
Feature | SafflowerRS1 | C. tinctorius |
---|---|---|
Genome assembly | ||
Number of contigs | 128 | 159 |
Contig N50 (Mb) | 21.23 | 58.25 |
Longest contig (Mb) | 57.98 | 104.11 |
Assembly size (Gb) | 1.06 | 1.09 |
Repeat region of assembly (%) | 60.13 | 66.96 |
Gene annotation | ||
Number of protein-coding genes | 33 343 | 35 162 |
Average exons per gene | 6.54 | 5.5 |
Mean exon length (bp) | 269.59 | 300 |
Average CDS length (bp) | 1 265.89 | 1 380 |
Reference | Wu et al., 2021 | This study |
3.2 基因组进化与比较基因组分析
为了探索红花基因组的进化,我们将我们的组装基因组与九种植物物种的基因组进行了比较:洋蓟(Cynara cardunculus)、俄罗斯蒲公英(Taraxacum kok-saghyz)、生菜(Lactuca sativa)、南京菊花(Chrysanthemum nankingense)、青蒿(Artemisia annua)、向日葵(Helianthus annuus)、爬行麻疯草(Mikania micrantha,属于菊科)、罗布麻(Coffea canephora,属于茜草科)和葡萄(Vitis vinifera,属于葡萄科)(图S2和A,表S9)。总共将31,234个红花基因归类为15,274个基因家族,其中包括5种菊科植物共享的11,951个基因家族(图S2和B)。我们从上述10个物种中选择了195个单拷贝基因来构建系统发育树。系统发育数据表明,8种菊科物种聚集成一组,反映了它们密切的进化关系。此外,红花与洋蓟的亲缘关系最为密切,这与它们在形态特征上的相似性一致。我们估计它们大约在3191万年前分化(图2,B)。
我们还通过比较10种植物物种与其最近共同祖先的基因家族扩展与收缩情况。结果表明,在红花中,有1,043个基因家族经历了扩展,而2,918个基因家族经历了收缩(图2,B)。在收缩的基因家族中,主要的基因本体(GO)术语包括核基因组、质外连丝(细胞组分)(图S3和A),蛋白质异二聚体化活性、萜烯合成酶活性和ATP酶耦合跨膜运输活性(分子功能)(图S3和B),植物类型细胞壁组织、杰拉尼酯二磷酸代谢过程、脱落酸激活信号通路(生物过程)(图S3和C)。另一方面,扩展的基因家族富集在与叶绿体类囊体膜、光系统II(细胞组分)(图S3和D),大分子代谢过程、主要代谢过程、DNA代谢过程(生物过程)(图S3和E),ADP结合、叶绿素结合、转移酶活性和转移己糖基(分子功能)(图S3和F)相关的GO术语中。此外,京都基因与基因组百科全书(KEGG)富集分析揭示,收缩的基因家族与泛素系统和植物激素信号转导相关,而扩展的基因家族与能量代谢和光合作用蛋白质相关(图S3,G,H)(Kanehisa et al., 2000)。
为了探索红花基因组进化过程中发生的全基因组扩展事件,我们分析了同义替代率(Ks)。先前的研究表明,菊科物种共享全基因组三倍体(WGT-1)事件(Badouin et al., 2017a;Shen et al., 2018;Song et al., 2018)。红花中旁系基因的Ks分布在0.86处出现明显的峰值(约为5210万年前),这表明发生了WGT事件,该事件也发生在菊花、生菜、洋蓟等菊科植物中(图2,C)。这一事件的发生也得到了染色体散点图揭示的红花基因组中的三重共线性的支持(图2,D)。特别是,通过分析参与类黄酮生物合成途径的基因的分布和共线关系,我们鉴定出几个受串联重复事件和全基因组复制(WGD)事件影响的基因,如F3H(黄烷酮-3β-羟化酶)、4CL(4-香豆酸:辅酶A连接酶)、F3′H(类黄酮3′-羟化酶)和PAL(苯丙氨酸氨基酸裂解酶)(图2,E,F和图S4,A)。随后,我们对类黄酮生物合成途径基因进行了Ks分析,以检查红花基因组中相关的复制事件。我们观察到这些基因对的Ks分布与γ-WGT和WGT-1事件的时间一致(图S4和B)(Badouin et al., 2017),表明WGT对红花中类黄酮生物合成的积极影响。
3.3 转录组分析与筛选响应类黄酮生物合成的转录因子
为了全面了解参与类黄酮糖苷生物合成的基因的表达模式,使用来自1年生红花植物的各种组织(包括花、冠毛、苞片、叶和茎)进行转录组分析(图1,B和图S5)。我们进行了比较转录组分析,并根据我们的高质量基因组对这些酶编码基因进行了注释。我们将这些基因分为三个主要组别:上游(前体)、中游(中间产物)和下游(最终或接近最终产品)。有趣的是,这些基因表现出不同的表达模式。大多数上游基因,如PAL、C4H(肉桂酸-4-羟化酶)和4CL,在茎和苞片中高度表达,但在叶片中的表达水平较低。CHS家族基因在花中通常高度且特异性表达。此外,大多数中游基因,包括CHI、F3H和FNS,在花或冠毛中的表达比叶片和茎组织更高,这与类黄酮在组织中的特异性分布一致(图3)。
图3. 类黄酮生物合成途径中关键酶编码基因的表达模式
在基因表达热图中,红色的颜色强度增加反映了表达水平的增加,而蓝色的颜色强度增加则反映了表达水平的下降。PAL,苯丙氨酸氨基酸裂解酶;C4H,肉桂酸-4-羟化酶;4CL,4-香豆酸:辅酶A连接酶;CHS,查尔酮合成酶;CHI,查尔酮异构酶;FNS,黄酮合成酶;F3H,黄烷酮-3β-羟化酶;F3′H,类黄酮3′-羟化酶;FLS,黄酮醇合成酶;DFR,二氢黄烷醇4-还原酶;ANS,花青素合成酶;UGT,尿苷二磷酸糖基转移酶。
考虑到MYB和基本螺旋-环-螺旋(bHLH)家族成员等转录因子是植物类黄酮生物合成途径的重要调节因子(Hichri et al., 2011;Ravaglia et al., 2013;Xu et al., 2014;Liu et al., 2019;Sun et al., 2020),我们接着分析了红花中不同家族的转录因子,以为进一步探索它们的调控影响提供数据支持。我们鉴定了来自56个家族的1,928个注释转录因子。其中,AP2/ERF(Apetala2/乙烯反应因子)、bHLH、FAR1(远红光受损响应1)和MYB转录因子家族是最为常见的(表S10)。根据转录组数据,我们使用基因表达值构建了类黄酮生物合成途径基因与转录因子之间的相关网络(图S6)。网络图显示,MYB、bHLH、ERF、FAR1、C2H2-ZF(Cys2-His2锌指)和WRKY转录因子与类黄酮生物合成途径基因的关系较强,可能作为主要的调节因子。先前的研究表明,MYB转录因子也参与了其他药用植物中花青素生物合成的调控(Zhou et al., 2015;Jian et al., 2019;Sun et al., 2020;Li et al., 2021)。有趣的是,在花瓣变色过程中,通常作为药用糖苷成熟的指示,不仅氢氧红花黄A(HSYA)和红花红素显示出显著增加,而且花青素也有很大差异(Ren et al., 2022)。因此,花青素合成与药用糖苷生产可能相关,MYB转录因子作为“媒介”可能在调控这两种化合物的表达中发挥重要作用。
我们共鉴定了148个MYB基因,根据比较转录组分析,我们筛选出了30个在花中相对较高表达的基因(表S11)。我们通过计算这些30个MYB基因与类黄酮和花青素生物合成途径基因之间的相关系数,评估了它们之间的相关性,结果如调控网络图所示(图S7)。六个基因(MYB18、MYB2、MYB28、MYB26、MYB19和MYB17)与管状花中的类黄酮和花青素生物合成密切相关,提示这些编码的转录因子在红花管状花的着色和糖苷质量中可能发挥调控作用。为了进一步探究这些30个红花MYB基因与其他已知花青素相关MYB基因之间的系统发育关系,我们通过对多个蛋白质序列进行比对构建了邻接法系统发育树(图S8和表S12)。从系统发育树中我们发现,CtMYB2和CtMYB10与拟南芥中的AtMYB112(Lotkowska et al., 2015)聚类,AtMYB112是促进拟南芥花青素积累的调节因子;而CtMYB28与PnMYB27(花青素着色的抑制因子)关系更为密切。此外,我们还发现了一个特有的分支,包含CtMYB16、CtMYB17和CtMYB18,特征性地属于红花。总体而言,我们提供了这些有用的候选基因数据,未来将进行更多的实验验证。
3.4 参与类黄酮生物合成的UGT基因鉴定
大多数类黄酮作为糖苷存在,这意味着UGT在类黄酮生物合成途径中起着至关重要的作用。因此,我们深入探索了在花组织中高度表达的UGT基因,鉴定出187个高度表达的全长候选UGT基因(图4,A)。随后,进行系统发育分析(图S9和表S13),通过比对编码的氨基酸序列与拟南芥、紫花苜蓿、大豆、葡萄等物种的已报道功能基因进行比对。所有选定的基因都具有糖基化功能,其中一些是类黄酮糖基转移酶基因。这些UGT基因被归类为不同的亚家族,包括先前报道的如UGT71(Dong et al., 2014)、UGT72(Lim et al., 2005)、UGT75(Sun et al., 2018)、UGT79(Li et al., 2017)和UGT83(Modolo et al., 2007)。这一初步的UGT基因分类不仅有助于全面了解红花中的UGT家族,还可用于筛选可能具有类黄酮糖基化功能的候选基因。考虑到糖基转移酶的特性,如底物宽容性和功能多样性,我们还基于红花基因组中所有注释的UGT基因进行了本地BLAST搜索,使用先前报道的类黄酮生物合成相关UGT基因作为查询,识别同源候选基因。结合红花中类黄酮的组织特性,我们根据组织特异性的转录组数据选择了主要在花中表达的基因。最终,筛选出了34个基因作为候选基因进行进一步分析(图4,A和表S14)。
图4. 参与类黄酮生物合成途径的重组UGT功能表征
(A) 参与类黄酮生物合成的候选UGT基因。共在红花基因组中鉴定出187个UGT基因,其中23个UGT基因在花中高度表达。此外,筛选出11个已报告涉及类黄酮生物合成的UGT基因同源基因,作为红花中类黄酮生物合成相关的候选基因。 (B) 本研究中UGT催化橙皮素查尔酮(1)和苯氟醇(2)的O-糖基化反应。 (C) 使用橙皮素查尔酮作为底物的11个UGT酶催化反应的UPLC色谱图。 (D) 橙皮素查尔酮及其酶催化反应产物(1a, 1b)的UPLC-Q-TOF/MS分析。产物的化学结构展示在虚线框中。UPLC色谱图在290 nm下记录。 (E) 苯氟醇及其酶催化反应产物(2a, 2b)的UPLC-Q-TOF/MS分析。产物的化学结构展示在虚线框中。UPLC色谱图在290 nm下记录。 (F) 从酶催化反应产物(1a, 1b, 2a, 2b)中提取的分子离子峰。 (G) 不同UGT的糖苷化产物的转化率(%),以UDPG作为糖供体。转化率是基于UPLC峰面积比计算的。所有实验均进行三次重复(n = 3)。
为了鉴定功能性UGT,我们使用大肠杆菌表达并纯化了可溶性重组UGT蛋白,并进行了酶活性测定(图S10)。我们使用类黄酮糖苷生物合成的关键底物橙皮素查尔酮(图4,B)进行体外酶促反应。催化产物通过超高效液相色谱-四极杆飞行时间质谱(UPLC-Q-TOF/MS)系统提取并分析。我们鉴定了11个新的UGT,这些UGT能够催化橙皮素查尔酮转化为新化合物1a(图4,B、C、D和F)。这些功能性红花UGT的基因命名为:CtUGT9、CtUGT10、CtUGT13、CtUGT20、CtUGT21、CtUGT22、CtUGT33、CtUGT35、CtUGT36、CtUGT40和CtUGT41(图S12,A、C)。产物1a通过制备规模反应纯化,并通过NMR(核磁共振)分析与标准对比鉴定为prunin(橙皮素-7-O-葡萄糖苷)(图S13和A,图S14)。值得注意的是,CtUGT10、CtUGT20、CtUGT36、CtUGT40和CtUGT41被发现能够将葡萄糖基添加到橙皮素查尔酮的C4′位的羟基上,生成1b,该产物通过与标准对比鉴定为choerospondin(橙皮素-4′-O-β-葡萄糖吡喃糖苷)(图4,B、C、D、F,图S12,A、D和图S13和A)。有趣的是,当橙皮素查尔酮作为底物时,它在缓冲液中自发发生环化反应,将查尔酮骨架转化为二氢黄酮,这一反应通常被植物中的CHI催化(Liu et al., 2015;Elarabi et al., 2021)。
我们随后使用常见的类黄酮前体苯氟醇(图4,B),其结构与橙皮素查尔酮相似,作为底物,来确定这些酶是否具有相同的催化功能。令人惊讶的是,11个UGT中的10个(即除CtUGT33外的所有)催化了葡萄糖在二氢查尔酮骨架的C4′位羟基上的添加,生成2a,该产物通过与标准对比鉴定为trilobatin(苯氟醇-4′-O-葡萄糖苷)(图4,B、E、F和图S12和B,图S13,B,图S13,C和图S12和F)。一些UGT催化的反应修饰了苯氟醇的两个位置。此外,CtUGT9、CtUGT10、CtUGT13、CtUGT20、CtUGT21、CtUGT22、CtUGT35和CtUGT36也催化了葡萄糖在C2′位羟基上的添加,生成2b,该产物通过与标准对比鉴定为phlorizin(苯氟醇-2′-O-葡萄糖苷)(图4,B、D、F和图S12,B、E和图S13,B、C)。这些UGT的催化功能让人联想到Erigeron breviscapus中的F7GAT(Liu et al., 2018)和Ornithogalum caudatum中的OcUGT1(Yuan et al., 2018)的功能,但这些是首次报道的红花UGT。总体而言,这些酶能够在多个位点(例如类黄酮骨架的7、4′-OH和查尔酮骨架的2′、4′-OH)进行糖基化,表明不同的糖基转移酶具有多样的催化活性,使它们能够修饰特定的底物。这种多样性可能与蛋白质的活性口袋和结合位点有关。
3.5 分子对接与UGT酶动力学分析
分子对接方法已成为药物发现中一个越来越重要和有效的计算策略,因为它能够在原子水平上模拟小分子与蛋白质的相互作用(McConkey et al., 2002)。为了表征底物在与UGT结合后的行为并阐明基本的生化过程,我们选择了CtUGT9、CtUGT10、CtUGT13和CtUGT20进行分子对接分析(图S10和B),因为它们具有较高的活性(即糖基化橙皮素查尔酮和苯氟醇;图4,G)。橙皮素查尔酮作为反应底物,尿苷二磷酸葡萄糖(UDPG)作为糖供体。在对接分析中,橙皮素查尔酮和UDPG被检测到结合在CtUGT10和CtUGT13的结合口袋中(图5,A,B)。底物周围的氨基酸残基决定了结合口袋的形状。CtUGT10的对接结果显示,植物二级代谢产物糖基转移酶(PSPG)盒中的Trp332、Cys333、Leu336和Ser355与橙皮素查尔酮形成氢键,而His350、Trp353、Asp374和Gln375与UDPG形成氢键(图5,A)。先前的研究报告表明,UGT的活性位点中常存在一个保守的组氨酸,这个组氨酸通常靠近糖供体和受体的葡萄糖基部分(Wang, 2009)。多重序列比对显示CtUGT10的His19作为保守组氨酸存在于不同的UGT中(图S11)。此外,在CtUGT10中检测到His19与UDPG之间的氢键。同样,在CtUGT13中,PSPG盒中的Trp362、Asn363和Ser364与橙皮素查尔酮形成氢键,而Ala342、Gln344、Ala345和Glu367与UDPG形成氢键(图5,B)。此外,观察到CtUGT9和CtUGT20的PSPG盒中的许多氨基酸与这两种底物形成氢键(图S15)。这些围绕结合位点的氨基酸可能对催化活性至关重要,并且可以被靶向和修改以优化UGT的催化功能。
图5. UGT催化功能的分子对接与酶动力学分析
(A) CtUGT10(使用5u6m作为模板)在活性位点与橙皮素查尔酮结合,添加葡萄糖。展示了CtUGT10蛋白结构,周围的氨基酸残基(在3 Å范围内)用紫色棒标出。氢键用黄色虚线表示,距离用黑色标出。与橙皮素查尔酮结合的PSPG盒中的残基用红色表示,而与UDPG结合的残基用蓝色表示。 (B) CtUGT13(使用7q3s作为模板)在活性位点与橙皮素查尔酮结合,添加葡萄糖。 (C) CtUGT10的酶动力学参数研究。Km值是分别以橙皮素查尔酮和UDPG作为底物和糖供体计算的。
通过对CtUGT9、CtUGT10、CtUGT13和CtUGT20的分析,CtUGT10表现为最活跃的酶(即根据UPLC分析,橙皮素查尔酮和苯氟醇的糖基化率分别高达100%和84%)。此外,它催化了四种产物的反应(图4,G)。这些发现促使我们选择CtUGT10进行后续的酶动力学分析。我们表达并纯化了重组CtUGT10蛋白,以进行体外酶动力学测定,使用橙皮素查尔酮作为底物,UDPG作为糖供体。重组CtUGT10蛋白在pH 8.0(50 mmol · L^-1 Tris-HCl缓冲液)和37°C下表现出最高活性。其活性不需要二价金属离子(图S16)。我们计算了CtUGT10的动力学参数。橙皮素查尔酮和UDPG的最大反应速率分别为5.64 × 10−4和2.45 × 10−4 μmol · min^-1,Km和kcat值分别为92.53 μmol · L^-1和9.14 × 10−4 s−1,以及170 μmol · L^-1和3.97 × 10−4 s−1,反映了CtUGT10对橙皮素查尔酮和UDPG的良好亲和力(图5,C)。
3.6 参与HSYA生物合成的关键基因鉴定
氢氧红花黄A(HSYA)是红花中最具药用价值的类黄酮糖苷,但涉及HSYA生物合成的糖基转移酶的报告较少(Xie et al., 2014)。植物激素甲基茉莉酸甲酯(MeJA)通过上调类黄酮生物合成途径上游基因的表达并下调特定下游基因的表达,促进了奎诺查尔酮类化合物的生成,如HSYA(Chen et al., 2020)。我们通过整合公共可用的红花花朵RNA-seq数据(处理与未处理MeJA)与我们的组织特异性转录组数据,进行了比较转录组分析,以筛选出编码与HSYA形成相关的关键功能蛋白的候选基因。在HSYA生物合成途径的初步步骤中,PAL催化苯丙氨酸转化为肉桂酸。我们红花基因组中注释的8个PAL基因中有7个在MeJA处理后表达水平上调(图6,A)。值得注意的是,21个注释的4CL基因中有7个编码将肉桂酸转化为对香豆酸辅酶A的酶,且这些基因在MeJA处理后表达水平上调。此外,7个CHS基因中的4个负责将对香豆酸辅酶A和三分子马来酰辅酶A转化为橙皮素查尔酮,这些基因在MeJA处理后表达水平也上调。
图6. 参与HSYA生物合成途径的候选基因的表达模式
(A) 在基因表达热图中,红色的颜色强度增加反映了表达水平的上升,而蓝色的颜色强度增加反映了表达水平的下降。CK表示未处理MeJA的花,而MeJA表示处理了MeJA的花。用红圈标记的基因编码HSYA生物合成途径中的关键酶。PAL,苯丙氨酸氨基酸裂解酶;C4H,肉桂酸-4-羟化酶;4CL,4-香豆酸:辅酶A连接酶;CHS,查尔酮合成酶。 (B) 不同基因集之间重叠基因的维恩图。
近期的研究报道,红花花序中的HSYA浓度在外源性MeJA的作用下显著增加(Chen et al., 2020),这促使我们对UGT基因进行深入的比较分析。在检测的基因中,21个候选UGT基因在MeJA处理后表达水平上调(比对照表达水平高2倍),并且在花朵中的表达水平高于其他组织[log2(折叠变化) ≥ 1](图6,B)。此外,四个候选UGT基因编码的蛋白质被发现催化的是O-糖基化反应,而不是C-糖基化反应。因此,我们最终鉴定出17个候选UGT,这些基因可能在HSYA的生成过程中催化C-糖基化反应(图6和表S15)。
4. 讨论
红花是已知最古老的栽培作物之一。最初作为服饰和食物染料使用,现在是食用油和重要的中药。其花朵中干燥的管状花冠已被用于传统中医数千年(Delshad et al., 2018)。现代药理学研究表明,类黄酮是其显著临床活性的贡献因素。值得注意的是,最具代表性的化合物HSYA对于医学研究和治疗药物的开发具有潜在价值。然而,红花中这些类黄酮的生物合成和调控仍然相对未被深入研究,并且缺乏全面的分子遗传学和基因编辑系统,这阻碍了红花的发展。在本研究中,我们进行了多组学分析,阐明了类黄酮的生物合成,并生成了关于有价值的药用红花种质资源的数据。通过高通量测序技术,我们构建了‘云红3’的高质量染色体级参考基因组,这是一种优秀的药用红花品种,并生成了组织特异性的转录组数据。基于本研究中产生的大量遗传数据,我们进行了比较基因组分析,探索了红花与其他植物物种之间的系统发育关系,以及进化过程对类黄酮生物合成的影响。红花与其他菊科植物之间共享了一个WGT事件,这对红花中的类黄酮生物合成产生了积极影响。我们呈现的这些发现可作为未来系统性研究菊科植物物种进化和分歧的支持材料。
此外,我们比较了不同组织中途径基因的表达模式,发现部分上游基因(如PAL、C4H和4CL)的拷贝在茎、叶、苞片和冠毛中高度表达,少数在花中高度表达,而CHS、CHI、FNS、F3H和FLS基因在花中专门表达,包括一些后修饰的UGT基因。基于以上结果,我们推测类黄酮的前体可能首先在茎或叶中合成,然后转移到花中或最终在花中进行修饰,这一假设需要进一步的研究来支持。除了途径基因,我们还对红花的转录因子进行了兴趣分析,重点分析了MYB家族基因。许多报告表明MYB转录因子调控次生代谢物的生物合成,例如丹参中的丹参酮和苯酸(Deng et al., 2020;Zhou et al., 2021;Liu et al., 2022;Liu et al., 2023)。通过比较不同组织中基因的表达水平及其与类黄酮和花青素生物合成途径基因的相关性,我们筛选出一系列候选MYB基因,这些基因可能参与红花颜色和活性成分的形成。我们重点阐明了红花中类黄酮形成的过程,特别是关键的糖基转移酶基因。根据我们注释的基因组和组织特异性转录组数据,我们首先鉴定了187个UGT基因。通过使用已发布的功能UGT基因进行BLAST分析,并选择在花中高度表达的基因,我们将初步的187个UGT基因筛选至34个候选基因。这些UGT基因的全长序列被用于在大肠杆菌中表达重组蛋白并进行体外酶活性测定。质谱和NMR数据表明,这些新的11个UGT催化了橙皮素查尔酮生成prunin(橙皮素-7-O-葡萄糖苷)。此外,这些11个UGT中的五个还生成了另一种糖苷,choerospondin(橙皮素-4′-O-β-葡萄糖苷)。值得注意的是,在这一过程中观察到查尔酮骨架的自发环化,这与其他类似反应(如Pueraria thomsonii中的异黄酮糖基转移酶)报道的结构变化一致(Duan et al., 2022),显示了类黄酮生物合成的复杂性和不可预测性。当使用苯氟醇作为底物时,11个UGT中的10个催化了trilobatin(苯氟醇-4′-O-葡萄糖苷)的生成。此外,8个UGT还生成了另一种糖苷,phlorizin(苯氟醇-2′-O-葡萄糖苷),反映了酶功能的多样性,这也解释了红花中糖苷的结构可变性。为了进一步探讨功能性UGT的催化机制,我们选择了四种高活性的酶进行分子对接实验,识别出了可能形成底物或糖基供体关键活性位点的候选氨基酸残基。生成的分子水平数据为未来的定向进化和酶改造研究奠定了基础。
为了进一步探讨参与HSYA生物合成的酶,我们进行了比较转录组分析,结合公开数据分析MeJA的作用。我们筛选了一系列可能参与HSYA形成的基因(例如,3个4CL基因、7个CHS基因和21个UGT基因)。这些基因的表达是否受到外源性MeJA的上调,我们在本研究中确定了其中的四个候选UGT基因。因此,我们鉴定了负责红花中类黄酮生物合成的UGT基因,并筛选出了可能参与HSYA生物合成途径的有前景的候选UGT基因。本文所描述的基因资源可用于未来关于红花可持续发展的研究(如合成生物学和高质量品种的育种与栽培)。本研究中使用的策略还为研究其他宝贵药用植物的天然活性成分提供了示范。