铁皮石斛基因组揭示了这种重要兰科药用植物的生物学特征外文翻译资料

 2023-01-07 10:35:55

铁皮石斛基因组揭示了这种重要兰科药用植物的生物学特征

摘要

铁皮石斛是一种具有观赏价值和广泛疗效的中国传统兰科植物。本文首次报道了铁皮石斛从头组装的1.35 Gb基因组序列,采用的是第二代Illumina Hiseq 2000高通量测序技术和第三代PacBio测序技术。我们发现兰科植物有一个完整的花序基因集和一些特定的花序基因。我们观察到在基因家族中与真菌共生和抗旱性有关的基因发生了明显的扩增。我们分析了铁皮石斛药用成分的生物合成途径,发现了与多糖合成有关的SPS和SuSy基因的广泛重复,并且可以利用铁皮石斛生物碱合成途径最终合成16-表啡肽。铁皮石斛基因组组装展示了一种破译大型复杂基因组的新方法,作为一种重要的兰科药用植物,铁皮石斛基因组的破译将促进兰科植物进化的深入研究,也将推动石斛药用成分和遗传育种领域的进一步研究。

关键词:铁皮石斛、基因组、兰科植物、Illumina测序、PacBio测序

Yan L., Wang X., Liu H., Tian Y., Lian J., Yang R., Hao S., Wang X., Yang S., Li Q., Qi S., Kui L., Okpekum M., Ma X., Zhang J., Ding Z., Zhang G., Wang W., Dong Y., Sheng J. (2015). The Genome of Dendrobium officinale Illuminates the Biology of the Important Traditional Chinese Orchid Herb. Mol Plant. 8, 922-934.

引言

石斛属是兰科植物中仅次于鳞茎属的第二大属,已鉴定出1000多种具有较高观赏价值和药用价值的植物(Shao等,2004;Takamiya等,2011),分布于亚洲、几内亚和澳大利亚(费尔南多和奥梅罗德,2008)。其中,中国已鉴定出74种(Takamiya等人,2011年)。

石斛属既有附生种,也有石生种,芽多,气生根多(Ng等人,2012年)。大多数是异花授粉的,并且在同一物种中,花粉和柱头的成熟时间通常不同,进一步增强了异花授粉(Slater和Calder,1988)。一些石斛属植物的茎含有具有抗氧化和抗肿瘤活性的化合物,这使得它们作为用于缓解胃部不适,促进体液生成,具有滋“阴”和退热的传统药物价值(Takamiya等,2011; PPRC,1997)。石斛材料在医疗保健中的广泛使用(Halberstein,2005;Shoemaker等人,2005;Wojcikowski和Gobe,2014)极大地增加了对Dendrobii Herba(石斛的一种药品)的需求,导致石斛野生资源严重枯竭。Dendrobium officinale Kimura et Migom自1300年前的唐朝以来就被称为“中国最着名的石斛之一”。野生草本植物由于其健康效益和生长周期缓慢,与许多石斛属植物一样,已濒临灭绝,现已被列为中国珍稀濒危药用植物之一(Xi等,2010)。迄今为止,已经将几种分析方法应用于石斛属物种的分子鉴定和基因分型(Yukawa等人,1996;Lau等人,2001,Zhang等人,2003b;Asahina等人,2010和Takamiya等人,2011)。然而,还没有人考虑到石斛的基因组测序。在这个基因组时代,破译草药基因组是理解和改进这些研究不足的草药的重要步骤。到目前为止,仅报道了药用蘑菇灵芝的基因组(Chen等人,2012年),而石斛的基因组尚未完全测序。在这项研究中,我们报告了第一个基因组草案,由于其杂合子的存在,使得该树的基因组难以装配,我们在该树的基因组装配中采用了第二代测序(SGS)和第三代测序(TGS)技术。

结果和讨论

SGS、TGS和组装

在这项研究中,我们报告了铁皮石斛的第一个基因组草案的汇编。我们从中国云南省普洱市的一位农民处采集了一株绿色的F3代人工自交树突菌株,利用Illumina Hiseq 2000 SGS系统对其进行了基因组测序。原始组装168.98 Gb(补充表1和2)来自配对末端和配对文库的清洁读数产生了D. officinale的基因组草案,总长度为1.66 Gb,重叠群和支架N50大小为9572 bp和40.14 kb(表1)分别使用SOAPdenovo(Li et al。,2010)进行组装。当具有高重复含量和杂合性时,基因组大小可以膨胀(Tenaillon等,2011)。这个陈述已经证明对于这个组装是正确的,因为我们的流式细胞术分析将估计的D. officinale基因组大小约为1.27 Gb(补充图2)。我们还尝试使用另一个基于de Bruijn图的汇编程序ALLPATH-LG(Gnerre等人,2011)进行初始组装,但结果并不比上面获得的更好(补充表3)。

为了克服可能的高重复内容和杂合性,我们设计了一个新的基因组装配管道,结合Illumina数据,10倍覆盖PacBio原始数据,原始PacBio读数的错误纠正,以及几个填补空白(PB Jelly和SOAP Gap Closer) )和脚手架工具(SOAP scaf-folding,SSPACE)(详见补充图3和4)(Li et al。,2008; Au et al。,2012; Boetzer et al。,2011)。这条管道导致了铁皮石斛初稿基因组的第一个版本(v1.0)的基因组装配,具有1.35 Gb复合基因组的可观组装度量,其重叠群和支架N50大小分别为25 122 bp和76 489 bp(图 图1B和1C,表1)。 组装的质量评估导致光源数据映射率高于94%,表明大部分石斛基因组是组装的(补充表4和5)。使用核心真核基因作图方法(Cegma)(Parra等人,2007年)将石斛基因组注释与一组核心真核基因进行比较,结果显示,代表227个(91.5%)的基因(补充表6)。已组装的铁皮石斛基因组包含5 432 657个单核苷酸多态性和387 615个独立子,缺口比例约为5.97%(补充表7),导致0.48%的杂合性(补充表8)。

与其他具有相似重复含量和杂合度相似的复杂植物基因组相比,主要通过短枪第一代或SGS破译(Ming等人,2008;Schnable等人,2009;van Bakel等人,2011;Peng等人,2013),铁皮石斛基因组组装的支架N50尺寸低于木瓜和毛竹。但重叠群N50较大,有利于基因注释(表2)。对于相对较短的支架N50长度,可能是由于基因组中的分散和频繁重复导致的,这使得即使是长插入物配对,也很难固定两端,从而可能导致支架延伸的中断。然而,装配的铁皮石斛基因组的重叠群和支架N50接近于第一个玉米参考基因组(Schnable等人,2009年),该基因组由Sanger BAC通过BAC方法测序,表明SGS和TGS杂交方法为大型复杂Ge-N的从头测序和装配提供了一种新的、经济有效的替代方法。此外,开发了一种利用SGS读取来修正PacBio读取的省时算法,将进一步提高该技术的优点。

基因组注释

基于从头和同源性的基因预测相结合(Guo等人,2013年)在铁皮石斛基因组草案中生成了一个包括35567个蛋白质编码基因(补充表9)的官方基因集,之后利用转录组数据对基因结构进行了改进。使用Blastp到SwissProt和TrEMBL数据库,根据比对的最佳匹配分配基因功能; 97.56%(34 699个基因)预测的基因可以通过这些方法在功能上注释(补充表10)。

此外,我们还鉴定了396个核糖体RNA(rrna)、545个转移RNA(trna)、16个小RNA(srna)、89个小核RNA(snrna)和1005个小RNA基因(补充表11)。873.9mb重复元素通过基于结构的分析和基于同源性的比较进行注释,识别出的重复元素涵盖了大多数类型的植物转座元素。这些元素构成了铁皮石斛基因组的63.33%(表2和补充表12),类似于大豆(69%)(Schmutz等人,2010年)和番茄(63.2%)(Sato等人,2012年),但高于芝麻(28.5%)(Wang等人,2014a年)、葡萄藤(62.2%)(Jaillon等人,2007年)和油棕(57%)(Singh等人,2013年)。考虑到重复序列是最难测序和组装的部分,利用SGS数据证明药用植物基因组中重复序列含量高是药用植物基因组组装的挑战因素之一。与其他测序的植物基因组一样,主要是吉普赛型和科皮亚型的长末端重复(LTR)逆转录转座子占优势(总重复的60.87%)(补充表13)。在重复性元素中,29.13%的元素不能被划分为任何已知的家族,这表明铁皮石斛相较于其他兰科植物可能包含许多新的重复性或转置元素。转座因子散度分布(匹配区取代率与构建库中的一致重复率相比)在31%(补充图5)处显示出一个主峰,高于鲤鱼(17.3%)(Xu等人,2011年)和黄瓜(10.4%)(Huang等人,2009年),这表明铁皮石斛中转座因子的增殖可能发生在比鲤鱼和黄瓜更早的时间。

图1 测序样本和基因组组装过程

(A)序列菌株绿色。

(B)装配工艺。(a)Hiseq短读组件;(b)将Hiseq高质量短读与容易出错的长PacBio读对齐(错误由黑条指示)。校正后,可以检测到PacBio校正的长读数和hiseq短读数脚手架之间的重叠;(c)PBjelly间隙填充;(d)间隙更近。

(C)每个装配步骤的连续N50和支架N50状态,以及基因大小支架代表的铁皮石斛基因组的部分。初级Y轴(红色和蓝色)显示每个装配步骤的N50长度,次级Y轴(绿色)显示估计基因大小支架的百分比3.5kb(植物基因的平均长度)。

从分类学上讲,铁皮石斛属于单子叶植物的天门冬氨酰,它靠近阿雷卡尔和百合。尽管这些单子叶植物中有一些已经存在序列,但天门冬科和百合科却没有。为了鉴定基因家族,使用Orthomcl(Li et al.,2003)将来自6个代表性单子叶植物物种(短足类、水稻、高粱、锐齿麝、美洲橡子和桂树)的序列信息和另外3个双子叶植物作为外群(拟南芥、毛白杨和葡萄),将基因聚类到13446个基因家族中。(补充表14和补充图6)。共发现有1462个基因家族被发现是铁皮石斛特有的,与植物发育、抗病性、应激反应和木质部和纤维素合成的光控制有关(补充表15)。据估计,铁皮石斛约1.22亿年前,从阿雷卡尔(Arecales)、金伯利(Zingiberales)和荷包人(Poales)到1.3亿年前的双子叶植物(Dicots)谱系(图2)。

表1 铁皮石斛基因组组装的统计信息

与环境适应和共生有关的扩展基因家族

铁皮石斛为附生或石生植物,具有较强的抗旱能力,生长在热带炎热地区。在抗旱性方面,相容性溶质积累(渗透液)是一个关键的机制,主要由糖、糖醇、氨基酸和有机酸组成,这有助于提高细胞的渗透潜能,防止水分流失,保持膨胀(Zhang等,1999)。在扩增的基因家族中,我们鉴定了几个与环境胁迫相关的基因家族(图3a):与气孔密度和分布调节有关的枯草杆菌蛋白酶样(SDD1)基因(Berger和Altmann,2000年)和丝氨酸/苏氨酸 - 参与耐热性的蛋白磷酸酶7(PPP7)基因调节拟南芥中的光敏色素信号传导(Liu等人,2007年)。此外,还扩增了丙二酰辅酶A:花青素3-O-葡萄糖苷-6“-O-丙二酰转移酶(8mat)基因家族。该基因家族与花青素的含量密切相关(铃木等人,2002年),当植物耐旱时,花青素含量丰富(Nakabayashi等人,2014年)。上述基因家族在铁皮石斛基因组中的扩展可能与其抗旱性有关(图3a)。

兰科植物与真菌具有显著的共生关系(Zhou等,2003)。在石斛中,植物和真菌形成菌根,以提高根系对养分的吸收能力,促进石斛的生长(Smith,1967;Zheng等人,2010)。然而,当真菌大量生长时,真菌和药用植物之间的物质平衡被打破,因此,真菌开始从植物中吸收营养物质,导致植物死亡并出现疾病症状(Yan,2005年)。有趣的是,参与植物防御反应的几个基因家族在铁皮石斛基因组中被鉴定出来:受体样蛋白激酶基因家族有三个按基因功能分类的家族(图3b),包括LRR受体样丝氨酸/苏氨酸蛋白激酶,主要用于植物的发育和免疫(postel et.al.,2010);天冬氨酸蛋白酶(aspr1)基因在细菌抗病性中起作用;以及拟南芥抵抗丁香假单胞菌pv.番茄所必需的udp糖基转移酶(ugt)73b基因(Simon等人,2014年)。此外,还发现了几种与病原感染防御反应有关的独特基因家族:甘露糖特异性凝集素基因家族,属于进化相关蛋白的单一超家族(Barre等人,1996),具有多种功能,包括防止真菌和与真菌和细菌的共生(Rudiger和Gabius,2001年);热休克70kDa蛋白,参与大分子易位、碳水化合物代谢、先天免疫、光系统II修复和激酶活性调节(Wang等人,2014b);CCR4相关因子1,参与调节体内的mRNA死亡,并在植物防御中发挥作用(Liang等人,2009年)。这些基因家族的扩展(图3A)和铁皮石斛中这些独特家族的进化可能归因于植物与真菌共有的共生特征。

加快进化速度的基因

铁皮石斛基因组是一个新的同源研究谱系,旨在鉴定与特殊花卉进化、药用植物和特殊环境适应机制相关的分子工具箱。为了确定在铁皮石斛中显示加速进化特征的基因,我们使用PAML中的分支模型(Yang,2007)比较了图2中使用的9个物种中所有基因的非同义替

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[279003],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。