论文网
首页 基础教育生物教学正文

兰花eIF5A基因家族鉴定与生物信息学分析

  • 投稿
  • 更新时间2018-06-18
  • 阅读量139次
  • 评分0
  • 0
  • 0

  摘要:为了系统分析兰花真核翻译起始因子5A(Eukaryotictranslationinitiationfactor5A,eIF5A)基因家族在兰花中如何发挥作用,利用兰花基因组数据库,通过生物信息学的方法,鉴定兰花eIF5A基因家族的基因结构、编码蛋白和磷酸化位点预测,通过序列比对进行进化分析。结果表明,兰花eIF5A基因家族含有eIF5A1和eIF5A2两个基因,分别含有5个和6个外显子。MEME保守基序分析显示,兰花eIF5A1和eIF5A2蛋白均含有1个保守的DNA结合寡核苷酸结合结构域(PF01287)。磷酸化位点预测分析表明兰花eIF5A1和eIF5A2蛋白均含有大量的潜在磷酸化位点。以上结果将为今后揭示兰花eIF5A1和eIF5A2蛋白的功能提供重要的线索。


  关键词:兰花;eIF5A;基因家族;进化分析


  中图分类号:S682文献标识码:A文章编号:1008-0384(2017)11-1218-06


  真核翻译起始因子5A(Eukaryotictranslationinitiationfactor5A,eIF5A)是一类普遍存在于真核生物细胞中、分子质量为16~18kDa的高度保守小分子蛋白质;是迄今为止发现的唯一含有羧腐胺赖氨酸(Hypusine)残基的蛋白质[1-2]。Hypusine是由eIF5A蛋白翻译后特定位置的赖氨酸在脱氧羧腐胺赖氨酸合酶(DHS)和脱氧羧腐胺赖氨酸羟化酶(DOHH)的作用下形成的。eIF5A前体没有活性,每个成熟eIF5A仅含有1个Hypusine残基,该残基是eIF5A行使生物学功能所必需的[3]。


  1976年,Kemper等从兔子内质网膜上分离出eIF5A[4],生化分析表明eIF5A主要功能是促进第一步甲硫氨酸的合成,故此认为eIF5A在蛋白翻译起始阶段起重要作用[5]。植物eIF5A的研究起步较晚,2004年,Thompson等从模式植物拟南芥中分离出3个AteIF5A基因[6]。后续的研究表明AteIF5A1参与次生木质部的形成,超量表达AteIF5A1的转基因拟南芥木质部增大[6-7]。AteIF5A2主要在拟南芥受机械损伤的组织中高水平表达,其能够抑制由伏马毒素B1和黑暗引起的細胞凋亡[6,8]。AteIF5A3主要在拟南芥种子中表达,超量表达AteIF5A3的转基因拟南芥的叶子变为并生叶、种子变大、同时能够响应高盐、干旱以及渗透等多种胁迫[6,9]。


  2014年11月24日小兰屿蝴蝶兰Phalaenopsisequestris(Schauer)Rchb.f.的全基因组以封面文章的形式在NatureGenetics杂志公开发表[10],为后续通过生物信息学挖掘、鉴定和分析兰花基因组奠定了相关基础。本研究从兰花基因组数据库出发,重点分析兰花eIF5A基因家族基因结构、编码蛋白的保守基序和潜在的磷酸化位点等,为进一步研究兰花eIF5A蛋白的生物学功能以及其磷酸化修饰提供重要信息。


  1材料与方法


  11兰花eIF5A基因家族基因组、cDNA和蛋白序列的获得


  拟南芥Arabidopsisthaliana的eIF5A基因及其推导的蛋白序列来自TAIR数据库(http://www.arabidopsis.org);毛果杨Populustrichocarpa的eIF5A基因及其推导的蛋白序列下载自phytozome数据库(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Ptrichocarpa);美洲黑杨Populusdavidiana和小麦Triticumaestivum的eIF5A蛋白序列来自NCBI数据库(https://www.ncbi.nlm.nih.gov/)。


  分别以拟南芥AteIF5A1(AT1G13950)、AteIF5A2(AT1G26630)、AteIF5A3(AT1G69410)、小麦TaeIF5A1(AAZ95171)、TaeIF5A2(AAZ95172)和TaeIF5A3(AAZ95173)蛋白序列为参比序列,利用OrchidBase数据库中Blast程序进行BlastP检索,检索结果的全序列E值大于e50的舍去,再利用美国国家生物技术信息中心提供的在线CDS(Conserveddomainsearch)程序(http://www.ncbi.nlm.nih.gov/cdd)预测这些蛋白有无DNA结合寡核苷酸结合结构域,同时具有这2个特征的蛋白序列属于eIF5A基因家族。


  12兰花eIF5A基因家族基因结构分析


  利用OrchidBase数据库,获取兰花P.equestris中eIF5A基因家族成员基因注释,根据各成员的内含子和外显子的大小和数目,用手绘制其各自基因结构示意图。


  13


  兰花eIF5A基因家族二级结构及跨膜区结构预测


  利用在线ClustalOmega(http://www.ebi.ac.uk/Tools/msa/clustalo/)对eIF5A基因家族各成员编码蛋白的氨基酸相似性进行分析[11],利用在线二级结构预测软件SOPMA(https://npsaprabi.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html)对兰花P.equestriseIF5A蛋白的α螺旋、β折叠、β转角和无规则卷曲等二级结构进行分析[12]。利用在线软件TMHMMServerv.20(http://www.cbs.dtu.dk/services/TMHMM20/)对兰花(P.equestris)eIF5A蛋白的跨膜区结构进行预测分析[13]。


  14兰花eIF5A基因家族保守基序分析


  应用在线软件MEME(http://meme.nbcr.net/meme/cgibin/meme.cgi),对小麦、拟南芥、美洲黑杨、毛果杨和兰花eIF5A蛋白的保守基序进行分析[14]。


  15兰花eIF5A蛋白三级结构预测


  应用在线三级结构预测软件SwissModel(https://swissmodel.expasy.org/),选取其自动建模功能对兰花P.equestriseIF5A蛋白质的空间结构模型进行同源建模分析[15]。


  16兰花eIF5A蛋白系统进化树的构建


  利用ClustalX(20)[16]软件对鉴定出所有兰花eIF5A蛋白、3个拟南芥eIF5A蛋白[6]、4个毛果杨eIF5A蛋白[17]、4个美洲黑杨eIF5A蛋白[9]和3个小麦eIF5A蛋白[18]进行多重序列比对,使用MEGA60[19]软件,采用邻接(neighborjoining,NJ)算法构建系统进化树,进行1000次Bootstrap抽样。


  17兰花eIF5A基因家族编码蛋白磷酸化位点预测


  利用NetPhos31Server在线软件[20](http://www.cbs.dtu.dk)对鉴定出所有兰花eIF5A蛋白序列进行磷酸化位点预测,所有参数都选用程序默认值。


  2结果与分析


  21兰花eIF5A基因家族的鉴定和命名


  分别以3个拟南芥eIF5A蛋白和3个小麦eIF5A蛋白序列为参比序列,利用OrchidBase数据库提供的BlastP程序进行检索,共得到了3个兰花候选eIF5A基因。利用CDS程序验证特异性保守结构域(PLN03107)的存在,初步确定了2个兰花eIF5A基因。根据通用植物基因的命名方法,对鉴定到的2条eIF5A基因进行了命名,并统计了它们对应的定位名称、基因长度、位置以及对应的推导蛋白长度和外显子个数等,他们推导的蛋白质长度分别为159个氨基酸和201个氨基酸(表1)。兰花eIF5A基因家族成员分别含有4个和5个内含子,且内含子的长度远大于外显子的长度(图1)。


  利用在线ClustalOmega对兰花eIF5A1和eIF5A2基因推测编码蛋白的氨基酸相似性进行分析表明,PeeIF5A1和PeeIF5A2蛋白的相似性高达9245%。利用在线二级结构预测软件SOPMA对PeeIF5A1和PeeIF5A2蛋白的α螺旋、β折叠、β转角和无规则卷曲等二级结构进行分析。分析表明:蘭花eIF5A蛋白中无规则卷曲的比例最高(4030%~4214%),其次为α螺旋(2488%~2893%),再次为β折叠(1950%~2438%),β转角最低(943%~1045%)(表2)。利用在线软件TMHMMServerv.20对兰花eIF5A蛋白的跨膜区结构进行分析,结果显示:兰花eIF5A蛋白均不含有跨膜区(图2)。


  23兰花eIF5A基因家族保守基序分析


  利用在线软件MEME对3个小麦TaeIF5A蛋白序列、3个拟南芥AteIF5A蛋白序列、4个毛果杨PtreIF5A蛋白序列、4个欧洲山杨PdeIF5A蛋白序列和2个兰花PeeIF5A蛋白序列保守基序进行分析,结果表明兰花PeeIF5A蛋白序列中均包含有基序1(相似度为73e645)(图3)。


  24兰花eIF5A基因家族三级结构分析


  利用SwissModel对兰花eIF5A蛋白进行同源建模(图4),兰花eIF5A蛋白最终形成的三级结构在空间结构差别较大,暗示兰花eIF5A蛋白在特定的环境及时空中具有各自特异的生物学功能。


  25兰花eIF5A基因家族蛋白相似性和系统进化分析


  利用进化树分析软件MEGA60对2个谷子eIF5A蛋白、3个小麦eIF5A蛋白、3个拟南芥eIF5A蛋白、4个毛果杨eIF5A蛋白和4个美洲黑杨eIF5A蛋白全蛋白序列进行进化分析。结果显示:这16个eIF5A蛋白基本上按照物种聚类在一起,同属于杨属的毛果杨和欧洲山杨eIF5A蛋白高度同源且一一对应。单子叶植物小麦和兰花eIF5A蛋白并没有聚类到一起;双子叶植物拟南芥、毛果杨和欧洲山杨也没有聚类到一起(图5)。


  26兰花eIF5A基因家族蛋白磷酸化位点预测


  利用在线软件NetPhos31Serverl对PeeIF5A1和PeeIF5A2蛋白进行磷酸化位点预测,结果显示PeeIF5A1和PeeIF5A2蛋白中分别存在15个和22个丝氨酸、苏氨酸及酪氨酸潜在磷酸化位点,预测磷酸化位点主要是以丝氨酸的形式存在,其次是苏氨酸,络氨酸的磷酸化位点最少(表3)。预测PeeIF5A1潜在磷酸化位点中存在6个丝氨酸、7个苏氨酸和2个酪氨酸位点。PeeIF5A2潜在磷酸化位点中存在13个丝氨酸、7个苏氨酸和2个酪氨酸位点(图6)。


  3讨论与结论


  本研究鉴定兰花eIF5A基因家族含有2个成员,而已鉴定的拟南芥[6]、毛果杨[17]、美洲黑杨[9]和小麦[18]eIF5A基因家族分别含有3、4、4、3个成员,这说明在植物进化过程中,eIF5A基因可能经历了不断发生谱系的特异扩张和拷贝丢失。兰花eIF5A基因家族的2个成员分别含有5个和6个外显子,均含有1个保守的DNA结合寡核苷酸结合结构域(PF01287),这表明eIF5A基因家族的高度保守性,推测eIF5A蛋白在植物诸多生理过程中起着类似作用。不同植物中eIF5A基因家族含有的成员数目存在差异,推测不同植物的各成员在特定组织参与不同的生理过程。


  目前,eIF5A基因家族各成员确切的功能分析主要集中在拟南芥和杨树等模式植物中。近年来,伴随着植物基因组学、生物信息学等新兴学科的兴起,大量的eIF5A基因从不同植物中克隆出来,部分林木eIF5A基因成功克隆且功能也得到初步分析。毛果杨和欧洲黑杨之间的eIF5A基因间是一一对应关系,而兰花eIF5A基因并没有表现出与之相对应的关系,表明尽管是高度保守的基因家族在经过长期进化,同属杨属的毛果杨和美洲黑杨eIF5A基因还未发生分离,而与其他植物发生了分离。单子叶植物小麦和兰花eIF5A蛋白并没有聚类到一起;双子叶植物拟南芥、毛果杨和欧洲山杨也没有聚类到一起,据此推测植物eIF5A蛋白并不能简单按照单子叶植物和双子叶植物进行区分。与兰花PeeIF5A1和PeeIF5A2同源性较高的AteIF5A1在拟南芥中参与次生生长过程[6-7]。与毛果杨PtreIF5A2和欧洲山杨PdeIF5A2高度同源的毛白杨PtoeIF5A2主要响应了高盐(300mmol·L-1)等非生物胁迫[21]。而与毛果杨PtreIF5A4和欧洲山杨PtreIF5A4高度同源的毛白杨PtoeIF5A4在林木次生生长中起关键作用[22]。因此不能简单推测兰花PeeIF5A1和PeeIF5A2的生物学功能,其各成员确切的生物学功能还需要逐一进行功能验证。


  磷酸化分析表明,兰花PeeIF5A蛋白存在大量潜在磷酸化位点。目前,植物eIF5A蛋白确切的生物学功能尚未见报道。Lebska等通过多重序列比对发现玉米ZmeIF5A蛋白存在2个潜在的能被CK2蛋白磷酸化的位点,分别将ZmeIF5A以及这2个潜在的丝氨酸磷酸化位点突变(Ser2Ala和Ser4Ala)为丙氨酸并进行体外重组蛋白的表达及纯化,只有ZmeIF5ASer2Ala重组蛋白不能被玉米CK2蛋白磷酸化。玉米原生质体瞬时转化发现ZmeIF5A和模拟Ser2不磷酸化的Ser2Ala融合EYFP熒光蛋白均匀地分布在细胞核和细胞质中,而模拟Ser2磷酸化的Ser2Asp融合EYFP荧光蛋白仅在细胞核内表达,表明:玉米ZmeIF5A蛋白中Ser2是决定其进出细胞核的关键位点[23]。兰花PeeIF5A蛋白中潜在的磷酸化位点(尤其是丝氨酸)还需要通过潜在位点的定点突变、体外磷酸化等试验进一步研究和验证。


  兰花基因组中鉴定出PeeIF5A1和PeeIF5A2两个eIF5A基因家族成员,分别含有4个和5个内含子。兰花eIF5A蛋白均含有1个保守的DNA结合寡核苷酸结合结构域(PF01287),且含有大量潜在的磷酸化位点。


  作者:张伟杰