摘要:对植物基因组数据库和过氧化物酶数据库中玉米谷胱甘肽过氧化物酶(zea mays glutathione peroxidase,zmgpxs)进行查找和比对,确定了6个zmgpxs,采用生物信息学方法对其进行了理化性质、亚细胞定位、结构域、高级结构、外显子和内含子构成等分析。结果表明,尽管6个zmgpxs序列的氨基酸数量不同,但均属于碱性蛋白质,具有6个外显子和5个内含子,其中5个zmgpxs高级结构表现为二聚体,具有植物gpxs的特征基序。亚细胞定位分析发现zmgpxs主要定位于线粒体、叶绿体、过氧化物酶体和细胞质中。结构域分析表明zmgpxs属于硫氧还蛋白超家族。
关键词:谷胱甘肽过氧化物酶(glutathione peroxidase,gpx);玉米(zea mays);生物信息学
中图分类号:q554+6 文献标识码:a 文章编号:0439-8114(2013)11-2675-05
1 方法
1.1 数据来源
数据资料来源于植物基因组数据库(phytozome,http://www.phytozome.net)和过氧化物酶数据库(peroxibase,http://peroxibase.toulouse.inra.fr/),从中获得zmgpxs的基因序列和氨基酸序列。
1.2 方法
利用dnaman软件对所获得的氨基酸序列进行序列比对和理化性质分析,其保守结构域、磷酸化修饰、跨膜结构域、亚细胞定位和高级结构分别采用ncbi protein blast(http://blast. ncbi. nlm. nih.gov/)、netphos 2.0 server(http://www.cbs.dtu.dk/services/netphos/)、tmhmm2.0 server(http://www. cbs. dtu. dk / services / tmhmm-2.0)、psort(http:// psort. hgc. jp / form. html)和swiss-model(http://swissmodel.expasy.org/)在线工具分析,利用mega 5.0进行系统进化树分析。
2 结果与分析
2.1 zmgpxs检索分析结果
经过检索,在植物基因组数据库(phytozome)中共获得7个编码玉米gpxs的基因序列(zmgpxs),注册号分别为zm2g011025、zm2g013299、zm2g12479、 zm2g135893、 zm2g144153、zm2g329144和zm5g884600。在过氧化物酶数据库(peroxibase)中也获得了7个zmgpxs序列,其名称分别为zmgpx01、zmgpx02、zmgpx03、zmgpx04、zmgpx01-2、zmgpx01-3和zmgpx03-2。采用dnaman软件和ncbi protein blast对来源于2个数据库中的玉米gpxs序列进行比对分析,结果表明,在基因组数据库所获得的zmgpxs序列中的zm2g144153、 zm2g329144、 zm2g135893、zm2g12479和zm2g013299等5个序列编码的氨基酸序列分别与peroxibase中的zmgpx01、zmgpx02、zmgpx03、zmgpx04和zmgpx03-2同源性达到100%,zm2g013299与zmgpx01-3同源性为98%,zm5g884600与zmgpx01-2同源性为95%。zm2g011025没有获得较高的同源性分析结果。根据上述比对分析结果,玉米基因组中推测的7个编码zmgpxs的序列中有6个可以确定,参考peroxibase的命名,分别为zmgpx01、zmgpx02、zmgpx03、zmgpx04、zmgpx03-2和zmgpx01-2,另外1个(zm2g011025)尚不能确定。
2.2 zmgpxs的理化性质
对经过比对分析确定的6个zmgpxs氨基酸序列进行理化性质分析,结果见表1。由表1可知,6个zmgpxs中氨基酸数量最少为166,最多为246;分子量最小是18.347 ku,最大为26.811 ku。zmgpxs的等电点(pi)介于7.04~10.06之间,其中zmgpx04的等电点为10.06。用tmhmm 2.0 server在线软件分别对6个zmgpxs的氨基酸序列进行分析,所有肽链跨膜结构域的可能性均为0,说明zmgpxs序列不存在跨膜结构,不是跨膜蛋白。
2.3 zmgpxs磷酸化修饰位点与亚细胞定位预测
用netphos 2.0 server分别对6个zmgpxs的氨基酸序列进行潜在磷酸化位点分析,比较6个zmgpxs所具有的潜在磷酸化位点总数,可见zmgpx03的磷酸化位点数最高,为18,其次为zmgpx01和zmgpx01-2,分别为15和14,而zmgpx02具有的磷酸化位点数最少,为7。
gpxs功能的发挥与其亚细胞定位有关,使用psort在线工具对6个zmgpxs进行亚细胞定位预测分析。结果显示,6个zmgpxs主要定位于细胞质、线粒体、叶绿体和过氧化物酶体中,除zmgpx03-2外,其他5个zmgpxs皆分布于线粒体中;zmgpx01、zmgpx02、zmgpx03和zmgpx03-2分布于过氧化物酶体中;而zmgpx01、zmgpx04、zmgpx03-2和zmgpx01-2分布于叶绿体中;此外zmgpx02还被定位于质膜上。
2.4 zmgpxs结构域特征
采用ncbi protein blast对6个zmgpxs进行保守结构域(co
nserved domains)在线分析,结果见图1。从图1可以看出,尽管6个序列的氨基酸数量不同,但具有相同的特征:都属于硫氧还蛋白超家族(thioredoxin-like superfamily)以及谷胱甘肽过氧化物酶,都具有3个催化残基位点和二聚体界面。 利用dnaman对6个zmgpxs进行多序列比对分析(图2)。结果显示,6个序列都具有3个保守性较高的结构域:kvllinvas、feilafpcnqf和kwnfskflvd,皆为gpxs的特征基序;具有3个保守的催化残基,即c、q和w。因此6个序列都属于gpxs家族成员。此外,6个序列都具有3个半胱氨酸残基(c),该位点在动物的phgpxs中为硒代半胱氨酸残基。
2.5 zmgpxs的外显子和内含子构成
利用植物基因组数据库对编码zmgpxs的基因序列orf(open reading frame)的外显子和内含子的构成进行分析。结果显示zmgpxs的orf区均由6个外显子和5个内含子构成,内含子的剪切位点符合真核生物gt-ag规则,外显子的长度具有高度保守性,内含子的长度差异较大。每个基因的第2个至第5个外显子的长度分别是77 bp、62 bp左右、119 bp、168 bp左右。第1个外显子长度差异较大,zmgpx03和zmgpx04第1个外显子的长度大于200 bp,其他序列的第1个外显子的长度介于39~54 bp之间。除zmgpx01的第6个外显子长度为89 bp外,其他5个zmgpxs的第6个外显子的长度介于30~36 bp之间。将zmgpxs序列的3个保守结构域(即gpxs特征基序)与基因序列比对分析,显示3个保守结构域(kvllinvas、feilafpcnqf和kwnfskflvd)分别对应在第2和3个、第4个、第5个外显子上,并且位置相对保守(图3)。
2.6 系统进化树分析
利用mega 5.0构建zmgpxs家族的氨基酸序列系统进化树(图4)以及zmgpxs家族与atgpxs家族的氨基酸序列系统进化树(图5)。图4显示6个zmgpxs可聚分为两类,一类包括4个(zmgpx01、zmgpx01-2、zmgpx02和zmgpx03-2),另一类包括2个(zmgpx03和zmgpx04)。
比较6个zmgpxs和8个atgpxs在进化上的关系,除了atgpx4与zmgpx02、atgpx6与zmgpx04同源性较高外,总体上zmgpxs与atgpxs的同源性较低。
2.7 高级结构预测
同一段氨基酸序列因为具有不同的高级折叠结构而具有不同的生物功能,因此预测基因的蛋白质高级结构对于研究基因的功能有重要的意义。利用swiss-model对zmgpxs的高级结构进行预测,如图6所示。结合图6以及表2中的统计结果可以看出,除zmgpx02为单体形式(5个α-螺旋、6个β-折叠片与一些转角和无规则卷曲相互连接而形成)外,其他5个zmgpxs的三维结构均为二聚体结构,基本由12个α-螺旋、8~12个β-折叠片与一些转角和无规则卷曲相互连接而形成,此外,zmgpx02的折叠结构与其他zmgpxs的二聚体中单体的折叠结构也存在明显差异。说明两种结构类型的zmgpxs发挥功能的方式可能不同。
3 小结与讨论
根据两个数据库的比对分析,获得了编码zmgpxs的6个基因序列,分别位于2号和5号染色体上,其蛋白质分子量为18.347~26.811 ku,均不存在跨膜结构域。zmgpx03、zmgpx01和zmgpx01-2的磷酸化位点较多。一般来说,多肽链中的氨基酸潜在的磷酸化位点越多,发挥更多功能的可能性就越大。
对zmgpxs进行亚细胞定位预测的结果表明,6个zmgpxs主要定位于线粒体、叶绿体、过氧化物酶体和细胞质中,其中zmgpx04和zmgpx01-2均在线粒体和叶绿体中分布,zmgpx01、zmgpx03和zmgpx03-2在线粒体、叶绿体和过氧化物酶体上均有分布。蛋白质的亚细胞定位与其功能相关,上述亚细胞定位预测分析结果提示gpxs发挥作用的位点与产生活性氧的部位有关。
对zmgpxs结构域的分析结果显示,6个zmgpxs均具有3个催化残基和二聚体界面。zmgpx03和zmgpx04与其他4个zmgpxs相比多约70个氨基酸,但是催化残基和二聚体界面距离c端较近,说明gpxs功能发挥的位点靠近c端,而n端序列可能主要与蛋白质的亚细胞定位有关。
gpxs的3个标志性基序(kvllinvas、feilafpcnqf和kwnfskflvd)在6个zmgpxs中高度保守,且这些特征基序在拟南芥atgpxs中也具有较高的保守性,说明在植物进化过程中,gpxs的特征基序在其执行功能时发挥着重要的作用,保守性很强。
zmgpxs基因序列具有6个外显子和5个内含子,其中保守结构域所对应的外显子(第2~5个)长度保守性较强,第1个和第6个外显子长度变化较大,内含子的长度差异明显,这种特点也体现在8个atgpx
s中。编码gpxs的基因序列在不同物种的基因组中高度保守,原因可能是保守的外显子序列是植物gpxs行使功能必需的序列。差异外显子序列主要表现在第1个和第6个外显子,可能与行使其特有功能有关。内含子的差异可能是不同基因存在的不同调控机制,同时也体现了进化变异的特点。
虽然结构域分析显示6个zmgpxs都具有二聚体界面,但是zmgpxs编码的蛋白质高级结构预测结果显示6个zmgpxs在作用形式上分为两类,一类以单体形式存在(zmgpx02),一类以二聚体形式存在,说明zmgpxs可能以二聚体形式发挥功能,也可能以单体的形式发挥作用。
从进化关系上看,zmgpxs与atgpxs的同源性较低。但是zmgpxs与atgpxs在结构域上的高度保守性提示植物gpxs进化过程中保留了其基本的催化功能,而zmgpxs与atgpxs在序列与结构上的差异显示在不同植物物种中gpxs具有一定的差异。
参考文献:
[1] 杜秀敏,殷文璇,赵彦修,等.植物中活性氧的产生及清除机制[j].生物工程学报,2001,17(2):121-125. [2] gueta-dahan y, yaniv z, zilinskas b a, et al. salt and oxidative stress: similar and specific responses and their relation to salt tolerance in citrus[j]. planta,1997,203(4):460-469.
[3] herbette s, lenne c, leblanc n, et al. two gpx-like proteins from lycopersicon esculentum and helianthus annuus are antioxidant enzymes with phospholipid hydroperoxide glutathione peroxidase and thioredoxin peroxidase activities[j]. european journal of biochemistry, 2002,269(9):2414-2420.
[4] criqui m, jamet e, parmentier y, et al. isolation and characterization of a plant cdna showing homology to animal glutathione peroxidases[j].plant molecular biology,1992,18(3):623-627.
[5] li w j, feng h, fan j h, et al. molecular cloning and expression of a phospholipid hydroperoxide glutathione peroxidase homolog in oryza sativa[j]. biochimica et biophysica acta(bba)-gene structure and expression,2000,1493(1):225-230.
[6] holland d, ben-hayyim g, faltin z, et al. molecular characterization of salt-stress-associated protein in citrus: protein and cdna sequence homology to mammalian glutathione peroxidases[j]. plant molecular biology,1993,21(5):923-927.
[7] depege n, drevet j, boyer n. molecular cloning and characterization of tomato cdnas encoding glutathione peroxidase-like proteins[j]. european journal of biochemistry,2001, 253(2):445-451.
[8] miao y, lv d, wang p, et al. an arabidopsis glutathione peroxidase functions as both a redox transducer and a scavenger in abscisic acid and drought stress responses[j]. the plant cell,2006,18(10):2749-2766.
[9] goldenkova i, musiychuk k, piruzian e. bifunctional reporter genes: construction and expression in prokaryotic and eukaryotic cells[j]. molecular biology,2003,37(2):307-313.
[10] quaedvlieg n e, schlaman h r, admiraal p c, et al. fusions between green fluorescent protein and β-glucuronidase as sensitive and vital bifunctional reporters in plants[j]. plant molecular biology,1998,38(5):861-873.
[11] amtmann a, bohnert h j, bressan r a. abiotic stress and plant genome evolution. search for new models[j]. plant physiology,2005,138(1):127-130.