您好,欢迎来到九壹网。
搜索
您的当前位置:首页小麦Ta—UBX1基因的电子克隆和生物信息学分析

小麦Ta—UBX1基因的电子克隆和生物信息学分析

来源:九壹网
江苏农业科学2012年第40卷第6期 一29一 王俊生,范小芳,李成伟,等.小麦Ta—UBX1基因的电子克隆和生物信息学分析[J].江苏农业科学,2012,40(6):29—32 小麦Ta—UBX1基因的电子克隆和生物信息学分析 王俊生,范小芳,李成伟,谭光轩 (周口师范学院植物遗传与分子育种重点实验室/周口师范学院生命科学系,河南周口466000) 摘要:用电子克隆方法获得了1个小麦U—box蛋白基因Ta—UBX1,采用生物信息学方法,对该基因编码蛋白从 氨基酸组成、基本理化性质、跨膜结构域、疏水性/亲水性、亚细胞定位、高级结构及功能域等方面进行了预测和分析。 结果表明:小麦 一UBX1基因全长2059 bp,具有完整的ORF编码框,编码553个氨基酸;在N端存在1个显著的 UBX保守结构域,该蛋白序列不存在跨膜区或信号肽;生物信息学分析表明,在序列组成、高级结构及活性位点等方 面,与其他禾本科植物的同类U—box蛋白具有高度的相似性。 关键词:小麦;U—box domain蛋白基因;电子克隆;生物信息学 中图分类号:Q75 文献标志码:A 文章编号:1002—1302(2012)06—0029—04 泛素一26S蛋白酶体途径是真核生物体内一种高度选择 关于植物U—box蛋白基因序列的报道较多,但有关小 性的蛋白降解途径,这一途径中包括了E1、E2和E3等3种 麦U—box蛋白基因克隆的研究目前尚未见报道。本研究在 酶。其中泛素连接酶E3起着底物蛋白特异性识别的关键作 前期工作基础上 ,以1个在小麦生理型不育花药中上调表 用,且种类最多 。泛素连接酶E3被分为3种类型: 达的差异cDNA片段( 69)序列作为种子序列,利用电 HECTE3、RING—finger E3、U—box E3。U—box域是决定 子克隆技术,克隆了1个小麦U—box domain蛋白,并利用生 U—box E3酶活性的主要结构域,它的突变或碱基替换将使 物信息学相关软件对其进行生物信息学综合分析,为进一步 该蛋白的E3酶活性丧失 。U—box结构是一类广泛存在于 研究在小麦发育过程中的调节作用提供理论基础。 真菌、植物和动物中的高度保守的基序,最初是在泛素链聚集 酶E4的原型——酵母中的蛋白UFD2的碳末端鉴定出来 1材料与方法 的 。目前已鉴定出的真核生物的U—box蛋白中,酵母体 1.1 小麦U—box蛋白基因的电子克隆 内发现2种,动物中有6种,而拟南芥中有37种该类蛋白 J。 以差异显示技术获得的基因片段TDF269在小麦EST数 有研究表明,植物U—box蛋白参与了植物体内细胞发 据库中进行同源检索,将得到的高度相似的EST序列用 育、信号转导和光周期反应等重要生理活动。如烟草中的 BIOEdit进行拼接,获得重叠群contigl,将contigl反复对 U—box/ARM重复蛋白NtPUB4参与植物发育信号通路的调 GenBank的EST数据库进行检索拼接,直至没有新的EST入 控,表达具有时间性和空间性 ,马铃薯U—box/ARM重复 选,从而生成最后的新生序列,作为EST的延伸产物。 蛋白——光周期反应蛋白(PHOR1)参与信号传导,是赤霉 1.2小麦U—box蛋白的生物信息学分析 素(GA,)信号传导途径中的正向因子 ;另外,植物U— 1.2.1基因序列分析利用ORF finder(http://www.ncbi. Box蛋白质在抵抗干旱、高盐、异常温度等非生物胁迫时发挥 nlm.nih.gov/)在线工具预测其开放阅读框;并用软件Prime5 作用 也有越来越多的证据表明U—Box蛋白质与植物的抗 翻译其氨基酸序列。 病相关。例如拟南芥的AtPUB9与ABA信号相关 ,烟草 1.2.2理化性质分析蛋白质的疏水性分析利用ExPASy (Nicotiana benthamiana)与番茄(Solanum lycopersicum)的 网站的ProtScale(http://cn.expasy.org/egi—bin/protscale. CMPG1基因参与多个抗病基因介导的抗性反应 ;超表达拟 p1)在线分析;等电点和分子量计算采用Compute PI/MW tool 南芥的PUB22和PUB23使其对干旱胁迫的敏感性增加 , (http://www.expasy.org/tools/pi—too1.htm1)。 拟南芥U—box E3泛素连接酶AtPUB19在干旱胁迫、盐胁 1.2.3细胞定位、磷酸化、跨膜区和前导肽分析以WoLFP— 迫、寒冷和ABA胁迫下上调表达,该蛋白的下调表达会导致 SORT进行亚细胞定位分析;NetPhos 2.0 Server预测磷酸化 拟南芥的ABA脱敏反应,增加了ABA诱导的气孔关闭和耐 作用位点,TargetP 1.1 Server预测氨基酸前导肽的细胞定位。 干旱性 …;水稻SPL11蛋白,烟草、番茄、欧芹等植物中的 1.2.4二级结构、跨膜结构以及进化树构建以SOPMA和 CMPG1蛋白,拟南芥中的AtPUB17及其在烟草中的功能同源 TMHMM方法进行蛋白二级结构和跨膜结构分析。用NCBI 物ARCE276等都可参与抗病反应 ”J。 的BLASTn(http://www.ncbi.nlm.nih.gov/blast/Blast.cgi)序 列比对工具比对同源性,利用DNAman软件构建进化树。 收稿日期:2011—10—12 2结果与分析 基金项目:河南省基础与前沿技术研究(编号:112300410127)。 作者简介:王俊生(1970一),男,陕西蒲城人,博士,副教授,从事小麦 2.1 小麦U—box domain蛋白基因的电子克隆及其序列 雄性不育与油菜遗传育种研究。E—mail:wjs0099@163.corn。 分析 通信作者:李成伟,博士,教授。E—mail:lichengwei@zknu.edu.cn。 以小麦序列TDF269作为种子序列,利用软件BIOEdit电 一3O一 江苏农业科学2012年第40卷第6期 AAAATGCAAC 兀’GAGAAAGAGGAGCTYGAGTCCAATCTrGCCGC 子克隆获得了1个最终长度为2 059 bp的重叠群,利用NCBI 中提供的ORFfinder软件对该序列进行开放阅读框预测,发 现在113~1 774 bp之间存在1个最大的开放阅读框,编码 553个氨基酸,含有起始密码子ATG和终止密码子TAG,并 且具有植物U—box蛋白基因的U—box基序。以推导的氨基 CAAAG从GCATCATI10CC ITccAGCCACCTrCAGACAAGGAAG ( GrI’I1ATAACAC I’I1GTAGTTCGCATGCCTGACGGTAGTCGACAG GGGCGTCGCT I-IWA A A ATCTGATA A ATTCAAGTCCCTTTrrGAT 兀lCTTAGAC 【TI1GGCAGGACTra:AAGCCAGA A ACCTACAGACT GGTAAoGACATACCCCAGGCGTGC ACCACTGCTGACGGCG 酸序列对非冗余蛋白质数据库进行BLAST检索,获得了不同 植物U—box蛋白的氨基酸序列,证明电子克隆延伸产物和推 导的氨基酸序列是合理的,因此命名该基因为Ta—UBX1。该 基因碱基序列:GCTCCTCCCCTCTYGAGCCTCCGAG1_ITGGCrI’I'C TCCCACACGCTCATCTTCTCTCCTCCCTCCCTTCTCT( GTGAGA GCGTCGCGTCCAAACCCTCCCCCGC ̄GCCCGCCGCGAGGCACCAATCATITrACTGATCTCGG( TAACAAGCAAGCAGGAAGCC 4 G 刀AC 翻劢 GGG ̄GATI'CAGC CGCACCTAGGGATACCACCATCTGAGACTGAGTrGGGGTITrAC GTCTATACTYGC £ n 吼 GGG GG ATCT0GA ACG TCTGTGTCGAAGAGTTCAAA ........—— CGCAGCAGGAGGCTATCGACACC I’I℃ATCAGCArI、CACCGGGGCC GACGAGGCCGTCGCCATCCGCAAGCTCGAGGAACATGCTGGTG ACCTCAATCAGGCAGTCAATGCACACTrCACTGAA0GAGATAGC ACAGTGAACGCAATCAATCA从GTArIrI℃CACCTG,I-I’AATCATGA TGATATOCAGCTGGACGGACCAC 兀 AT从CACG,ITITCAAAGAC CGrTGrTCCCTGAA0 CTGCATGACCCTn=rI.GCACTAATGGATC CCAATITCCAGCAAATG1’rrrrrGATA A GTTCGCATCCrITITAGTCATATGTAGGGGGTATA A A ACAGTGATC AGCAACOGATCCAGGATATITI1GGTrATGAATGCGCGCTA0CGCA GCGATAATCATTGTTCGrITITI'CAGAGAGAGAAAGA ITCCTGGT兀’ 翻译氨基酸序列:MARPQQEAIDTFISITGADEAVAIRKLEE HAGDLNQAVNAHFTEGDS]n A-INQSIPPVNHDDMEI GPLDNT FQRPLFPEAL皿PE LhⅡ)PNFQQMFFDSVGSAGTPNRDAQGP王{PR ETSNEVNDNNIQ1GPSGQASVVENVTGRGSSYGPEVR ⅡIIDD加 EELSSGLSSQHASIRSNVPQPNPL PI’APPI VH、 DNDIEEEMIRAA lIEASKREAEELANAAEQERTLHMGGINLED砒SDEDMESAAGTV ! :叁 ! ! : ! 垒 ! ! AATGAAGrrrAATGAC从C从CATrCAAATCGGTCCTTC1 TCA GGCTTCTeTrGTrGAGAATGrcAC,I℃GACGrGGGrCTI℃1TATGG ACCAGAAGTrCGTGACACTATCATAATAGATGATGACGATGAGG RROGLGTGI ∞’MQPADEESSDDEIEDVEEQPLVRRRSRRIPSG DTESTEPVU GDSPPSSSQPONLDHQYNRTDFPSEWGGISSEE皿 EAVMLEAAMFGGIPEAPI PLSHASSSHYPQVVHSPPPELTEQRL AC,IrrGTCATCTGGGCTG.IICn1CTCACCATGCTAGTATCCGTAGCA ATGTGCCGCAGCC A A ATCCTCTGCCAACTGCTCCTCCACTAGTr CATGTCACAGACAATGAC L1lAGAAGAGGA A ATGATTCGG0:TG C A A rrGAAGCrI ̄C A A A A AGAGAGGCTGAAGAAC rGGCAAACGC AGCAGAGCAAGAACGGACTCTAC ATATGGGTGGA ATA A AC 丌IG GAAGATCGTrrATCTGATGAAGACATGGAAAGrGCAGCTGGAAC AGTGAGAAGGCAAGcATrAGGTACAC GAGGAGI’GGAACAACT ATGCAACCAGCAGATGAAGAGAGC rCAGATGATGAGATCGAGG ATGrITGAAGAACAGCC 兀 GTTAGACGTC 兀1CTAGGCaCATC CCTTCTGGAGACACAGA( ℃AACAGAACCTGTTC I℃CCAGGTGA TAGTCCTCCCTCAAGTTCGCAGCCTC A A A ACCTrG I℃ATCAGT ATAACAGAACTGAnTI’CCCATCAGAG,r( 脚GGCArIrITCTTCT GG LREQQDDEⅥ.ASLQADQEKEMKTLQEAELRI.I ET从REAALEK QRQEEEEQRKMQLEKEELESNLAAKEASLPLEPPSDKEGVITLW RMPDGSRQGRRFLKSDKFKSLFDFLDVGRTCKPETYRLVRTYPR RAFI ̄ADGDQSFTDLGLTSKQEALFIEQITDo 2.2生物信息学分析 2.2.1小麦 rA—UBX1蛋白理化性质分析利用Protparam 工具预测该蛋白质的基本理化性质,表明该蛋白质分子式为 c H N O, :S ,相对分子量为61 302.0,理论等电点 (H)为4.44,含有20种基本氨基酸,含量较高的是Glu (11.8%)和Ser(8.3%),含量较低的是Cys(0.2%)和Trp GAGGAACATGATGAAGCTGTrATGCTrGA0 TGCA A TI肼(0.2%),带负电荷残基76个(19.8%,包括Asp、Glu),带正 电荷的残基63个(9.o4%,包括Arg、Lys、His)(表1)。该蛋 白质水溶液在280 nm处的吸光系数为15 930。该蛋白的不 稳定系数为63.41,为不稳定蛋白,这可能是功能不明的原因 TGGAATTCCTGAAGCACCAACATATCCATrATCTCAT00GAGCT CGAGTCATrATCCCCAAGTAGTGCACTCTCCACCACCAGA A ITG ACTGAACAACG 【TI’A ITI1ACGAGAGCAGCAOGATGATGAeTACCT TGCATCGCTCCAAGCTGATCAAGAAAAGGAGATGAAGACIICTAC AAGAAGCTCAGCTCAGACTGCTGGAAGA A ACTa: r( AAGAGA AGCTGCTCTTGAGA从CAAAGGCAAGAGGAGGA( A ACAGCGT 之一。脂肪系数为68.32,平均总亲水性为一0.814,表明该 蛋白总体上亲水性和疏水性比较平衡。 表1小麦U—box蛋白氨基酸组成 氨基酸 Ala(A)Arg(R) Asn(N) Asp(D)Cys(C)比例(%) 8.0 6.5 3.8 8.0 0.2 氨基酸 Gin(Q) Glu(E) Gly(G) His(H1 ne(I 比例(%) 6.1 11.8 5.8 2.4 4.2 氨基酸 Leu(L)Lys(K) Met(M) Phe(F) Pro(P1 比例(%) 8.0 2.5 2.4 3.1 7.4 氨基酸 Ser(S1 Thr(T、 ’ (W)Tyr(Y) Val(V)比例(%) 8.3 5.8 0.2 1.3 4.5 氨基酸 Pyl(0)Sec(U)Asx(B)Glx(z)Xaa(X)比例(%) 0.0 0.0 0.0 0.0 0.0 2.2.2 亚细胞定位、跨膜区和前导肽分析 利用软件 构域是膜中蛋白与膜脂结合的主要部位,一般由2O个左右的 疏水氨基酸残基组成,形成螺旋与膜脂相结合。预测和分析 跨膜结构域对认识蛋白质的结构、功能、分类以及在细胞中的 SubLoe1.0对其进行亚细胞定位分析,表明该蛋白质位于细胞 核(Reliability Index=1;Expected Accurcy:56%)。跨膜结 王俊生等:小麦Ta—UBX1基因的电子克隆和生物信息学分析 作用部位均有一定的意义。利用HNNTOP和TMHMM法对 该蛋白氨基酸序列进行跨膜区预测,表明小麦Ta—UBX1蛋 白不存在跨膜区或信号肽(图1)。这与利用“DAS”一Trans— membrane Prediction server对该蛋白跨膜结构预测的结果一 一31一 酸化作用位点,表明该蛋白具有26个丝氨酸磷酸化作用位点 量∞茸∞IID 0】 工a薯。∞lp (Ser:26)、14个苏氨酸磷酸化作用位点(Thr:14)和2个酪氨  一 一酸磷酸化作用位点(Tyr:2),具有多个不同的磷酸化作用位 点。利用BLASTp检索非冗余蛋白质数据库,表明该蛋白在 N端存在1个显著的UBX domain(图2),属于UBQ超级家族 (c100155)中的UBX域包含蛋白(pfam00789),这类蛋白的功 能目前绝大多数尚不清楚。 2.2.4蛋白质二级、三级结构预测(1)Ta—UBX1蛋白二 致,即该蛋白不存在任何严谨的跨膜结构,也不存在导肽序 列。表明Ta—UBX1蛋白主要在细胞核中起作用,与细胞质 缺乏联系。 级结构预测。利用软件SOPMA对小麦Ta—UBX1蛋白二级 结构预测表明,该蛋白质序列中 螺旋占37.25%,扩展束占 7.59%, 转角占3.80%,无规则卷曲占51.36%。(2) U—box蛋白紊乱区、球蛋白区预测。利用GlobPlot软件(ht— tp://globplot.emb1.de/)对小麦U—box蛋白序列中的紊乱 区、球蛋白区进行预测,结果(图3)显示该蛋白存在9个不稳 氨基酸位置 图1 小麦U—box蛋白跨膜结构预测 定区,分别位于51~77,99~134,141~153,177~195,257~ 273,296—338,357—381,462~469,528~535氨基酸位置。 由于这些位置的可变性,很可能参与该蛋白的酶活性或者蛋 2.2.3 Ta—UBX1蛋白磷酸化和保守域分析蛋白质磷酸 白相互作用,在探寻蛋白功能机制时应当重点关注;在382— 550位置处为潜在的球蛋白区,这一球形蛋白区氨基酸相对 稳定,并且U—box域也处在这一球形区。 300 375 450 525 553 化是最普遍、最重要的一种翻译后修饰,几乎调节着生命活动 的整个过程,因此磷酸化分析对了解蛋白质可能的功能具有 重要意义。利用NetPhos 2.0 Server预测小麦U—box蛋白磷 l 75 l5O 225 b 帕 k " i 豳图2 Ta—UBXI蛋白保守结构域  类,结果与传统的分类基本一致。 0.9 3讨论 4.2 电子克隆是随着基因组计划和EST计划的实施而发展 -9.4 起来的,电子克隆是利用生物信息学手段进行基因克隆的新 方法,它具有投入低、速度快、技术要求低和针对性强等优 点 。利用电子克隆技术克隆新的基因尽管受到某物种 l4.5 19.6 EST数据库信息量的,但近年来的高通量测序技术使得 小麦EST数据库中的序列迅速增加,为本研究的完成提供了 良好的材料基础。电子克隆获得的基因序列还需要通过实验 进一步验证正确性。 24.7 O 50 1o0 l50200 250 300 350400450 500 550 氨基酸位置 图3 小麦U—box蛋白球蛋白区和紊乱区预测 本研究从小麦EST数据库中克隆得到的小麦 Ta—UBOX1基因全长2 059 bp,具有完整的蛋白质编码框,编 码553个氨基酸,不存在信号肽和导肽结构,也不具有跨膜结 构,是位于细胞核中的不稳定蛋白;具有多个不同的磷酸化作 用位点。该基因具有典型的UBX结构域,与其他禾本科作物 相同蛋白的氨基酸序列相似性较高,保守性较强。今后我们 将根据该基因序列设计引物,研究小麦发育的不同时期在各 器官或组织中的表达情况,以探索其具体功能。 参考文献: [1]Moon J,Parry G,Estelle M.The ubiquitin—proteasome pathway and plant development[J].The Plant Cell Online,2004,16(12):3181— 3195. 2.2.5与水稻等禾本科同源蛋白的比较小麦Ta—UBX1 蛋白的氨基酸序列与水稻、玉米、高梁以及大麦几种禾本科植 物同源的U—box蛋白氨基酸序列同源比对结果显示,蛋白质 序列的相似性分别达到70%、66%、68%和92%。运用DNA— man软件对以上几种禾本科植物该蛋白氨基酸序列进行多重 比较(图4),发现禾本科植物该类蛋白氨基酸序列总体上比 较保守,尤其在这类蛋白C末端的球型区氨基酸序列高度保 守,预期形成稳定的球型蛋白结构执行其功能。对几种禾本 科植物该蛋白氨基酸序列进行进化分析(图5),结果表明,小 麦Ta—UBX1蛋白与大麦亲缘关系最近,首先聚为一类,高粱 与玉米亲缘关系最近,聚为一类,之后这2类与水稻归为一 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务