专利名称:编码新蛋白水解酶的新基因的制作方法蛋白水解酶可将蛋白质视为由以肽键连接的氨基酸构建块组成的杂聚物。蛋白质中的重复单位是具有氨基基团和羧基基团的中心α碳原子。除甘氨酸之外,所谓的氨基酸侧链替代了两个剩余的α碳氢原子中的一个。氨基酸侧链使得中心α碳原子不对称。通常,在蛋白质中发现的是氨基酸的L-对映异构体。下面的术语描述了多种类型的多聚氨基酸。肽是具有确定序列的氨基酸残基短链。尽管对于残基的数目实际上没有最大值,但该术语通常指示其性质主要由其氨基酸组成确定且不具有固定的三维构象的链。术语多肽通常用于更长的链、通常具有确定的序列和长度且原则上具有适当的长度以折叠为三维结构。蛋白质指天然存在且展示确定三维结构的多肽。倘若蛋白质主要发挥催化化学反应的功能,那么它通常被称为酶。蛋白酶是催化(多)肽和蛋白质中肽键水解的酶。在生理学条件下,蛋白酶催化肽键的水解。国际生物化学和分子生物学协会(International Union of Biochemistry andMolecular Biology)(1984)推荐对于肽键水解酶亚型(亚类E.C3.4.)使用术语肽酶。术语蛋白酶与肽水解酶与肽酶是同义的且也可用于此处。蛋白酶包含2类酶内肽酶和外肽酶,它们分别在蛋白质内的位点切割肽键和连续地从N或C-末端去除氨基酸。蛋白酶用作内肽酶的同义词。肽键可发生于2-、3-、4-肽、肽、多肽、或蛋白质的情况下。通常,天然肽和多肽的氨基酸组成包含20个不同的氨基酸,该氨基酸展示L-构型(除不具有手性中心的甘氨酸之外)。然而蛋白酶的蛋白水解活性不局限于仅含有20个天然氨基酸的肽。在所谓的非天然氨基酸之间的肽键及在修饰的氨基酸或氨基酸类似物之间的肽键也可被切割。一些蛋白酶的确接受某些位置的氨基酸的D-构象。通常,蛋白酶显著的立体选择性使得它们在化学分解的过程中是非常有用的。许多蛋白酶展示有趣的副活性,如酯酶活性、巯基酯酶活性和(脱)酰胺酶活性。这些副活性通常不仅局限于氨基酸,且可证实为在精细化学药品领域的生物转化中是非常有用的。丝状真菌、真核微生物具有特殊的重要性有许多原因。如果不适当地进行控制,那么蛋白质中肽键水解切割的基本过程代价很大,且对生物潜在有害。对蛋白水解作用的所需限制是通过蛋白酶的特异性、通过使蛋白酶和底物在细胞内的区室化、通过对底物进行修饰以使得其能被个别的蛋白酶识别、通过由酶原活化和特定抑制剂存在或不存在的调节、以及通过对蛋白酶基因表达的调节而实现。在真菌中,蛋白酶也涉及其他基本的细胞过程,该过程包括细胞内蛋白质更新、加工、转位、孢子形成、萌发和分化。事实上,已将构巢曲霉(Aspergillus nidulans)和粗糙脉孢菌(Neurospora crassa)用作分析生理学和发育过程范围的分子基础的模式生物。它们的遗传特性使得在确定的养分和培养条件下能够直接进入生物化学和遗传学研究。此外,已分离了大量使人、牲畜和农作物致病的真菌,且已认为蛋白水解在它们的致病性(宿主侵入,在感染中对抗宿主的防御机制和/或营养)中起作用。蛋白酶也经常用于实验、临床和工业过程中;微生物和非微生物的蛋白酶两者均广泛应用于也可见 食品工业(烘焙、酿造、干酪制造、肉类嫩化)、鞣革工业和生物去污剂的制造中(Aunstrup,1980)。开发某些丝状真菌,尤其是黑曲霉属作为同源或异源蛋白质两者的生产宿主的商业重要性最近使真菌蛋白酶的重要性恢复了(van Brunt,1986ab)。蛋白酶在真菌的蛋白质异源表达和同源过量表达中经常引起问题。特别是,异源表达受同源蛋白酶对表达产物的蛋白水解降解的妨碍。这些商业利益导致对蛋白水解谱和蛋白酶缺陷品系构建的详细研究,并改进了有关这些生物中蛋白酶表达及调节的知识。随后就很需要在丝状真菌中鉴定和消除新蛋白酶。微生物如真菌在大规模蛋白质生产中特别有用。特别地当这种蛋白质分泌到培养基中时。蛋白水解酶在这些生产过程中起作用。在一方面,通常具体的蛋白水解酶对于目标蛋白质的正确加工和生产宿主的代谢健康是必需的。另一方面,蛋白水解降解可显著减少分泌的蛋白质的产量。在分泌途径中的不良折叠可导致被细胞内蛋白酶降解。这对生产异源蛋白质可能是一个特别的问题。蛋白水解过程的详情并不完全已知,该过程负责降解从真菌分泌过程中转移的蛋白质。在真核生物中,细胞蛋白质的降解是由蛋白酶体实现的,并通常涉及对要降解的蛋白质进行泛素标记。在真菌中蛋白酶体的和液泡蛋白酶也可能对不良折叠的分泌蛋白质进行蛋白水解降解。该蛋白水解降解可能在胞质中,但不可排除常驻于内质网的蛋白酶。从生产宿主品系改进的方面看,蛋白水解系统可为基因工程和生产品系改进的有趣目标。蛋白酶基因的额外拷贝、某些蛋白酶的过量表达、转录控制的修饰及使蛋白酶基因缺失的基因敲除程序可对给定蛋白酶的功能提供更详细的认识。为了改进同源及异源蛋白质的产量,蛋白酶编码基因的缺失是宿主品系改进的有价值的策略。真核微生物蛋白酶已由North(1982)进行了综述。更近地,Suarez Rendueles和Wolf(1988)已综述了酿酒酵母(S.cerevisiae)蛋白酶及其功能。除对键的水解切割之外,蛋白酶也可应用于键的形成中。这里的键不仅包括肽和酰胺键也包括酯键。蛋白酶是催化特定键的切割还是形成的确首先依赖于该反应的热力学。酶如蛋白酶不影响反应平衡。该平衡依赖于反应所发生的特别的条件。在生理学条件下,反应的热力学由于产生的兼性离子在热力学上非常稳定的结构而有利于肽的水解。通过应用物理-化学原理以影响平衡,或者通过操纵反应物和产物的浓度或特性,或者通过利用酶反应的动力学参数,可能将蛋白酶用于肽键合成的目的。水混合有机溶剂的加入减少了羧基成分的电离程度,借此增加了反应可用的底物的浓度。经常采用两相系统、水模拟物(water mimetics)、反向微团(reverse micelles)、无水介质或修饰的氨基和羧基基团以引起产物的沉淀来增加产量。当具有正确性质的蛋白酶可利用时,该蛋白酶在合成中的应用提供了实质的优点。由于蛋白酶是立体选择性及区域选择性的,所以反应物上的敏感基团通常不需保护,且反应物不需为光学纯的。由于酶促合成的条件是温和的,所以可避免不稳定的反应物或产物的外消旋化和分解。除氨基酸之间的键之外,其他展示伯氨基基团、巯基基团或羧基基团的化合物也可由适当选择的蛋白酶进行连接。此外,酯、巯基酯和酰胺可由某些蛋白酶进行合成。已显示蛋白酶在单、二-和三-糖、核苷和核黄素的酰化作用中展示区域选择性。在有时的苛刻反应条件下稳定性的问题可由适当的制剂来预防。胶囊化和固定不仅稳定了酶,而且使得从反应培养基中回收和分离便利。广泛的交联、用醛进行处理或用某些多聚体如葡聚糖、聚乙二醇、聚亚胺(polyimines)覆盖表面本质上可延伸生物催化剂的寿命。蛋白酶的天然作用传统上,蛋白酶被视为降解酶,该酶能够将蛋白质切割为小肽和/或氨基酸,且其作用为消化养分蛋白质或参与细胞蛋白质的更新。此外,已显示蛋白酶通过以有限蛋白水解进行选择性修饰的机制也在广泛的细胞过程中起关键的作用,并因而具有基本的调节功能(Holzer和Tschensche 1979;Holzer和Heinrich,1980)。蛋白酶的特异性被认为与其生理学功能和其表达模式紧密相关。至于具体蛋白酶的功能,其定位经常是非常重要的;例如,许多液泡和周质蛋白酶参与蛋白质降解,而许多膜结合蛋白酶在蛋白质加工中很重要(Suarez Rendueles和Wolf,1988)。在许多细胞过程中的蛋白酶的不同作用可分为4个主要的蛋白酶功能1)蛋白质降解,2)翻译后加工和特定蛋白质的(失)活化,3)形态发生,和4)发病机理。利用蛋白质作为养分来源的生物中蛋白酶的明显作用是对养分的水解。在真菌中,这将包括由细胞外的广泛特异性的蛋白酶在细胞外进行的降解。蛋白质降解对于细胞蛋白质的快速更新也重要,并使得细胞能够去除异常蛋白质及对于变化的生理学条件适应性改变其蛋白质的补充。通常地,为了保护细胞免受除正确目标蛋白质之外的随机降解,具有相当广泛特异性的蛋白酶也应进行非常好的控制。
与水解相反,多肽的合成在体内通过ATP驱动的过程在核糖体上发生。最后氨基酸连接的序列由源自基因组的信息支配。该过程已知为翻译。初级翻译产物经常比最终的功能产物长,且在翻译后这种蛋白质前体通常必需由蛋白酶进一步加工。蛋白酶在这种前体蛋白质成熟以获得最终的功能蛋白质中起关键的作用。与完全受控制的蛋白质修剪和重构形相反,蛋白酶也可为非常破坏性的,并可将多肽完全降解为肽和氨基酸。为了避免蛋白水解活性在需要之前释放,对蛋白酶进行了广泛的调控。许多蛋白酶是作为已知为酶原的前体合成的,该前体当需要时变为活化的。该活化显著地总是通过蛋白水解而发生。除直接涉及该过程之外,单个蛋白质的选择性活化和失活是众所周知的由特定蛋白酶催化的现象。
有限蛋白水解的选择性显得更直接地存在于蛋白酶-底物的相互作用中。特异性可源自仅识别特定氨基酸靶序列的蛋白水解酶。另一方面,它也可为“加工位点”在某些条件如pH、离子强度或次级修饰下的选择性暴露的结果,因而使得另外的非特异性蛋白酶催化高度特异性的事件。液泡酶原由有限蛋白水解的活化给出了后一类型的例子。
形态发生或分化可定义为受调控的一系列事件,该事件导致生物体从一个状态改变到另一个状态。尽管在许多情况下不能确立蛋白酶和形态结果之间的直接关系,但现在的证据认为在真菌形态发生中有显著的蛋白酶的参与;除观察到分化中广泛的蛋白质更新、孢子形成和孢子萌发之外,认为蛋白酶直接参与正常过程,如菌丝尖端分枝和隔片形成(Deshpande,1992)。
曲霉属物种特别是烟曲霉(A.fumigatus)和黄曲霉(A.flavus)可能是人和动物中称为曲霉病的许多疾病的病原体(Bodey和Vartivarian,1989)。已多次认为蛋白酶与烟曲霉和黄曲霉的毒性有关,其如同有许多研究将分泌的蛋白酶与细菌的毒性相联系。事实上,大多数曲霉感染的人的特征在于其主要由胶原蛋白和弹性蛋白构成的肺实质被广泛降解(Campbell等人,1994)。研究已集中于所分泌的蛋白酶在烟曲霉和黄曲霉毒性中的假定作用上,该烟曲霉和黄曲霉是主要的人病原体,并已知具有弹性蛋白裂解活性(elastinolytic)和胶原蛋白酶(collagenic)活性(Kolattukudy等人,1993)。这些弹性蛋白裂解(elastinolytic)活性在体外显示与对小鼠的感染性相关(Kothary等人,1984)。已知两种分泌型蛋白酶由烟曲霉和黄曲霉生产,即碱性丝氨酸蛋白酶(ALP)和中性金属蛋白酶(MEP)。在烟曲霉中,将编码这些蛋白酶的两个基因进行分离、特征记述和破坏(Reicherd等人,1990;Tang等人,1992,1993;Jaton-Ogay等人,1994)。然而,当与野生型品系相比时,alp mep双突变体在致病性上不显示差异。因此,可得出肯定结论认为在体外鉴定的分泌型烟曲霉蛋白酶对于组织侵入不是必须因子(Jaton Ogay等人,1994)。尽管烟曲霉仅占空气传播的霉菌孢子的一小部分,但它是从肺和隔片中最经常分离的真菌(Schmitt等人,1991)。对真菌毒性的其他解释可为支气管中的条件(温度和养分)有利于烟曲霉的寄生生长。结果,当宿主的致病防御被免疫抑制处理和疾病如AIDS消弱时,侵入性曲霉病则可为依照情况的事件。
已知有4个主要的蛋白酶种类,且该种类以其活性位点的主要功能基团来命名‘丝氨酸’、‘巯基’或‘半胱氨酸’、‘天冬氨酸’或‘羧基’和‘金属’蛋白酶。对这些蛋白酶的主要种类、次要种类和未分类的蛋白酶详细的当前综述可见酶学方法(Methodsin Enzymology)的第244和248部分(A.J.Barrett ed,1994和1995)。
蛋白酶的特异性除蛋白酶的催化机制之外,蛋白水解酶的其他重要方面是蛋白酶的特异性。蛋白酶的特异性显示该蛋白酶可能水解哪一种底物。20个天然氨基酸提供了构成肽的很多可能性。例如用20个氨基酸人们可构成400个二肽和800个不同的三肽等。关于更长的肽,可能的数目将变为几乎无限的。某些蛋白酶仅在非常特定的位置水解特别的序列。蛋白酶与肽底物的相互作用可包含肽底物的1至10个氨基酸残基。关于大的蛋白质底物有甚至更多的与蛋白酶相互作用的底物的残基。然而,这可能包含在活性位点结合裂缝(cleft)之外与蛋白酶残基的较低特异性的相互作用。通常,特异性识别是限定于线形肽的,该肽在蛋白酶的活性位点结合。
描述底物与蛋白酶相互作用的命名法已由Schechter和Berger于1967年提出(Biochem.Biophys.Res.Com.,1967,27,157-162),且现在广泛用于文献中。在该系统中,认为多肽底物的氨基酸残基在活性位点与所谓的亚位点(sub-sites)结合。按惯例,这些蛋白酶上的亚位点被称为S(代表亚位点),而相应的氨基酸残基被称为P(代表肽)。将易裂的键的N-末端侧的氨基酸残基编号为P3、P2、P1,且将那些C-末端侧的氨基酸残基编号为P3’、P2’、P1’。P1和P1’是位于靠近易裂的键处的氨基酸残基。然后可将切割位点周围的底物残基编号为直到P8。将与底物结合残基互补的蛋白酶上相应的亚位点编号为S3、S2、S1、S1’、S2’、S3’等。肽结合位点中亚位点的优选性确定了对在特别的位点切割某些特定的氨基酸序列的蛋白酶的优选性。底物的氨基酸序列应该与由亚位点展示的优选性一致。对某些底物的特异性明显依赖于对底物的结合亲和力和随后易裂的键水解速度两者。因此,蛋白酶对某些底物的特异性通常由其kcat/Km比例显示,该比例更好地已知为特异性常数。在该特异性常数中,kcat代表转换率,且Km是解离常数。
除参与催化和结合的氨基酸残基之外,蛋白酶含有许多其他的必要氨基酸残基。一些残基在折叠中是关键的,一些残基维持蛋白酶总的三维结构,一些残基可能涉及蛋白水解活性的调节,且一些残基可使蛋白酶定位于特别的位置。许多蛋白酶在活性位点之外含有一个或多个金属离子的结合位点。这些金属离子经常起使结构稳定的作用。此外,分泌的真核微生物蛋白酶可广泛糖基化。N-和O-连接的糖基化两者均有发生。糖基化可辅助蛋白质的折叠、可增加可溶性、防止聚集及稳定成熟蛋白质。此外,糖基化的程度可影响分泌以及蛋白质的水结合。
蛋白水解活性的调节相当数目的蛋白酶的蛋白水解活性受到广泛调节以避免不利的蛋白水解损害。在某些程度上,该调节发生于转录水平。例如在真菌中,分泌型蛋白酶基因的转录对于外部的碳和氮源敏感,而编码细胞内蛋白酶的基因却不敏感。细胞外pH由真菌感觉,且一些基因由pH调节。在该过程中,转录调节物蛋白质起关键的作用。这种调节物蛋白质的蛋白水解过程经常是使调节物蛋白质开启或关闭的开关。
将蛋白酶进行分子内及分子间调节。这意味着蛋白水解酶分子中的某些氨基酸对于这种调节是必须的。蛋白酶一般以较大的已知为酶原的前体合成,该前体催化上无活性。通常使得前体蛋白酶无活性的肽链在蛋白酶的氨基末端延伸。该前体更好地已知为前蛋白质(pro-protein)。许多由这种途径加工的蛋白质将从细胞分泌出,所以它们另外含有一个信号序列(前序列),从而完全的前体以前蛋白质原形式合成。除使得蛋白酶无活性之外,前肽对于介导有效的折叠经常是必须的。蛋白酶的例子包括丝氨酸蛋白酶(α裂解蛋白酶、枯草杆菌蛋白酶、aqualysin、激素原转化酶)、巯基蛋白酶(组织蛋白酶L和克鲁蛋白酶)、天冬氨酸蛋白酶(蛋白酶A和组织蛋白酶D)和金属蛋白酶。此外,前肽可单独地或与信号肽一起在细胞转运中起作用。它可促进与细胞侣伴蛋白的相互作用或它可促进跨膜的转运。前体前蛋白质原的延伸的大小在短肽和多肽的范围内变动有相当程度的变化,其中的多肽可作为自主折叠的单位而存在。特别地,经常观察到这些较大的延伸即使在蛋白酶切割之后仍然是强的蛋白酶抑制剂。观察到即使在切割之后,这种前肽也可辅助蛋白酶的正确折叠。可认为这种前肽发挥分子侣伴蛋白的功能,且这种前肽的分离或额外的共表达对于蛋白酶的生产可能有利。
在分泌到培养基中的蛋白酶和保持在细胞内的蛋白酶之间的调节水平上有实质的差异。分泌到培养基中的蛋白酶通常在活化后不再进行控制,并因此通常在其由一个球状模块组成的分子结构上是相对简单的。对细胞内蛋白酶必须进行连续的控制以避免对细胞的损害。与分泌型蛋白酶的酶原相反,在更复杂的调节性蛋白酶中,可将非常大的多肽区段插入在蛋白水解模块的信号和酶原活化结构域之间。结构功能研究显示这种非蛋白酶部分可参与与宏观结构、膜、辅因子、底物、效应物、抑制剂、离子的相互作用,这些相互作用调节蛋白水解模块或其(它们的)酶原的活性和活化。非蛋白水解模块在大小和结构上展示显著变化。许多模块可不依赖于蛋白水解模块而存在。因此可认为这种模块相应于折叠自主的独立的结构和功能单位。这种模块组织的价值是新模块的获得可赋予受体蛋白质新的结合特异性,且可导致其活性、调节和靶向中的显著变化。为了形成新的相互作用、调节、特异性和/或靶向可通过模块改组,应用分子生物学工具来充分利用模块组织蛋白水解酶的原理。尽管通常这种额外的模块为N或C末端延伸,也已观察到在催化结构域的外部环中的大段的插入。人们认为同样在这种情况下,蛋白酶的主要折叠仍然代表形成功能蛋白水解实体的基本拓扑结构,且可将该插入看作是折叠在蛋白水解模块表面的亚结构。
分子结构原则上较大蛋白质的模块组织本质上具有一般规律。特别在较大的多模块构架中,一般的蛋白水解模块显示平均大小为100~400个氨基酸。这与分泌到培养基中的大多数球状蛋白水解酶的大小一致。如在上面所讨论的,多肽模块是多肽片段,该片段可折叠并发挥独立实体的功能。这种模块的另一个术语是结构域。然而结构域在比模块更广的情况中使用。如在此处所用的术语结构域通常指多肽链的一部分,该多肽链在三维结构中描述了一般的折叠拓扑结构。在一个蛋白质中,结构域在多种程度上相互作用,但比结构域中的结构元件的相互作用较不广泛。其他的术语如亚结构域和折叠单位也用于文献中。同样地,可观察到许多具有同一特别功能性的蛋白质可具有相同的结构域。这种结构域可从显示某些序列模式的一级结构中识别,该序列模式对于特别的结构域是典型的。典型的例子为单核苷酸结合折叠、纤维素结合结构域、螺旋-转角-螺旋DNA结合基元、锌指、EF手、膜锚形体。模块指那些预期能够折叠和自主发挥功能的结构域。本领域的技术人员知道如何从其他生物或物种中通过应用对该结构和同源序列通常可用的计算机软件在一级结构中鉴定特别的结构域。
尽管多模块或多结构域蛋白质可呈现为一串珠子,但已经观察到实质上更复杂的结构的装配。在多种珠子位于相同多肽链上的情况下,这些珠子通常被称为模块或结构域。当珠子不位于一个和相同的多肽链上,而是通过非共价相互作用形成集合时,那么将术语亚基用于指该珠子。亚基可由一个或相同的基因转录,或者由不同的基因转录。该多模块蛋白质在导致多个亚基的转录之后可变为蛋白水解加工的。单独的亚基可由多个结构域组成。一般地,100-300个氨基酸的较小的球状蛋白质通常仅由一个结构域组成。
蛋白水解酶的分子分类通常蛋白酶根据其分子性质或根据其功能性质进行分类。分子分类基于蛋白酶的一级结构。蛋白质的一级结构代表其氨基酸序列,该序列可源自相应基因的核苷酸序列。广泛探索一级结构中的相似性可注意到催化机制和其他性质中的相似性,这甚至可延伸到功能性质。术语家族用于描述一组蛋白酶,这些蛋白酶基于其一级结构间的相似性而显示进化关系。人们认为这样一个家族的成员通过从相同的祖先通过趋异的进化而出现。在一个家族中,基于序列更精细的一级结构比较进一步划分出了亚家族。根据三维折叠的分类蛋白酶可包含二级结构、三级结构和四级结构。通常,二级结构上的分类局限于二级结构元件的含量和总方向。三级结构的相似性已导致对超家族或特异集团的识别。超家族或特异集团认为是具有共同祖先的一组家族,这是因为它们都显示共同的3-维折叠。通常,三级结构比一级结构更保守。结果,一级结构的相似性不总反映相似的功能性质。事实上,功能性质可基本地趋异从而导致有趣的新性质。目前四级结构尚未用于对多种蛋白酶进行分类。这可能是由于结构数据库对于简单的球状蛋白质的偏爱。进行活化、调节或复杂反应级联的许多蛋白水解系统可能由多个结构域或亚基组成。这种蛋白酶系统的结构组织中的一般规律可导致新型的分类。
根据特异性的分类在不存在序列信息时,已将蛋白酶进行了多种类型的功能分类。参考所催化的反应对酶进行的分类和命名是酶命名法中的一般原则。该方法也是对酶的EC编号中(酶命名法(EnzymeNomenclature),1992 Academic Press,Orlando)的根本原则。在酶命名法(Enzyme Nomenclature) 1992中可识别两类蛋白酶(EC3.4),即那些外肽酶(EC 3.4.11-19)和那些内肽酶(EC 3.4.21-24,3.4.99)。内肽酶在远离末端的肽链内部区域切割肽键。外肽酶仅从肽链的末端切割残基。在N-末端作用的外肽酶可释放一个氨基酸残基、一个二肽或一个三肽,并各自被称为氨基肽酶(EC3.4.11)、二肽基肽酶(EC 3.4.14)和三肽基肽酶(EC 3.3.14)。从羧基末端开始肽加工释放一个氨基酸的蛋白酶被称为羧肽酶(EC3.4.16-18)。肽基二肽酶(EC 3.4.15)从羧基末端去除一个二肽。外-和内-肽酶成为一体则为二肽酶(EC 3.4.13),它在其氨基酸半分子中仅特定地切割二肽。ω肽酶(EC 3.4.19)去除替代、环化或由异肽键连接的末端残基。
除了蛋白酶切割肽链的位置之外,对于每一个类型的蛋白酶,可基于底物中优选的氨基酸残基的特性的进一步的区分。通常人们可区分具有广泛的、中等的和狭窄的特异性的蛋白酶。一些蛋白酶简单地以它们水解的特定蛋白质或多肽而命名,如角蛋白酶、胶原酶、弹性蛋白酶。狭窄的特异性可约束为分别去除或切割的一个特别的氨基酸或一个特别的序列。当蛋白酶对P1或P1’位置的一个氨基酸显示特别的优选性时,该氨基酸的名字可为限定者(qualifier)。例如,脯氨酰氨肽酶从肽的氨基末端去除脯氨酸(脯氨酸是P1残基)。当切割了脯氨酸的亚氨基侧的键时使用了X-Pro或脯氨酸(脯氨酸是P1’残基),如脯氨酸羧肽酶从羧基末端去除脯氨酸。脯氨酰内肽酶(或Pro-X)在脯氨酸后面进行切割,而脯氨酸内肽酶(X-Pro)在脯氨酸前面进行切割。易裂的肽键前面的氨基酸残基指使羧基基团对肽键有贡献的氨基酸残基。易裂的肽键后面的氨基酸残基指使氨基基团对肽键有贡献的氨基酸残基。根据通常的惯例,氨基酸链为从氨基末端(起始)到羧基末端(终止)并从而进行编号。内切蛋白酶对于P1和P1’位置的特别的氨基酸也显示明显的优选性,如甘氨酰内肽酶、肽酰赖氨酸内肽酶、谷氨酰内肽酶。此外蛋白酶可对共享某些类似之处的某组氨基酸显示优选性。这样一组优选的氨基酸可包含疏水氨基酸、仅仅体积大的疏水氨基酸、小的疏水或仅为小的氨基酸、大的正电荷的氨基酸等。除对P1和P1’残基的优选性之外,由蛋白酶上其他亚位点优选的残基也存在特别的优选或排除。这些多重优选可导致仅对那些同时可满足多重结合需要的序列非常特异性的蛋白酶。通常应该认识到蛋白酶是相当混杂的酶。即使非常特异性的蛋白酶也可能切割不遵从通常观察的该蛋白酶的优选性的肽。此外,应该认识到环境条件pH、温度、离子强度、水活性、是否存在溶剂、竞争性底物或抑制剂这些都可影响蛋白酶的优选性。环境条件不仅影响蛋白酶,而且影响蛋白质底物呈现给蛋白酶的途径。
以催化机制分类。
蛋白酶可在其催化机制的基础上进行细分。需知对于上述分类所基于的每一种催化机制,特异性都导致对每一类机制的进一步细分。已知有4个主要的蛋白酶种类,并通过其活性位点的主要功能基团进行命名丝氨酸蛋白酶(EC 3.4.21内肽酶,EC 3.4.16羧肽酶)、巯基或半胱氨酸蛋白酶(EC 3.4.22内肽酶,EC 3.4.18羧肽酶)、羧基或天冬氨酸蛋白酶(EC 3.4.23内肽酶)和金属蛋白酶(EC 3.4.24内肽酶,EC 3.4.18羧肽酶)。对蛋白酶每一个催化类型的成员都有特有的抑制剂。这些小的抑制剂不可逆地修饰蛋白酶活性位点的氨基酸残基。例如,丝氨酸蛋白酶被与活性丝氨酸反应的苯甲基磺酰氯(PMSF)和二异丙基氟磷酸(DFP)失活,然而氯甲基酮(chloromethylketone)衍生物与催化三联体的组氨酸进行反应。磷酰二肽和1,10二氮杂菲一般抑制金属蛋白酶。由胃蛋白酶抑制通常显示为天冬氨酸蛋白酶。E64特异性地抑制巯基蛋白酶。氨肽酶抑制剂和苯丁抑制素抑制多种氨肽酶。即使在一个催化种类中也观察到了蛋白酶对抑制剂的易感性的相当变化。在某种程度上,这可与蛋白酶的特异性相关。在结合位点结构防止基于机制的抑制剂接近催化位点的情况下,这种蛋白酶从抑制中逃脱,且阻止了对基于抑制作用的机制类型的鉴定。例如胰凝乳蛋白酶抑制剂是具有胰凝乳蛋白酶样活性的丝氨酸蛋白酶的有力的抑制剂,弹性蛋白酶抑制剂抑制弹性蛋白酶如丝氨酸蛋白酶而不与胰蛋白酶或胰凝乳蛋白酶反应,4酰胺PMSF(APMSF)仅抑制具有胰蛋白酶样特异性的丝氨酸蛋白酶。对抑制剂在蛋白酶分类中用途的广泛说明包括Barret和Salvesen,蛋白酶抑制剂(Proteinase Inhibitors),Elsevier Amstardam,1986;Bond和Beynon(eds),蛋白水解酶,一种实际的方法(Proteolytic Enzymes,A Practical Approach),IRL Press,Oxford,1989;酶学方法(Methods in Enzymology),eds E.J.Barret,1994年244卷和1995年248卷;E.Shaw,半胱氨酰蛋白酶及其选择性失活(Cysteinyl proteinase and their selectiveinactivation),Adv Enzymol.63271-347(1990)。
根据最适作用条件分类蛋白酶的催化机制和其构象完整性的需要主要地决定了该蛋白酶可在何种条件下使用。在应用条件下发现最适作用的蛋白酶是一个主要的挑战。通常蛋白酶必须作用的条件不是最适的,且的确代表了具体应用的理想条件和蛋白酶的最适条件之间的折中。除蛋白酶的特别性质之外,应认识到蛋白质底物的呈递也依赖于条件,并同样也确定了何种条件对于蛋白水解最有效。与应用有关的酶的规格包含如pH依赖性、温度依赖性、对金属离子的灵敏度或依赖性、离子强度、盐浓度、溶剂相容性。主要重要性的另一个因素是蛋白酶的特异性活性。蛋白酶的特异性活性越高,特定的转变所需酶越少。较低的酶需要意味着较低的成本和较低的蛋白质污染水平。
pH是确定应用中蛋白酶性能的一个主要的参数。因此,pH依赖性是分类蛋白酶的重要参数。认识到的主要类群为酸性蛋白酶、中性蛋白酶、碱性蛋白酶和高碱性蛋白酶。最适的pH仅与蛋白水解机制匹配一定程度,如天冬氨酸蛋白酶经常在酸性时显示最适值,金属蛋白酶和巯基蛋白酶经常在中性pH到微碱性时最适地发挥,丝氨酸蛋白酶主要在碱性和高碱性区域为活性的。对于每一个种类均已知有例外。此外,系统的总的水活性起作用。蛋白酶的pH最适值定义为一个pH范围,在该范围内,蛋白酶在特别的条件下的特别环境中对大多数其底物展示最适的水解速率。该范围可为狭窄的,如一个pH单位,以及相当宽的3-4个pH单位。通常pH最适值也依赖于蛋白质底物的特性。转换率及特异性两者可作为pH的函数而变化。对于确定的功效,可以在远离其最适值时使用蛋白酶,因为不想要的肽的生产被避免了。不想要的肽可为如非常短的肽或导致苦味的肽。此外,更狭窄的特异性可为选择条件的原因,该条件在关于转化率上偏离最适的条件。依赖于pH,特异性可为狭窄的,如仅在一个特别的氨基酸前或后的一个特别的位置切割肽链,或者是较宽的,如在多个位置切割肽链或在更多不同类型氨基酸的前或后进行切割。事实上,pH依赖性可为在应用中调节蛋白水解活性的重要工具。在pH在过程中变化的情况下,蛋白水解可自发地停止,而无需进一步处理以使蛋白酶失活。在一些情况下,蛋白水解本身可为pH变化的驱动物。
对蛋白酶的应用非常关键的是其处理和操作的稳定性。由于蛋白酶稳定性受工作温度强烈影响,所以通常也将稳定性称为热稳定性。通常蛋白酶的稳定性显示在多长时间内蛋白酶在特别的条件下保持其蛋白水解活性。特别的条件可包含发酵条件、在酶的分离和下游加工中的条件、贮藏条件、制剂和操作或应用条件。当特别的条件包含升高的温度时,稳定性通常指热稳定性。除酶失活的一般原因如化学修饰、解折叠、聚集等之外,蛋白酶的主要问题是它们易于进行自降解。尤其对于蛋白酶的利用,温度最适值是蛋白酶分类的有关标准。尽管有不同的定义,但商业上最有用的定义是蛋白酶在某些应用中最有效的温度或温度范围。蛋白酶生产力是稳定性和转换率两者的函数。在此升高的温度通常将增加转换率,快速的失活将抵消转换率的增加,并最终导致低的生产力。在给定过程的条件中蛋白酶的构象稳定性将确定其操作温度最大值。蛋白酶放松其活性构象时的温度即显示为解折叠或熔点,可根据多种方法确定,如NMR、圆二色性、光谱学、差异扫描量热器等。对于蛋白酶,解折叠通常伴随自降解速率的极大增加。
在需要低温的应用中,蛋白酶可以在低到中等温度时高的内在活性而进行选择。因为在这种条件下失活是相对低的,所以在这种条件下活性可在很大程度上确定其生产力。在仅在短的时期内需要蛋白酶活性的过程中,蛋白酶的稳定性可用作使该蛋白酶关闭的开关。在这种情况下,可优选更不稳定的而不是非常热稳定的蛋白酶。
其他可在选择适当的蛋白酶中起作用的环境参数可为其对盐的敏感性。与金属离子的相容性对于某些应用是关键的,该金属离子经常以低的浓度发现于多种天然材料中。特别地就金属蛋白酶而言,某些离子可替代催化性金属离子并减少或甚至完全破坏活性。在一些应用中,为了防止与蛋白酶配位的金属离子的冲失,必须故意地加入金属离子。众所周知的是为了酶稳定性和寿命,必须提供钙离子以防止蛋白质结合的钙的解离。
多数微生物显示适应环境条件变化的某些耐受性。结果至少该生物能够产生的蛋白水解谱就可能显示相似的耐受性。这样一种蛋白水解谱可由许多蛋白水解酶一起覆盖或者只由少数具有广泛水解谱的蛋白酶覆盖。考虑微生物的全部蛋白水解谱,非常重要的是考虑位置。
蛋白水解过程和降解的细胞内定位和特征记述从工业视点看,从细胞分泌的蛋白酶具有大规模生产力和应激耐受性的特定的优点,这是因为它们必须在不受细胞保护下存活。大组的细胞蛋白酶可进一步细分为可溶性的和膜结合的。膜结合的可包含位于膜内侧及外侧的蛋白酶。细胞内可溶性蛋白酶可根据它们所发生的特定细胞区室进行进一步的细分。由于细胞在一些程度上将蛋白酶与环境进行屏蔽,且因为细胞控制细胞内的条件,所以细胞内蛋白质对于大的环境变化更敏感,且其最适值可与特定的细胞内条件更相关。获知蛋白酶所存在的细胞区室的条件可显示其优选性。当细胞外蛋白酶在从细胞分泌之后通常不再需要任何调节,细胞内蛋白酶则经常受到复杂的控制和调节。
关于特别的蛋白酶的功能,其定位经常是非常重要的;例如,许多液泡和周质蛋白酶参与蛋白质降解,而许多膜结合蛋白酶在蛋白质加工中是重要的(Suarez Rendeules和Wolf,1988)。
对蛋白酶生物学性质和进化的详尽的综述已发表于van denHomberghThesis Landbouwuniversiteit Wageningen在曲霉属中为改进蛋白质生产而对蛋白水解系统的分析(An analysis of theproteolytic system in Aspergillus in order to improveprotein production)ISBN 90-5485-545-2,在此处将其整体引用作为参考。
蛋白酶问题对微生物蛋白酶感兴趣的一个重要原因是蛋白酶相关的表达问题,该问题发现于几个用于生物加工工业中的表达宿主中。异源宿主通过重组DNA技术对于蛋白质生产增加的利用最近已将这个问题带到焦点上,这是因为看来异源蛋白质是更易被蛋白水解掉(Archer等人,1992;van den Hormbergh等人,1996b)。
在酿酒酵母中,在[20世纪]80年代早期已经认识到了蛋白酶问题和几个蛋白酶的参与,因而使定向基因破坏方法复杂化以解决该问题。在分泌中,蛋白质暴露于存在于分泌途径中的几种蛋白水解活性中。此外,在原养型微生物如曲霉属中,分泌的蛋白质可暴露于几种细胞外蛋白水解活性中。
异源表达的蛋白质降解的问题在曲霉属中进行了很好的证明(van den HomberghThesis LandbouwuniversiteitWageningen在曲霉属中为改进蛋白质生产而对蛋白水解系统的分析(An analysis of the proteolytic system in Aspergillus inorder to improve protein production)ISBN 90-5485-545-2),且已经报道了母牛凝乳酶原、人干扰素α-2 tPA、GMCSF、IL6、乳铁蛋白、鸡蛋清溶菌酶(lysosyme)、猪plA2、黑曲霉果胶溶解酶(lysase)B、大肠杆菌(E.coli)肠毒素B和β-glucoronidase和胡萝卜软腐欧文氏菌(Erwinia carotovora)果胶酸盐溶解酶(pectate lysase)3的表达中的这类问题。
蛋白水解的问题可在蛋白质生产的几个阶段进行解决。生物加工工程师可通过在低温进行下游加工、通过早期分离产物和蛋白酶或通过使用蛋白酶抑制剂而解决蛋白水解问题。这些可都导致成功地减少该问题。然而问题当然没有消除,这是因为在蛋白质生产过程中在体内发生了许多水解。
理解蛋白水解在细胞内是如何控制的,主要的问题涉及触发蛋白水解的识别机制。在何种程度上将蛋白水解易感的(异源的)蛋白质因为错折叠而识别为异常,或者如果正确折叠了却因为它们不拥有宿生特异的对稳定性很关键的性质而被识别为“外源的”。已知增加蛋白水解速率的因素包括养分缺乏和多种其他类型的逆境压力(即温度的升高、渗透压力、毒性物质和某些异源蛋白质的表达)。为了在体内处理蛋白水解相关的表达问题,如将在下文描述的几个方法已证明是成功的。然而,我们必须牢记真正的“非蛋白水解的细胞”不存在,这是因为由细胞内蛋白酶的蛋白水解参与许多基本的代谢和“管家(housekeeping)”反应。因此在减少蛋白水解的过程中,必须分析导致蛋白水解减少的遗传背景潜在的次级作用,该次级作用可导致蛋白质生产减少(如生长速率减少或孢子形成)。
在丝状真菌表达宿主中破坏蛋白酶Berka及其同事(1990)描述了泡盛曲霉(A.awamori)pepA基因的克隆和破坏。最近,已描述了黑曲霉中3个破坏的天冬氨酰蛋白酶。对主要细胞外天冬氨酰蛋白酶和主要液泡天冬氨酰蛋白酶两者的破坏剂(disruptant)进行了描述。通过重组生成了二重和三重破坏剂,并检验了黑曲霉果胶溶解酶PELB蛋白质的蛋白酶谱和表达和分泌,该PELB蛋白质对于蛋白水解降解非常易感(van denHombergh等人,1995)。pepA和pepB的破坏导致细胞外蛋白酶的活性分别减少80%和6%。在ΔpepE破坏剂中,同样其他的(液泡的)蛋白酶活性也由于对其他液泡蛋白酶的蛋白水解级联而受到严重的影响。减少的细胞外活性与减少的PELB体外降解和pelB改进的体内表达相关(van den Hombergh等人,1996f)。
蛋白酶缺陷型(prt)突变体丝状真菌已研究了几种曲霉属蛋白酶缺陷型突变体中蛋白质生产是否得到改进。Archer及其同事描述了母鸡蛋清溶菌酶在由Mattern及其同事(1992)生成的黑曲霉prt双突变体上清液中减少的蛋白水解,并推断尽管降解仍然存在,但该降解显著地减少了。Van denHombergh等人(1995)显示黑曲霉PELB的体外降解在他们分离的所有7个prt互补群中均减少了。事实上在prtB、prtF和prtG突变体中未观察到降解。最近,在6个检验的互补群(prtA-F)中均显示pelB基因表达的改进,且在prtB、prtF和prtG突变体中观察到了最大的表达水平。除单一突变体之外,其含有与野生型活性相比在2-80%的残留的细胞外蛋白水解活性,通过重组和通过另一轮诱变生成双突变体。经过这种方法,对几个prt双突变体进行了选择和进一步的特征记述,这显示与其亲代品系相比PELB降解的进一步减少。
不经过破坏或诱变消除蛋白酶活性,减少蛋白水解也可通过对相干蛋白水解活性减量调节来实现。这可通过遗传地改变启动子或基因的其他调节序列而实现。如由Fraissinet-Tachet及其同事(1996)所示,黑曲霉的细胞外蛋白酶全部由碳分解代谢物抑制和氮代谢物抑制调节。营养缺乏也导致细胞内总的蛋白水解速率激烈增加,这也适用于缺乏养分但拥有蛋白质的细胞,其在饥饿条件下不需要或仅需要较少量营养。在使得在含有高的葡萄糖和铵浓度的培养基上能够高表达的表达策略中已报道了蛋白水解的减少。几个组成型糖酵解启动子(gpd和pkiA)在这些条件下高度表达,并也可用于驱动连续发酵中的(异源的)基因表达。所强加的养分缺乏类型可以变化的程度影响不同的蛋白酶,这意味着在给定过程中养分条件的重要性依赖于涉及的蛋白水解的类型。因此特定的蛋白水解可由底物限制的条件进行诱导,该底物限制经常用于许多大规模发酵过程。
蛋白酶问题现在可部分地由一种上述或多种策略来解决。然而,仍未鉴定的蛋白水解酶残留的蛋白水解活性仍然构成了本领域中的主要问题。为了进一步减少不利的蛋白水解的水平,本领域中非常需要对新的蛋白酶进行鉴定,该蛋白酶负责同源和异源表达的蛋白质的降解。本发明提供了这种编码蛋白酶的新蛋白酶基因序列。一旦已知新蛋白酶基因的一级序列,则可采用一种或多种上述的重组DNA策略以生产(基因敲除)减少蛋白水解活性的突变体。
尽管蛋白酶在大多数工业过程中有广泛应用,但是现有的酶也在至少一种下述性质中具有显著缺点。
当加入到动物饲料中时,现有的蛋白酶不足以抵抗存在于如猪和家禽胃肠(GI)道中的消化酶。
在另一方面,现有可用的酶在挤出或粒化过程中不足以抵抗采用的特定的(高)温度和(高)压力条件。
同样,现有的酶在pH范围3-7时不具有足够的活性,该条件在许多食品、饮料产品及在大多数动物的GI道中是普遍的。
根据另外一个方面,现有可用的蛋白酶的特异性非常有限,这导致现有的酶不能降解或溶解某些“蛋白酶抗性”蛋白质,从而导致肽或氨基酸产量低。此外,具有新特异性的蛋白酶使得新肽能够合成。
现有可用的酶的另外一个缺点是其低的特异性活性。
因此对于大量的应用显然存在对蛋白酶的大量需要,该蛋白酶对消化酶、高温和/或压力更具有抗性,且表现对其水解位点的新的特异性。本发明提供这种酶。
发明目的本发明目的是提供编码新蛋白酶的新的多核苷酸。进一步的目的是提供天然和重组生产的蛋白酶及生产这些酶的重组菌株。这种菌株也可用于更快地或以更高的产量生产传统的发酵产物。本发明的另外一个目的是提供在生产根据本发明的蛋白酶中有缺陷的丝状真菌菌株。这种菌株可用于更有效地生产异源或同源蛋白质。同样抗体和融合多肽以及制备和使用根据本发明的多核苷酸和多肽的方法是本发明的部分。
发明概述本发明提供了编码新蛋白酶的新的多核苷酸。
更具体地,本发明提供多核苷酸,该多核苷酸具有(优选地在高度严紧性条件下)与根据选自SEQ ID NO1~SEQ ID NO57的序列或者选自SEQ ID NO58~SEQ ID NO114的序列的序列杂交的核苷酸序列。因此,本发明提供核酸,该核酸与根据选自SEQ IDNO1~SEQ ID NO57的序列或者选自SEQ ID NO58~SEQ IDNO114的序列的序列具有约60%、优选为65%、更优选为70%,更加优选为75%、80%、85%、90%、95%、96%、97%、98%或99%的同源性。
在一个更加优选的实施方案中,本发明提供了分离的多核苷酸,该多核苷酸可从丝状真菌中,优选地为曲霉属中获得,特别优选黑曲霉。
在一个实施方案中,本发明提供分离的多核苷酸,该多核苷酸包含编码多肽的核酸序列,该多肽具有选自SEQ ID NO115~SEQ IDNO171或其功能等价物的氨基酸序列。
在进一步优选的实施方案中,本发明提供分离的多核苷酸,该多核苷酸编码根据选自SEQ ID NO115~SEQ ID NO171或其功能等价物的序列的多肽的至少一个功能结构域。
在一个优选的实施方案中,本发明提供了根据选自SEQ IDNO1~SEQ ID NO57的序列的蛋白酶基因。在另一个方面,本发明提供了多核苷酸,优选为编码选自SEQ ID NO115~SEQ ID NO171的黑曲霉蛋白酶或该多肽的变体或片段的cDNA。在一个优选的实施方案中,该cDNA具有选自SEQ ID NO58~SEQ ID NO114或其功能等价物的序列。
编码根据本发明的多肽的基因组克隆也可通过下面方法获得,即选择适当的探针,用来特异性地扩增相应于根据SEQ ID NO1~SEQ ID NO57或其片段的任何一个序列的基因组区域、将该探针在适当条件下与适当的生物如曲霉属如黑曲霉中获得的基因组DNA进行杂交、通过如PCR(聚合酶链反应)扩增目的片段之后对扩增的片段的纯化和克隆。
在更进一步优选的实施方案中,本发明提供了多核苷酸,该多核苷酸包含根据本发明的基因组多核苷酸的编码序列,优选为选自SEQ ID NO58~SEQ ID NO114的多核苷酸序列。
在另一个优选的实施方案中,本发明提供了cDNA,该cDNA可通过将选自SEQ ID NO1~SEQ ID NO57的序列在适当的宿主生物如黑曲霉中克隆和表达而获得。
根据本发明的一个多肽也可通过将选自SEQ ID NO1~SEQ IDNO57的序列在适当的宿主生物如黑曲霉中克隆和表达而获得。
本发明也涉及包含根据本发明的多核苷酸序列和可用于扩增或探测根据本发明的DNA的引物、探针和片段的载体。
在进一步优选的实施方案中,提供载体,其中根据本发明的多核苷酸序列功能性地与调节序列相连接,该调节序列适合于编码的氨基酸序列在适当的宿主细胞如黑曲霉或米曲霉(A.oryzea)中表达。本发明也提供了制备根据本发明的多核苷酸和载体的方法。
本发明也涉及重组生产的宿主细胞,该细胞含有根据本发明的异源或同源的多核苷酸。
在一个实施方案中,本发明提供了重组宿主细胞,其中根据本发明的蛋白酶的表达显著减少,或者其中蛋白酶的活性减少,或者其中蛋白酶甚至失活。这种重组体对于同源或异源蛋白质的表达尤其有用。
在另一个实施方案中,本发明提供了重组宿主细胞,其中根据本发明的蛋白酶的表达显著增加,或者其中蛋白酶的活性增加。这种重组体对于同源或异源蛋白质的表达尤其有用,在此如果必需的蛋白水解切割变为限速步骤,那么成熟则严重地受到妨碍。
在另一个实施方案中,本发明提供了一种重组生产的宿主细胞,该细胞含有根据本发明的异源和同源DNA,优选为编码带有信号序列的蛋白质的DNA,且其中该细胞能够生产根据本发明的功能蛋白酶,优选为能够使根据本发明的蛋白酶过量表达的细胞,例如包含根据本发明的基因或cDNA增加的拷贝数目的曲霉属菌株。
在另一个实施方案中,本发明提供了一种重组生产的宿主细胞,该细胞含有根据本发明的异源和同源DNA,且其中该细胞能够分泌根据本发明的功能蛋白酶,优选地为能够过量表达和分泌根据本发明的蛋白酶的细胞,例如包含根据本发明的基因或cDNA增加的拷贝数目的曲霉属菌株。
在本发明的另外一个方面,提供了纯化的多肽。根据本发明的多肽包括由根据本发明的多核苷酸编码的多肽。尤其优选根据选自SEQ ID NO115~SEQ ID NO171或其功能等价物的序列的多肽。
本发明也提供了可与根据本发明的多肽反应的抗体。这些抗体可为多克隆的,但尤其优选单克隆抗体。这种抗体对于纯化根据本发明的多肽特别有用。
包含根据本发明多肽的融合蛋白质也在本发明的范围之内。本发明也提供了制备根据本发明的多肽的方法。
本发明进一步涉及通过检测根据本发明的多肽或其功能等价物是否存在,或者通过检测根据本发明的DNA或其片段或功能等价物是否存在而诊断曲霉病。
本发明也涉及根据本发明的蛋白酶在此处所描述的工业过程中的用途。
发明详述多核苷酸本发明提供了编码蛋白酶的多核苷酸,该蛋白酶具有序列选自SEQ ID NO115~SEQ ID NO171的氨基酸序列或其功能等价物。这些基因的序列通过对从黑曲霉获得的基因组克隆的测序确定。本发明提供了包含编码这些蛋白酶的编码基因及其完整cDNA序列和其编码序列的多核苷酸序列。因此,本发明涉及分离的多核苷酸,该多核苷酸包含选自SEQ ID NO1~SEQ ID NO57的核苷酸序列或选自SEQID NO58~SEQ ID NO114或其功能等价物的序列。
更具体地,本发明涉及分离的多核苷酸,该多核苷酸在严紧性条件下与选自SEQ ID NO1~SEQ ID NO57的多核苷酸序列或选自SEQ ID NO58~SEQ ID NO114的序列可进行杂交,优选为在高度严紧性条件下。有利地,这种多核苷酸可从丝状真菌特别是从黑曲霉中获得。更具体地,本发明涉及分离的多核苷酸,该多核苷酸具有根据选自SEQ ID NO1~SEQ ID NO57的序列或选自SEQ ID NO58~SEQID NO114的序列的核苷酸序列。
本发明也涉及分离的多核苷酸,该多核苷酸编码至少一种根据选自SEQ ID NO115~SEQ ID NO171的序列或其功能等价物的多肽的功能结构域。
如在此处所用的,术语“基因”和“重组基因”指可从染色体DNA分离的核酸分子,该分子包括编码蛋白质如黑曲霉蛋白酶的可读框。基因可包括编码序列、非编码序列、内含子和调节序列。此外,基因指如在此处定义的分离的核酸分子。
本发明的核酸分子可用标准的分子生物学技术和此处提供的序列信息进行分离,该核酸分子如具有选自SEQ ID NO1~SEQ IDNO57的序列或选自SEQ ID NO58~SEQ ID NO114的序列或其功能等价物的核酸分子的核苷酸序列。例如,利用所有或部分的选自SEQID NO1~SEQ ID NO57的序列的核苷酸序列或选自SEQ IDNO58~SEQ ID NO114的序列的核苷酸序列作为杂交探针,根据本发明的核酸分子可用标准的杂交和克隆技术进行分离(如描述于Sambrook,J.,Fritsh,E.F.和Maniatis,T.,分子克隆实验室手册(Molecular CloningA Laboratory Manual),2nd,ed.,Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,1989)。
此外,包含所有或部分选自SEQ ID NO1~SEQ ID NO57的序列或选自SEQ ID NO58~SEQ ID NO114的序列的核酸分子可用合成的寡核苷酸引物通过聚合酶链反应(PCR)进行分离,该引物基于在选自SEQ ID NO1~SEQ ID NO57的序列或选自SEQ ID NO58~SEQ ID NO114的序列中含有的序列信息而设计。
本发明的核酸可用cDNA、mRNA或者基因组DNA作为模板和适当的寡核苷酸引物根据标准的PCR扩增技术进行扩增。这样扩增的核酸可克隆入适当的载体中并用DNA序列分析进行表征。
此外,相应于或与根据本发明的核苷酸序列杂交的寡核苷酸可通过标准合成技术进行制备,如利用自动DNA合成仪。
在一个优选的实施方案中,本发明分离的核酸分子包含选自SEQID NO58~SEQ ID NO114的序列中所示的核苷酸序列。选自SEQID NO58~SEQ ID NO114的序列的序列相应于黑曲霉蛋白酶cDNA的编码区。该cDNA包含编码根据选自SEQ ID NO115~SEQ IDNO171的序列的黑曲霉蛋白酶多肽的序列。
在另一个优选的实施方案中,本发明分离的核酸分子包含与选自SEQ ID NO1~SEQ ID NO57的序列或选自SEQ ID NO58~SEQID NO114的序列所示的核苷酸序列或其功能等价物互补核苷酸序列。
与另一个核苷酸序列互补的核酸分子与其足够互补,从而可以与其进行杂交,并借此形成稳定的双链体。
本发明的一个方面关于分离的核酸分子,该核酸分子编码本发明的多肽或其功能等价物如生物活性片段或结构域,以及足以用作杂交探针以鉴定编码本发明的多肽的核酸分子的核酸序列,和这种核酸分子适合于用作PCR引物以使核酸分子扩增或突变的片段。
“分离的多核苷酸”或“分离的核酸”是DNA或RNA,该DNA或RNA不与两个编码序列直接邻接,而在它所源自的生物体的天然存在的基因组中它与该编码序列直接邻接(一个在5’端,一个在3’端)。因而,在一个实施方案中,分离的核酸包括一些或全部与编码序列直接邻接的5’非编码(如启动子)序列。因此该术语包括如插入载体、自主复制的质粒或病毒、或原核生物或真核生物的基因组DNA中的重组DNA,或者作为独立与其他序列的相分离的分子(如由PCR或限制性内切核酸酶处理产生的cDNA或基因组DNA片段)。它也包括一种重组DNA,该重组DNA是编码额外的多肽的杂交基因的部分,该多肽基本不含细胞材料、病毒材料或培养物培养基(当由重组DNA技术生产时)、或者化学前体或其他的化学药品(当化学地合成时)。此外,“分离的核酸片段”不作为一个天然存在的核酸片段且不发现于天然状态中。
如在此处所用的,术语“多核苷酸”或“核酸分子”意指包括DNA分子(如cDNA或基因组DNA)和RNA分子(如mRNA)和用核苷酸类似物生成的DNA或RNA类似物。核酸分子可为单链的或双链的,但优选地为双链的DNA。核酸可用寡核苷酸类似物或衍生物(如肌苷或硫代磷酸核苷酸)进行合成。这种寡核苷酸可用于如制备具有改变的碱基配对能力或增加的核酸酶抗性的核酸。
本发明的另一个实施方案提供分离的核酸分子,该核酸分子与蛋白酶核酸分子如蛋白酶核酸分子的编码链反义。同样包括在本发明的范围内的是此处所描述的核酸分子的互补链。
测序错误此处所提供的序列信息不应该被这样狭窄地解释为需要包含错误鉴定的碱基。此处所公开的特定序列可方便地用于从丝状真菌特别是黑曲霉中分离完整的基因,这反过来可使其易于进行进一步的序列分析并借此鉴定测序错误。
除非另外指示,此处所有由对DNA分子测序所确定的核苷酸序列都是用自动DNA测序仪确定的,且所有由在此处确定的DNA分子编码的多肽的氨基酸序列都是通过对如上所确定的DNA序列进行翻译而预测的。因此,如本领域所公知的,任何由该自动方法确定的DNA序列、任何在此处确定的核苷酸序列都可含有一些错误。由自动装置确定的核苷酸序列与测序的DNA分子的实际核苷酸序列一般是至少约90%一致的,更一般地为至少约95%~至少约99.9%一致的。实际序列可通过其他方法而更精确地确定,该方法包括本领域中众所周知的人工DNA测序方法。如同样在本领域中公知的,与实际序列相比在确定的核苷酸序列中单个的插入或缺失就将导致核苷酸序列翻译中的移码,从而由确定的核苷酸序列编码的预测的氨基酸序列将在这种插入或缺失位点开始与由测序的DNA分子实际编码的氨基酸完全不同。
本领域的技术人员能够鉴定这种错误鉴定的碱基并知道如何校正这种错误。
核酸片段、探针和引物根据本发明的核酸分子可仅包含核酸分子的一部分或一个片段,该核酸分子选自SEQ ID NO1~SEQ ID NO57的序列或选自SEQID NO58~SEQ ID NO114的序列,例如可用作探针或引物或编码该蛋白酶基因的一部分的片段的片段。从对蛋白酶基因和cDNA确定的核苷酸序列使得能够生成设计用于鉴定和/或克隆其他蛋白酶家族成员以及来自其他物种的蛋白酶同系物的探针和引物。该探针/引物一般包含基本纯化的寡核苷酸,该寡核苷酸一般包含优选在高度严紧性条件下与一个核苷酸序列的至少约12或15、优选为约18或20、优选为约22或25,更优选为约30、35、40、45、50、55、60、65或75或更多连续的核苷酸进行杂交的核苷酸序列区域,其中的核苷酸序列在选自SEQ ID NO1~SEQ ID NO57的序列或选自SEQ IDNO58~SEQ ID NO114的序列或其功能等价物中显示。
基于蛋白酶核苷酸序列的探针可用于探测如在其他生物中编码相同或同源蛋白质的转录物或基因组蛋白酶序列。在优选的实施方案中,该探针进一步包含在其上附着的标记基团,如该标记基团可为放射性同位素、荧光化合物、酶或酶辅因子。这种探针也可用作鉴定表达蛋白酶蛋白质的细胞的诊断检验试剂盒的部分。
同一性和同源性术语“同源性”和“同一性百分比”在此处互换使用。对于本发明的目的,为了确定两个氨基酸序列或两个核酸序列的同一性百分比,为了进行最适比较将序列进行比对(如为了进行与第二个氨基酸或核酸序列的最适比对,在第一个氨基酸或核酸序列的序列中引入了缺口)。然后对相应的氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸进行了比较。当第一个序列中的位置由与第二个序列中相应位置上相同的氨基酸残基或核苷酸占据时,那么该分子在该位置上为同一的。两个序列间的同一性百分比为序列共有的相同位置数目的函数(即,%同一性=相同位置的数目/位置的总数目(即重叠位置)×100)。优选,该两个序列等长。
技术人员将知道几个不同的计算机软件可用于确定两个序列间的同源性。例如,两个序列间序列比较和同一性百分比的确定可用数学算法来实现。在一个优选的实施方案中,两个氨基酸序列间的同一性百分比用Needleman和Wunsch(J.Mol.Biol.(48)444-453(1970))算法确定,该算法已并入到GCG软件包的GAP程序中(从http//www.gcg.com可获得),使用Blossom 62矩阵或者PAM250矩阵和16、14、12、10、8、6或4的缺口权数(gap weight)和1、2、3、4、5或6的长度权数(length weight)。技术人员可以理解所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时两个序列的总同一性百分比并不显著地改变。
在另外一个实施方案中,两个核苷酸序列间的同一性百分比用GCG软件包中的GAP程序(从http//www.gcg.com可获得)确定,使用NWSgapdna.CMP矩阵和40、50、60、70或80的缺口权数和1、2、3、4、5或6的长度权数。在另一个实施方案中,两个氨基酸或核苷酸序列的同一性百分比用E.Meyers和W.Miller(CABIOS,411-17(1989))的算法确定,该算法已并入到ALIGN程序(2.0版)(从http//vega/igh.cnrs.fr/bin/align-guess.cgi可获得)中,使用PAM120权数(weight)残基表、缺口长度罚分12和缺口罚分4。
本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行对公共数据库的搜索,从而如鉴定其他家族成员或相关的序列。这种搜索可用Altschul等人,(1990)J.Mol.Biol.215403-10的NBLAST和XBLAST程序(2.0版)来进行。BLAST核苷酸搜索可用NBLAST程序、分数=100、字长=12进行以获得与本发明的蛋白酶核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST程序、分数=50、字长=3进行以获得与本发明的蛋白酶蛋白质分子同源的氨基酸序列。为了获得用于比较目的的有缺口的比对,可利用在Altschul等人,(1997)Nucleic Acids Res.25(17)3389-3402中描述的Gapped BLAST。当利用BLAST和Gapped BLAST程序时,可使用各个程序(如XBLAST和NBLAST)缺省的参数。参见http//www.ncbi.nlm.nih.gov。
杂交如在此处所用的,术语“杂交”意指描述用于杂交和洗涤的条件,在该条件下相互为至少约50%的、至少约60%的、至少约70%的、更优选为至少约80%的、甚至更优选为至少约85%~90%的、更优选为至少约95%的同源的核苷酸序列一般保持相互杂交。
这种杂交条件的一个优选的非限制性例子是6X氯化钠/柠檬酸钠(SSC)中于45℃的杂交,伴随着一次或多次在1X SSC、0.1%SDS中的洗涤,温度为50℃,优选55℃,优选60℃,且更加优选65℃。
高度严紧性的条件包括如于68℃在5x SSC/5x Denhardt’s溶液/1.0%SDS中的杂交,及于室温在0.2x SSC/0.1%SDS中的洗涤。或者,洗涤可以在42℃进行。
技术人员将知道对于严紧性和高度严紧性杂交条件应使用的条件。关于这种条件的额外的指南易于从本领域获得,如在Sambrook等人,1989,分子克隆实验室手册(Molecular CloningALaboratory Manual),Cold Spring Harbor Press,N.Y.;和Ausubel等人(eds.),1995,分子生物学当前规程(CurrentProtocols in Molecular Biology),(John Wiley & Sons,N.Y.)。
当然,仅与聚腺苷酸序列(如mRNA的3’末端聚腺苷酸区域)或与互补的T(或U)残基区段杂交的多核苷酸不包括于本发明中用于特异性地与本发明的核酸部分杂交的的多核苷酸中,这是因为这样一种多核苷酸可与含有聚腺苷酸区段或其补体的任何核酸分子进行杂交(如实际上任何双链的cDNA克隆)。
从其他生物中获得全长的DNA在一般方法中,可对由其他生物构建的cDNA文库进行筛选,如来自丝状真菌的,特别是来自曲霉属物种的。
例如,曲霉属菌种可通过RNA印迹分析来筛选同源的蛋白酶多核苷酸。在对根据本发明的多核苷酸的同源转录物进行探测后,利用本领域技术人员众所周知的标准技术可从分离自适当的品系的RNA构建cDNA文库。或者,总的基因组DNA文库可用与根据本发明的蛋白酶多核苷酸杂交的探针进行筛选。
例如,同源基因序列可通过进行PCR来分离,该PCR使用在所述核苷酸序列基础上设计的两个寡核苷酸引物或两个简并的寡核苷酸引物库。
反应的模板可为通过对mRNA进行逆转录而获得的cDNA,该mRNA从已知或猜测可表达根据本发明的多核苷酸的菌种中制备。可对PCR产物进行亚克隆和测序以确保扩增的序列代表新蛋白酶的核酸序列或其功能等价物的序列。
然后PCR片段可通过多种已知的方法用于分离全长的cDNA克隆。例如,可对扩增的片段进行标记并用于筛选噬菌体或粘粒cDNA文库。或者,可将标记的片段用于筛选基因组文库。
也可将PCR技术用于从其他生物中分离全长cDN
编码新蛋白水解酶的新基因制作方法
- 专利详情
- 全文pdf
- 权力要求
- 说明书
- 法律状态
查看更多专利详情
下载专利文献

下载专利
同类推荐
-
刘奎成, 陈俊杰刘奎成, 陈俊杰刘奎成, 陈俊杰刘奎成, 陈俊杰刘奎成, 陈俊杰刘奎成, 陈俊杰
您可能感兴趣的专利
-
刘文玉
专利相关信息
-
黄仲贤A.格特勒巩宪昌, 钟鸣