早鸽—汇聚行业精英
  • 联系客服
  • 帮助中心
  • 投诉举报
  • 关注微信
400-006-1351
您的问题早鸽都有答案
3000+专业顾问
搜索
咨询

改进的类异戊二烯生产制作方法

  • 专利名称
    改进的类异戊二烯生产制作方法
  • 发明者
  • 公开日
  • 申请日期
  • 优先权日
  • 申请人
  • 文档编号
  • 关键字
  • 专利详情
  • 全文pdf
  • 权力要求
  • 说明书
  • 法律状态
专利名称:改进的类异戊二烯生产的制作方法:本发明涉及新的用于类异戊二烯生物合成途径的多核苷酸和多肽序列。更具体地,本发明涉及重组制备的细胞,该细胞显示出改进的玉米黄质产量。还提供了制备和使用这种细胞系的方法。类胡萝卜素是一种重要的C-40类异戊二烯化合物商品,可作为人类的营养性支持物、药物和食用色素,还可作为动物饲料的色素。目前重要的工业类胡萝卜素的生产主要是通过化学合成(β-胡萝卜素,角黄素和虾青素)或者从天然材料中提取(叶黄素提取自万寿菊,辣椒红提取自红辣椒(paprika))。但是,使用微生物生产类胡萝卜素已经取得了几例成功。例如,使用真菌三孢布拉霉(blakeslea trispora)(US 5,328,845)进行发酵或使用耐盐藻类Dunaliella salina进行池塘养殖[Borowitzka,J.Biotechnol.70313-321(1999)]都可生产β-胡萝卜素。还有三孢布拉霉(B.trispora)生产番茄红素的报道(WO 00/77234)。使用酵母(Phaffia rhodozyma,(最近更名为Xanthophyllomyces dendorous))(US 6,015,684)发酵或使用藻类Haematococuspluvialis在光生物反应器内或开放的池塘内可以生产虾青素[Lorenz和Cysewski,Trends Biotechnol.18160-167(1999);Olaizola,J.Appl.Phycol.12499-506(2000)]。但是这种微生物生产系统生产的类胡萝卜素数量过低,工业规模生产则难以产生经济效益。在1960年代中期,Hoffmann-La Roche的科学家们分离了几种海洋细菌,其能够生产黄色的类胡萝卜素玉米黄质,该物质可用于家禽色素形成以及预防人类中与年龄相关的黄斑变性。一种细菌,其显示出极有潜力的玉米黄质产率,被命名为R-1512,已保藏在美国典型培养物保藏中心(American Type Culture Collection)(ATCC,Manassas,VA,USA),保藏号为ATCC 21588(US 3,891,504)。使用当时公认的分类标准(按照EidgenossischeTechnische Hochschule(Zurich)和National Collection of Industrial Bactria,Torry Research Station(Aberdeen Scotland)进行的分类),这个能够生产玉米黄质的有机体被归类为黄杆菌属(Flavobacterium),但是没有命名种名。然后进行了大量的诱变和筛选过程,以分离得到具有更高玉米黄质产率的R-1512突变体。在本文描述的研究中,有两种这样的突变体比较显著。按照玉米黄质产率顺序,列出这两个突变体R1534和R114。在过去几年中还用过各种其它的突变体,用于类胡萝卜素的生物合成的生化研究[Goodwin,Biochem.Soc.Symp.35233-244(1972);McDermott等,Biochem.J.1341115-1117(1973);Britton等,Arch.Microbiol.11333-37(1977);Mohanty等,Helvetica Chimica Acta 832036-2053(2000)]。通过常规利用R-1512菌株衍生的突变体发展一种商业生命力的发酵过程来生产玉米黄质的早期尝试没有成功。但是,随着分子生物学的进展,发展一种更高玉米黄质产率菌株的可能性随之出现。为此,采取的第一个步骤是克隆并测序R-1534菌株的类胡萝卜素基因簇(US 6,087,152,将该文献全文并入作为参考)。US 6,087,152公开了类胡萝卜素基因在大肠杆菌和枯草芽孢杆菌(Bacillus Subtilis)中功能性表达,使得这些宿主产生玉米黄质。US 6,087,152还公开了通过修饰类胡萝卜素基因簇或加入自产虾青素细菌的基因,就有可能产生玉米黄质之外的各种类胡萝卜素(EP 872,554)。而且,EP 872,554公开了通过向多拷贝质粒导入克隆的类胡萝卜素基因簇,可以提高R1534菌株的类胡萝卜素产量。尽管类异戊二烯化合物存在大量的结构多样性,但是都是由一个共同的C-5前体,异戊烯焦磷酸(IPP)生物合成而来的。直到1990年代早期,才基本上接受了IPP是通过甲羟戊酸途径在所有有机体内合成,即使有些实验结果与这个生物发生模式不一致[Eisenreich等,Chemistry and Biology5R211-R233(1998)]。甲羟戊酸途径自从发现了IPP生物合成的替代性途径,脱氧木糖醇(DXP)途径之后,这种不一致就找到了解释(注释在科学文献中,IPP生物合成的替代性途径已被命名了多个名字(DXP途径,DOXP途径,MEP途径,GAP/丙酮酸途径以及非甲羟戊酸途径。本文中为简化,仅使用DXP途径)。DXP途径的前5个反应已被鉴定[Herz等,Proc.Nat.Acad.Sci 972486-2490(2000)],但是其后生成IPP的步骤尚不清楚。DXP途径
McDermott等(同上)和Britton等[J.Chem.Soc.Chem.Comm.p.27(1979)]揭示源自原Roche分离群的产玉米黄质突变株,其粗提物中的玉米黄质掺入了标记的甲羟戊酸。没有理由再质疑这个通过甲羟戊酸途径进行IPP生物合成的证据,这项研究是在发现DXP途径之前进行的,已有报道称一些细菌(链霉菌属的种类)同时具备IPP合成的这两种途径,并且这些途径的表达受时间(temporally)调控[Seto等,Tetrahedron Lett.377979-7982(1996);Dairi等,Mol.Gen.Genet.262957-964(2000)]。另外,目前只有少数的真细菌显示具有IPP合成的甲羟戊酸途径。这些细菌中编码甲羟戊酸途径各种酶的基因已被克隆并测序[Wilding等,J.Bacteriol.1824319-4327(2000);Takagi等,J.Bacteriol 1824153-4157(2000)]。
已有几个范例显示代谢工程的应用已成功地改变或改进了微生物生产类胡萝卜素的产量[Lagarde等,Appl.Env.Microbiol.6664-72(2000);Wang等,Biotechnol.Bioeng.62235-241(1999);Wang等,Biotechnol. Prog.16922-926(2000)(作为本文的参考);Sandmann等,Trends Biotechnol.17233-237(2000);Misawa and Shimada,J.Biotechnol.59-169-181(1998);Matthews and Wurtzel,Appl.Microbiol.Biotechnol.53396-400(2000);Albrecht et al.,Nature Biotechnol.18843-846(2000);Schmidt-Dannert et al.Nature Biotechnol.18750-753(2000)]。例如,大肠杆菌,不具备胡萝卜素形成作用(non-carotenogenic)的细菌,可通过导入克隆的类胡萝卜素(crt)基因进行改造使细菌生产类胡萝卜素,所述细菌Agrobacterium aurantiacum,草生欧文氏菌(Erwinia herbicola)或菠萝欧文氏菌(Erwinia uredovora)(Misawa和Shimada,同上)。Harker和Bramley[FEBS Lett.448115-119(1999)]和Matthews和Wurtzel(同上)公开通过过量表达编码1-脱氧-D-木糖醇-5-磷酸合成酶(DXPS)的基因,可提高这种改造过的大肠杆菌菌株中的类胡萝卜素产量,该酶是DXP途径中的第一个酶(大肠杆菌只有类异戊二烯生物合成的DXP途径,并不使用甲羟戊酸途径[Lange et al.,Proc.Nat.Acad.Sci.9713172-13177(2000)])。Harker和Bramley(同上)还公开了在过量产生DXPS的细胞中,类异戊二烯化合物泛醌-8的升高。这些结果均支持如下的假说由于DXPS体内活性不足,导致IPP有效性受限,这就限制了类胡萝卜素以及其它类异戊二烯化合物在改造菌株中的产量。使用类似的大肠杆菌体系,Kim和Keasling[Biotechnol.Bioeng.72408-415(2001)]公开了组合的过量表达编码DXPS和DXP途径的第二个酶——DXP还原异构酶(1-脱氧-D-木酮糖-5-磷酸还原异构酶)(1-deoxy-D-xylulose-5-phosphate reductoisomerase)的基因,所得到的类胡萝卜素产量高于仅仅过量表达编码DXPS的基因的产量。
所有这些研究都是对大肠杆菌进行改造使其生产类胡萝卜素。相应地,这些研究的一个不足之处在于这些重组大肠杆菌菌株生产的类胡萝卜素产量即使跟工业化生产类胡萝卜素的非重组的微生物相比,也非常低。另外,通过遗传工程改造IPP生物合成途径在细菌中改进类胡萝卜素生产只在应用DXP途径进行IPP合成的生物体中才能看到。对于经甲羟戊酸途径生成IPP的细菌则没有类似的研究报道。
已经报道了在酵母中通过甲羟戊酸的代谢工程以改进类异戊二烯化合物的生产。例如,WO 00/01649公开了当3-羟基-3-甲基戊二酸单酰辅酶A还原酶(HMG-CoA还原酶)被过量表达时,类异戊二烯化合物在酿酒酵母(Saccharomyces cerevisiae)中的产量有所提高。但是,未显示该方案能够改进细菌中类胡萝卜素的产量,特别是它没有显示出通过扩增甲羟戊酸途径各基因的表达可以改进细菌中类胡萝卜素的产量。已经发现,一些真核生物[Campos等,Biochem.J.35359-67(2001)]和链霉菌属细菌菌株CL190(Takagi等,同上)的甲羟戊酸途径基因可以在大肠杆菌中表达,未报道在这些菌株中类异戊二烯的产量有所提高。
除了形成IPP[通过DXP或甲羟戊酸途径]以及将法呢基焦磷酸转换为各种其它类异戊二烯(如类胡萝卜素,苯醌)的反应之外,还已知两种反应涉及类异戊二烯的生物合成。IPP异构酶使IPP及其异构体——二甲基烯丙基焦磷酸(DMAPP)两者之间相互转变。存在两种形式的IPP异构酶,众所周知真核生物和一些细菌中的1型酶,而新近鉴定的2型酶是FMN-和NADP(H)依赖性的[Kaneda等,Proc.Nat.Acad.Sci.98932-937(2001)]。
几篇报道公开了在改造的产类胡萝卜素大肠杆菌中,扩增天然或异源的1型IPP异构酶(idi)基因可以促进类胡萝卜素的产量[Kajiwara等,Biochem.J.324421-426(1997);Verdoes和van Ooyen,Acta Bot.Gallica 14643-53(1999);Wang等,同上]。在一篇报道(Wang等,同上)中进一步公开当idi和crtE(GGPP合成酶/geranyl-geranyl diphosphate synethase)基因组合过量表达时,过量表达编码FPP合成酶(法呢基二磷酸合成酶(farnesyldiphosphate synthase))的ispA基因,可提高改造的产类胡萝卜素大肠杆菌菌株的类胡萝卜素产量。但是,对于IPP生物合成途径而言,没有显示出过量表达编码IPP异构酶或FPP合成酶的基因可以改进天然产类胡萝卜素微生物的类胡萝卜素产量。同样,上述的大肠杆菌菌株所产生的类胡萝卜素水平很低,而且,在原本类胡萝卜素产量较高的工业微生物中,这种策略还未显示出作用。
总之,没有任何现有证据证明提高编码甲羟戊酸途径的各酶基因的表达可以改进天然产类胡萝卜素(carotenogenic)细菌、或天然不生产类胡萝卜素而被改造使其生产类胡萝卜素的细菌的类胡萝卜素产量。
本发明的一个实施方案是分离的多肽,其含有选自下列的氨基酸序列(a)SEQ ID NO43中1-340残基所示的氨基酸序列;(b)SEQ ID NO45中1-349残基所示的氨基酸序列;(c)SEQ ID NO47中1-388残基所示的氨基酸序列;(d)SEQ ID NO49中1-378残基所示的氨基酸序列;(e)SEQ ID NO51中1-305残基所示的氨基酸序列;(f)SEQ ID NO53中1-332残基所示的氨基酸序列;(g)选自SEQ ID NO43,45,47,49,51和53所示氨基酸序列的片段,其中所述片段至少具有30个连续的氨基酸残基;(h)选自SEQ ID NO43,45,47,49,51和53所示多肽片段的氨基酸序列,所述片段具有HMG-CoA还原酶,异戊烯二磷酸异构酶,羟基甲基戊二酸单酰-CoA合成酶(HMG-CoA合成酶),甲羟戊酸激酶,磷酸甲羟戊酸激酶,或二磷酸甲羟戊酸脱羧酶的活性;(i)严谨条件下与杂交探针杂交的多核苷酸所编码的多肽氨基酸序列,所述杂交探针含有SEQ ID NO42或其互补序列的至少30个连续核苷酸,其中所述多肽具有HMG-CoA还原酶,异戊烯二磷酸异构酶,HMG-CoA合成酶,异戊烯二磷酸异构酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶,或二磷酸甲羟戊酸脱羧酶的活性;以及(j)SEQ ID NO43,45,47,49,51或53经保守修饰而形成的变体。
如上所述,本发明包括SEQ ID NO43,45,47,49,51和53,其分别相应于下述甲羟戊酸途径各酶的多肽序列羟甲基戊二酸单酰CoA(HMG-CoA)(hydroxymethyl glutaryl CoA)还原酶,异戊烯二磷酸(IPP)异构酶,HMG-CoA合成酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶和二磷酸甲羟戊酸脱羧酶。本发明还包括每个鉴定序列的至少30个连续氨基酸,或足够数目的连续氨基酸,以定义生物活性分子。
本发明还包括选自SEQ ID NO43,45,47,49,51和53多肽的片段。该片段的长度至少应约为30个氨基酸长,且必须具有鉴定多肽的活性,例如对于SEQ ID NO43而言,其落入本发明范围之内的片段具有HMG-CoA还原酶的活性。在本文中,各片段活性的测定在实施例1中描述。实施例1所述的试验中具有高于背景活性的片段被认为具有生物学活性,属于本发明的范围。
本发明还包括多核苷酸所编码多肽的氨基酸序列,所述多核苷酸在严谨条件(如上面所定义)下能够与杂交探针杂交,所述探针含有SEQ ID NO42(即甲羟戊酸操纵子)或其互补序列的至少30个连续核苷酸。该多核苷酸必须编码甲羟戊酸途径的至少一种酶。本发明中,“杂交探针”指含有SEQID NO42的大约10-9066核苷酸的多核苷酸序列。
在该实施方案中,分离的多肽可以具有SEQ ID NO43,SEQ ID NO45,SEQ ID NO47,SEQ ID NO49,SEQ ID NO51或SEQ ID NO53的氨基酸序列。或者,该分离的多肽可含有选自各个氨基酸序列区域的、大约30个连续的氨基酸,与来自不同种类,且具有相同功能的酶相比,所述氨基酸序列具有最小的同源性。因此,本发明多肽可含有例如SEQ ID NO43的68-97,SEQ ID NO45的1-30,SEQ ID NO47的269-298,SEQ ID NO49的109-138,SEQ ID NO51的198-227或SEQ ID NO53的81-110氨基酸。
本发明的另一实施方案是分离的多肽,其具有选自下述的氨基酸序列(a)SEQ ID NO159的1-287残基所示的氨基酸序列;(b)SEQ ID NO159的至少30个连续的氨基酸残基;(c)SEQ ID NO159的片段的氨基酸序列,所述片段具有法呢基-二磷酸合成酶(FPP合成酶)的活性;(d)在严谨条件下与杂交探针杂交的多核苷酸所编码的多肽氨基酸序列,所述杂交探针含有ispA基因(即SEQ ID NO157的295-1158核苷酸)或其互补序列的至少30个连续核苷酸,其中所述多肽具有FPP合成酶的活性;以及(e)SEQ ID NO159经保守修饰而形成的变体。
这样,该实施方案中,氨基酸可由编码FPP合成酶的整个开放阅读框架编码,即SEQ ID NO159的1-287残基,其至少30个连续的残基,或SEQ ID NO159的片段,其必须具有FPP合成酶活性,如实施例1中所描述的试验所测定。另外,本发明的该实施方案还包括在严谨条件(如上定义)下,能够与杂交探针杂交的多核苷酸所编码的氨基酸序列,所述探针含有ispA基因(即SEQ ID NO157的295-1158核苷酸)或其互补序列的至少30个连续核苷酸,其中所述多肽如上定义具有FPP合成酶的活性。
在一个优选实施方案中,该多肽具有SEQ ID NO159的氨基酸序列。
本发明的另一实施方案是分离的多肽,其具有选自下述的氨基酸序列(a)SEQ ID NO160的1-142残基所示的氨基酸序列;(b)SEQ ID NO160的至少30个连续的氨基酸残基;(c)SEQ ID NO160的片段的氨基酸序列,所述片段具有1-脱氧木糖醇-5-磷酸合成酶(DXPS)的活性;(d)在严谨条件下能够与杂交探针杂交的多核苷酸所编码的多肽氨基酸序列,所述杂交探针含有SEQ ID NO157或其互补序列1185-1610位的至少30个连续核苷酸,其中所述多肽具有DXPS合成酶的活性;以及(e)SEQ ID NO160经保守修饰而形成的变体。
这样,该实施方案中,氨基酸可由编码DXPS合成酶的整个开放阅读框架编码,即SEQ ID NO160的1-142残基,其至少30个连续的残基,或SEQ ID NO160的片段,其如实施例1中所描述的试验所测定具有DXPS合成酶活性。另外,本发明的该实施方案还包括在严谨条件(如上定义)下,能够与杂交探针杂交的多核苷酸所编码的氨基酸序列,所述探针含有DXPS基因(即SEQ ID NO157的1185-1610核苷酸)或其互补序列的至少30个连续核苷酸,其中所述多肽如上定义具有DXPS合成酶的活性。
在一个优选实施方案中,该多肽具有SEQ ID NO160的氨基酸序列。
本发明的另一实施方案是分离的多肽,其具有选自下述的氨基酸序列(a)SEQ ID NO178的1-390残基所示的氨基酸序列;(b)SEQ ID NO178的至少30个连续的氨基酸残基;(c)SEQ ID NO178的片段的氨基酸序列,所述片段具有乙酰-CoA乙酰基转移酶的活性;(d)在严谨条件下能够与杂交探针杂交的多核苷酸所编码的多肽氨基酸序列,所述杂交探针含有phaA基因(即SEQ ID NO177的1-1179核苷酸)或其互补序列的至少30个连续核苷酸,其中所述多肽具有乙酰-CoA乙酰基转移酶的活性;以及(e)SEQ ID NO178经保守修饰而形成的变体。
这样,该实施方案中,氨基酸可由编码乙酰-CoA乙酰基转移酶的整个开放阅读框架编码,即SEQ ID NO178的1-143残基,其至少30个连续的残基,或SEQ ID NO178的片段,其必须具有乙酰-CoA乙酰基转移酶活性,如实施例1中所描述的试验所测定。另外,本发明的该实施方案还包括在严谨条件(如上定义)下,能够与杂交探针杂交的多核苷酸所编码的氨基酸序列,所述探针含有phaA基因(即SEQ ID NO177的1-1170核苷酸)或其互补序列的至少30个连续核苷酸,其中所述多肽如上定义具有乙酰-CoA乙酰基转移酶的活性。
在一个优选实施方案中,该多肽具有SEQ ID NO178的氨基酸序列。
本发明的另一实施方案是分离的多肽,其具有选自下述的氨基酸序列(a)SEQ ID NO179的1-240残基所示的氨基酸序列;(b)SEQ ID NO179的至少30个连续的氨基酸残基;(c)SEQ ID NO179的片段的氨基酸序列,所述片段具有乙酰乙酰-CoA还原酶的活性;(d)在严谨条件下能够与杂交探针杂交的多核苷酸所编码的多肽氨基酸序列,所述杂交探针含有phaB基因(即SEQ ID NO177的1258-1980核苷酸)或其互补序列的至少30个连续核苷酸,其中所述多肽具有乙酰乙酰-CoA还原酶的活性;以及(e)SEQ ID NO179经保守修饰而形成的变体。
这样,该实施方案中,氨基酸可由编码乙酰乙酰-CoA还原酶的整个开放阅读框架编码,即SEQ ID NO179的1-240残基,其至少30个连续的残基,或SEQ ID NO179的片段,该片段具有乙酰乙酰-CoA还原酶活性,如实施例1中所描述的试验所测定。另外,本发明的该实施例还包括在严谨条件(如上定义)下,能够与杂交探针杂交的多核苷酸所编码的氨基酸序列,所述探针含有phaB基因(即SEQ ID NO177的1258-1980核苷酸)或其互补序列的至少30个连续核苷酸,其中所述多肽如上定义具有乙酰乙酰-CoA还原酶的活性。
在一个优选实施方案中,该多肽具有SEQ ID NO179的氨基酸序列。
本文所用的术语“多肽”,“多肽序列”,“氨基酸”和“氨基酸序列”可互换使用,指寡肽,肽,多肽,或蛋白序列,或它们的片段,以及天然存在或合成的分子。在本文中,“片段”,“免疫原性片段”,或“抗原性片段”指本文所定义的任一多肽的片段,该片段长度至少约为30个氨基酸,并具有所述多肽的某些生物活性或免疫活性。当用“氨基酸序列”描述天然蛋白分子的氨基酸序列时,“氨基酸序列”及其类似的术语并不是将氨基酸序列限定为与所述的蛋白分子相关的完全天然的氨基酸序列。
当用于描述多肽时,术语“分离的”指蛋白或多肽已经从天然状态下与其混合(accompany)的各个组分中分离出来。当样品的至少约60-75%呈现为单一多肽序列时,即分离得到了单体蛋白。分离的蛋白通常含有约60-90%W/W的蛋白样品,更通常约为95%,优先高于约99%纯度。蛋白纯度或均一性可利用本领域公知的许多方式表示,如蛋白样品的聚丙烯酰胺凝胶电泳,再通过染色凝胶观测单一多肽条带。为满足某些目的,可使用HPLC或其它本领域公知的方法提供更高的纯化分辨率。
本文中术语“生物活性”指具有天然存在分子的结构,调节性或生化功能的蛋白。同样,“免疫活性”指天然,重组或合成多肽或其任一寡肽的性能,该性能可在适当的动物或细胞内诱导特定免疫应答,并结合特定抗体。
本发明的另一实施方案是分离的多核苷酸序列,其具有甲羟戊酸操纵子(SEQ ID NO42)的核苷酸序列,SEQ ID NO42各变体的核苷酸序列,所述变体含有一个或多个符合副球菌种(Paracoccus sp.)菌株1534密码子利用表(参见表14)的取代,或SEQ ID NO42的片段。SEQ ID NO42的变体和片段必须编码具有选自下述活性的多肽HMG-CoA还原酶,异戊烯二磷酸异构酶活性,羟基甲基戊二酸单酰-CoA合成酶(HMG-CoA合成酶),甲羟戊酸激酶,磷酸甲羟戊酸激酶和二磷酸甲羟戊酸脱羧酶。该实施方案还包括在如上定义的严谨条件下能够与杂交探针杂交的多核苷酸序列,所述探针的核苷酸序列由SEQ ID NO42的大约10到约9066个核苷酸构成,优选由SEQ ID NO42或其互补序列的30个连续核苷酸构成,该多核苷酸编码具有选自下述活性的多肽HMG-CoA还原酶,异戊烯二磷酸异构酶,HMG-CoA合成酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶和二磷酸甲羟戊酸脱羧酶。
该实施方案还包括分离的多核苷酸序列,其含有SEQ ID NO42的下述残基2622-3644,3641-4690,4687-5853,5834-6970,6970-7887,7880-8878。这些序列的片段也包括在本发明的范围之内,只要是这些片段能够分别编码具有HMG-CoA还原酶活性,异戊烯二磷酸异构酶活性,HMG-CoA合成酶活性,甲羟戊酸激酶活性,磷酸甲羟戊酸激酶活性和二磷酸甲羟戊酸脱羧酶活性的多肽。
该实施方案还包括在如上定义的严谨条件下,能够与杂交探针杂交的多核苷酸序列,所述探针选自下述由SEQ ID NO422622-3644,3641-4690,4687-5853,5834-6970,6970-7887,7880-8878或其互补序列的至少30个连续核苷酸残基所构成的核苷酸序列,其中多核苷酸分别编码选自具有HMG-CoA还原酶活性,异戊烯二磷酸异构酶活性,HMG-CoA合成酶活性,甲羟戊酸激酶活性,磷酸甲羟戊酸激酶活性或二磷酸甲羟戊酸脱羧酶活性的多肽。
优选地,该分离的多核苷酸由SEQ ID NO42的2622-3644,3641-4690,4687-5853,5834-6970,6970-7887,7880-8878核苷酸构成。
本发明的另一实施方案是分离的多核苷酸序列,其具有SEQ ID NO157的核苷酸序列,SEQ ID NO157各变体的核苷酸序列,所述变体含有一个或多个符合副球菌种菌株1534密码子利用表(参见表14)的取代,或SEQID NO157的片段,SEQ ID NO157的变体和片段均编码具有下述活性的多肽FPP合成酶活性,1-脱氧-D-木酮糖-5-磷酸合成酶活性或XseB活性。该实施方案还包括在如上定义的严谨条件下能够与杂交探针杂交的多核苷酸序列,所述探针的核苷酸序列由SEQ ID NO157或SEQ ID NO157的互补序列的至少30个连续核苷酸构成,其中该多核苷酸编码具有下述活性的多肽FPP合成酶活性,1-脱氧-D-木酮糖-5-磷酸合成酶活性或XseB活性。
优选地,该分离的多核苷酸由SEQ ID NO157的59-292,295-1158或1185-1610位核苷酸构成。
还提供了具有选自下述核苷酸序列的分离多核苷酸序列SEQ ID NO157的59-292位核苷酸,SEQ ID NO157各变体的核苷酸序列,所述变体含有一个或多个符合副球菌种菌株R1534密码子利用表(参见表14)的取代,SEQ ID NO157的59-292位核苷酸序列的片段,该片段编码具有XseB功能的多肽,以及在严谨条件下能够与杂交探针杂交的多核苷酸序列,所述探针的核苷酸序列由SEQ ID NO157或其互补序列的59-292位的至少30个连续核苷酸构成,其中该多核苷酸编码具有XseB功能的多肽。
优选地,该分离的多核苷酸由SEQ ID NO157的59-292位核苷酸构成。
还提供了具有选自下述核苷酸序列的分离多核苷酸序列SEQ ID NO157的295-1158位核苷酸,SEQ ID NO157的295-1158位核苷酸序列的各变体,所述变体含有一个或多个符合副球菌种菌株R1534密码子利用表(参见表14)的取代,SEQ ID NO157的295-1158位核苷酸序列的片段,该片段编码FPP合成酶活性,以及在严谨条件下能够与杂交探针杂交的多核苷酸序列,所述探针的核苷酸序列由SEQ ID NO157或其互补序列的295-1158位的至少30个连续核苷酸构成,其中该多核苷酸编码具有FPP合成酶活性的多肽。
优选地,该分离的多核苷酸由SEQ ID NO157的295-1158位核苷酸构成。
本发明的另一实施方案是具有SEQ ID NO157的1185-1610位核苷酸序列的分离多核苷酸序列,SEQ ID NO157的1185-1610位核苷酸序列的各变体,所述变体含有一个或多个符合副球菌种菌株1534密码子利用表(参见表14)的取代,或SEQ ID NO157的1185-1610位核苷酸序列的片段,该片段编码具有1-脱氧木酮糖-5-磷酸合成酶活性的多肽。该实施方案还包括在严谨条件下能够与杂交探针杂交的多核苷酸序列,所述探针的核苷酸序列由SEQ ID NO157或其互补序列的1185-1610位的至少30个连续核苷酸构成,其中该多核苷酸编码具有1-脱氧木酮糖-5-磷酸合成酶活性的多肽。
优选地,该分离的多核苷酸由SEQ ID NO157的1185-1610位核苷酸构成。
本发明的另一实施方案是具有SEQ ID NO177的核苷酸序列的分离多核苷酸序列,SEQ ID NO177核苷酸序列的各变体,所述变体含有一个或多个符合副球菌种菌株1534密码子利用表(参见表14)的取代,或SEQ IDNO177核苷酸序列的片段,该片段编码具有选自下述活性的多肽乙酰-CoA乙酰基转移酶和乙酰乙酰-CoA还原酶。该实施方案还包括在如上定义的严谨条件下能够与杂交探针杂交的多核苷酸序列,所述探针的核苷酸序列由SEQ ID NO177或其互补序列的至少30个连续核苷酸构成,其中该多核苷酸编码具有选自乙酰-CoA乙酰基转移酶或乙酰乙酰-CoA还原酶活性的多肽。
该实施方案中,分离的多核苷酸序列还可包括SEQ ID NO177的1-1170位核苷酸序列,SEQ ID NO177核苷酸序列的各变体,所述变体含有一个或多个符合副球菌种菌株1534密码子利用表(参见表14)的取代,或SEQ ID NO177核苷酸序列的片段,该片段编码具有乙酰-CoA乙酰基转移酶活性的多肽。该实施方案还包括在严谨条件下能够与杂交探针杂交的多核苷酸序列,所述探针的核苷酸序列由SEQ ID NO177或其互补序列的1-1170位的至少30个连续核苷酸构成,其中该多核苷酸编码具有乙酰-CoA乙酰基转移酶活性的多肽。
优选地,该分离的多核苷酸序列由SEQ ID NO177的1-1170位核苷酸构成。
该实施方案中,分离的多核苷酸序列还可以选择地是SEQ ID NO177的1258-1980位核苷酸序列,SEQ ID NO177核苷酸序列的各变体,所述变体含有一个或多个符合副球菌种菌株1534密码子利用表(参见表14)的取代,或SEQ ID NO177核苷酸序列的片段,该片段编码具有乙酰乙酰-CoA还原酶活性的多肽。该实施方案还包括在严谨条件下能够与杂交探针杂交的多核苷酸序列,所述探针的核苷酸序列由SEQ ID NO177或其互补序列的1258-1980位的至少30个连续核苷酸构成,其中该多核苷酸编码具有乙酰乙酰-CoA还原酶活性的多肽。
优选地,该分离的多核苷酸序列由SEQ ID NO177的1258-1980位核苷酸构成。
在另一优选实施方案中,分离的多核苷酸序列具有选自SEQ ID NO42,SEQ ID NO157,SEQ ID NO177或其组合的核苷酸序列。本文的词组“或其组合”,当用于指核苷酸序列时,是指可对所提及序列的各种组合进行结合以形成该分离的多核苷酸序列。而且,在本发明中,可使用相同序列的多个拷贝,即多连体(concatamers)。同样,如同以下将要详细论述的,含有相同多核苷酸序列的质粒多拷贝可被转移到适当的宿主细胞中。
在本文中,“分离的”多核苷酸(如RNA,DNA或混合的多聚物)是实质上与其它细胞组分分离开的多核苷酸,而这些组分如核糖体,聚合酶,许多其它基因组序列和蛋白,在天然条件下是与天然序列或多肽相互混合的。该术语包括从天然存在的环境中被分离出来的多核苷酸,还包括重组或克隆的DNA分离物,以及化学合成的类似物或由异源系统生物合成的类似物。
术语“核酸序列”指从5′到3′末端方向阅读的、单链或双链的脱氧核糖核苷酸或核糖核苷酸碱基多聚物。其包括染色体DNA,自我复制的质粒,感染性DNA或RNA多聚体,以及具有一级结构功能的DNA或RNA。
“表达调控序列”指核苷酸调控序列的排列,其指导着可操作性连接的核酸的转录。这种表达调控序列的实例为“启动子”。启动子包括在转录起始位点附近的必要的核酸序列。启动子还可任选地含有末端(distal)增强子或阻遏元件,增强子或阻遏元件可定位在转录起始位点的几千个碱基对之外。“组成型”启动子是指在多数环境条件和发育条件下都能够激活的启动子。而“诱导型”启动子是指在环境因素或发育因素的调节下被激活的启动子。术语“可操纵性连接/可操作相连”指在核酸表达调控序列(如启动子或转录因子结合位点的排列)和第二个核酸序列之间的功能性连接,其中表达调控序列指导着相应的第二个序列核酸的转录。
如果一段多核苷酸序列来自异源物种,或者虽然来自相同物种,但已被修饰成与原来不同的形式,那么这段多核苷酸则与某种有机体或第二个多核苷酸序列是“异源的”。例如,启动子与异源编码序列可操纵连接是指编码序列的来源物种不同于启动子的来源物种,或者,来自相同物种,但是编码序列已被修饰成与天然存在的等位变体不同的形式。
当同时发生转基因的表达和外源基因的抑制(如通过反义作用,或有意义抑制(sense suppression))时,本领域技术人员将会意识到插入的多核苷酸序列不必要完全相同于其所来源于的基因序列,但是必须是“基本上相同的”。
当插入的多核苷酸序列被转录以及翻译以生成功能性多肽时,本领域技术人员会认识到由于密码子简并性,大量的多核苷酸序列都可以编码相同的多肽。这些变体都具体包括在本发明的范围之内。另外,本发明还具体包括彼此基本上相同(如下所述进行测定)的序列,并且其编码的多肽是野生型多肽的突变体,或仍维持多肽的功能(如,该多肽氨基酸的保守取代而形成的)。另外,变体可以编码如下所述的显性阴性突变(negative mutant)。
按如下所述,在两个核酸序列或两个多肽序列是按照最大一致性排列时,如果两序列中核苷酸序列或氨基酸残基是分别相同的,可以说这两个核酸序列或这两个多肽是“相同的”。术语“相同”或“同一性”百分比,当用于描述两个或多个核酸或多肽序列时,指当在比较窗口下对比并排列其最大一致性时(按照下述序列对比算法之一进行测定,或通过人工排列和目测进行测定),两个或多个序列或亚序列是相同的,或者具有特定百分比的相同氨基酸残基或核苷酸。当序列同一性的百分比用于蛋白或多肽时,就认为不相同的残基位置通常因保守氨基酸取代而不同,其中氨基酸残基是被其它类似化学属性(如电荷或疏水性)的氨基酸取代,从而不改变该分子的功能。当序列以保守取代的形式而各不相同时,序列同一性百分比可被上调,以校正取代的保守性性质。进行这种调整的方法是本领域技术人员所公知的。通常包括以部分而不是全部错配的方式对保守取代打分(scoring),从而提高序列同一性的百分比。这样,例如,当评定相同的氨基酸为1分时,非保守取代的得分为0,而保守取代的得分在0到1之间。保守取代的得分可根据例如Meyers & Miller,Computer Applic.Biol.Sci.411-17(1988)的算法进行计算,如同在PC/GENE(Intelligenetics,MountainView,Calif.,USA)程序中所执行的。
短语“实质上相同(substantially identical)”,当用于形容两个核酸或多肽时,指当在比较窗口下对比并排列最大一致性时(按照下述序列对比算法之一进行测定,或通过人工排列和目测进行测定),序列间或亚序列间具有至少60%、优选80%,最优选90-95%的核苷酸或氨基酸残基同一性。该定义还指一种序列,该序列的互补序列能够与检测序列杂交。
进行序列对比时,通常一个序列作为对照序列,将检测序列与其进行对比。当使用序列对比算法时,检测和对照序列都被输入计算机,如果必要的话,还可指定各个并列(coordinate)的亚序列,并制定序列算法程序的各个参数。可使用默认的程序参数,或指定可选参数。然后,序列对比算法可在程序参数基础上,计算检测序列相对于对照序列的序列同一性百分比。
本文所用的“对比窗口”,包括选自以下任何数目的连续位置片段参照体系20-600,通常约50-约200,更通常约100-约150,其中序列可以与相同数目的连续位置的对照序列在这两个序列被最优化排列之后,进行对比。排列序列用于对比的方法是本领域公知的。用于对比的序列优化排列可通过如Smith和Waterman,Adv.Appl.Math.2482(1981)的局部同源性算法进行,如Needleman和Wunsch,J.Nat’l,Acad.Sci.USA 852444(1988)的同源性排列算法,这些算法(Wisconsin Genetics Software Package,GeneticsComputer Group,575 Science Dr.,Madison,Wis.中的GAP,BESTFIT,FASTA,和TFASTA)的计算机化运行,或人工排列和目测(visualinspection)。
一种有用的算法实例是PILEUP。PILEUP从一组相关的序列中,使用渐进性成对排列的方法,产生出多个序列排列,以显示其相关性和序列同一性百分比。它还绘出树形图或树状图(dendogram),以标明用于形成排列的聚类(clustering)关系。PILEUP使用简化的Feng和Doolittle,J.Mol.Evol.35351-360(1987)渐进性排列方法。所用的该方法类似于Higgins和Sharp,CABIOS 5151-153(1989)所描述的方法。该程序可以序列对比(align)达300个序列,每个序列的最大长度为5000个核苷酸或氨基酸。多元排列方法是以两个最近似序列的配对排列开始,形成了两个排列序列的组(cluster)。然后该组与下一个最相关的序列或排列序列的组相排列。两组序列通过两个单个序列的成对排列的简单延伸而排列。一系列渐进性配对排列之后就获得了最后的排列。通过指定用于序列比较区域的具体序列和其氨基酸或核苷酸序列匹配物(coordinate),并指定程序的参数,就可运行该程序。例如,对照序列可与其它的检测序列相比较,以测定序列同一性关系的百分比,使用以下参数默认的gap weight(3.00),默认的gap length weight(0.10)和weighted end gaps。
另一种适用于测定序列同一性百分比以及序列相似性的算法的实例为BLAST算法[Altschul等,J.Mol.Biol.215403-410(1990)]。进行BLAST分析的软件可通过National Center for Biotechnology Information(http//www.ncbi.nlm.nih.gov/)获得。该算法涉及首先通过在查询序列中鉴定出W长度的短序列(words),当该序列与数据库序列中相同长度的序列对比时,能够匹配或符合某个以位置进行衡量(positive-valued)的阈值T,以此鉴定出高分的序列对(HSP)。T指临近序列(neighborhood word)的分数阈值(Altschul等,同上)。这些起始性临近序列点作为种子(seeds)用于起始检索,以找到将之包含其中的更长的HSP。序列点(hit)在每个序列的两个方向上均延伸,以使累积的排列分数能够增加。当下述情况下,停止序列点在两个方向上的延伸累积的排列分数从其获得的最大值处下降了X数量;由于一个或多个负分数残基加入排列后逐渐积累,使得累积的分数变为0或负数,或者任一序列已到达末尾。该BLAST算法参数W,T和X决定着排列的灵敏度和速度。使用BLAST程序的默认参数序列长度(word length)(W)为11,BLOSUM62分数基质(参见Henikoff和Henikoff,Proc.Natl.Acad.SciUSA 8910915(1989))排列(B)为50,预期值(E)为10,M=5,N=-4,以及两条链的对比。
BLAST算法还可对两条序列之间的相似性进行统计学分析[例如,参见Karlin和Altschul,Proc.Nat’l.Acad.Sci.USA 905873-5787(1993)]。BLAST算法提供的相似性测定方法是概率的最小和(P(N)),其表明两个核苷酸或氨基酸序列之间偶然发生匹配的机率。例如,如果检测核酸与对照核酸之间的对比中,最小总和概率(smallest sum probability)小于约0.2,更有选小于约0.01,最优选小于约0.001,则认为该核酸与对照核酸相似。
“保守修饰的变体”可用于描述氨基酸或核酸序列。当用于特定核酸序列时,保守修饰的变体指编码相同或基本相同氨基酸序列的核酸,或不编码氨基酸序列的核酸,基本相同的序列。由于遗传密码的简并性,许多功能相同的核酸密码子可编码任何指定的蛋白。例如,密码子GCA,GCC,GCG和GCU都编码丙氨酸。这样,在每个丙氨酸被某个密码子具体指定的各位置,该密码子都可被改变为任何相应所述的密码子,而不会改变被编码的多肽。这样的核酸变体是“沉默变体”(silent variations),其为一种保守修饰的变体。本文中编码多肽的每个核酸序列还描述该核酸的各个可能沉默变体。本领域技术人员公知核酸中的每个密码子(除了AUG,其通常为蛋氨酸的唯一密码子)均可被修饰,以形成功能相同的分子。同样,编码多肽的核酸的每个沉默突变均已隐含在每个被描述的序列中。
当描述氨基酸序列时,本领域技术人员公知核酸中单个的取代,缺失或插入,或肽,多肽或蛋白序列的取代,其改变了编码序列中的单个氨基酸或小百分率氨基酸(即,小于20%,如15%,10%,5%,4%,3%,2%或1%),当这种改变形成了类似化学属性氨基酸的氨基酸取代时,则认为该核酸序列为“保守取代变体”。提供功能类似氨基酸的保守取代表是本领域公知的。
下述六组均含有彼此为保守取代的氨基酸丙氨酸(A),丝氨酸(S),苏氨酸(T);天冬氨酸(D),谷氨酸(E);天冬酰胺(N),谷氨酰胺(Q);精氨酸(R),赖氨酸(K);异亮氨酸(I),亮氨酸(L),蛋氨酸(M),缬氨酸(V);和苯丙氨酸(F),酪氨酸(Y),色氨酸(W)。(参见,如Creighton,Proteins(1984))。
指示两个核酸序列或多肽基本上相同的标识为第一个核酸编码的多肽,与抗第二个核酸所编码多肽的抗体之间具有免疫交叉反应。这样,例如,当一个多肽与第二个多肽之间的区别仅仅在于保守取代时,这两个多肽通常实质上(substantially)相同。指示两个核酸序列实质上相同的标识为这两个分子或其互补序列彼此之间能够在如下所述的严谨条件下杂交。
短语“与……特异性杂交”指当核酸序列存在于复杂混合物(如总细胞或DNA或RNA文库)中时,在严谨杂交条件下,某分子仅仅与该特定的核酸序列结合,配对(duplexing)或杂交。
短语“严谨杂交条件”指在该条件下,探针能够与其靶序列而非其它序列杂交,所述靶序列通常存在于核酸序列的复杂混合物中。严谨杂交条件是序列依赖性的,并在不同的环境条件下有所不同。长序列在较高的温度下才会特异杂交。核酸杂交的详细指南可参见Tijssen,Techniques inBiochemistry and Molecular Biology-Hybridization with Nucleic Probes,“Overviews of Principles of Hybridization and the Strategy of Nucleic AcidAssays”(1993)。通常,高度严谨条件选择为在指定的离子强度和pH下,比特定序列的热融点(Tm)低约5-10℃。低严谨条件通常选择为Tm下约15-30℃。Tm是指这样的温度在该温度下(在指定离子强度,pH,和核酸浓度下),有50%互补于靶序列的探针以平衡状态与该靶序列杂交(当靶序列过量存在时,在Tm下,50%的探针被结合,该状态维持平衡)。严谨条件指这样的条件在pH7.0-8.3下,盐浓度低于约1.0M钠离子,通常约0.01-1.0M钠离子浓度(或其它盐),对于短探针(如10-50个核苷酸)而言,温度至少约为30℃,而长探针(如大于50个核苷酸)至少约为60℃。严谨条件还可用加入去稳定剂如甲酰胺而获得。为获得选择性或特定杂交,阳性信号应至少是杂交背景的2倍,优选10倍。
如果它们所编码的肽实质上是相同的,在严谨条件下彼此并不杂交的核酸实质上仍然是相同的。例如当使用该遗传密码的最大密码子简并性形成核酸拷贝时,这种情况会发生。在这种情形下,核酸通常在中等程度的严谨条件下杂交。
在本发明中,含有本发明核酸的基因组DNA或cDNA可使用本发明公开的核酸序列,在严谨条件下,用标准Southern印迹鉴定。为此目的,适于这种杂交的严谨条件包括在37℃,在40%甲酰胺,1M NaCl,1%十二烷基硫酸钠(SDS)的缓冲液中杂交,并在至少约50℃,通常为约55℃-约60℃,用0.2X SSC至少进行20分钟的洗涤一次,或等价条件进行。阳性杂交至少是背景的2倍。本领域普通技术人员公知其它可选的杂交条件和洗涤条件也可用于提供类似的严格度条件。
进一步指示两多核苷酸实质上相同的标识为如果用一对寡核苷酸引物扩增对照序列,该对照序列在严谨杂交条件下用作探针,用于从cDNA或基因组文库中分离检测序列,或鉴定检测序列,如在northern或Southern印迹中。
本发明还包括如上定义的表达载体。该表达载体包括一个或多个上述每种多核苷酸序列的拷贝。本发明的表达载体可含有本文所定义的任一多核苷酸序列,如SEQ ID NO42,或SEQ ID NO42的下述残基2622-3644,3641-4690,4687-5853,5834-6970,6970-7887,7880-8878,以及SEQ ID NO157的残基59-292,295-1158或1185-1610,SEQ ID NO177的残基1-1170或1258-1980。该表达载体可含有本文鉴定的多核苷酸序列的各组合,如,SEQ ID NO42,SEQ ID NO157和SEQ ID NO177。
该表达载体中的多核苷酸还可如上定义,任选地与表达调控序列可操作相连并如实施例中进行扩增。
本发明还包括以下表达载体pBBR-K-mev-op16-1,pBBR-K-mev-op16-2,pDS-mvaA,pDS-idi,pDS-hcs,pDS-mvk,pDS-pmk,pDS-mvd,pDS-His-mvaA,pDS-His-idi,pDS-His-hcs,pDS-His-mvk,pDS-His-pmk,pDS-His-mvd,pBBR-K-Zea4,pBBR-K-Zea4-up,pBBR-K-Zea4-down,pBBR-K-PcrtE-crtE-3,pBBR-tK-PcrtE-mvaA,pBBR-tK-PcrtE-idi,pBBR-tK-PcrtE-hcs,pBBR-tK-PcrtE-mvk,pBBR-tK-PcrtE-pmk,pBBR-tK-PcrtE-mvd,pBBR-K-PcrtE-mvaA-crtE-3,pDS-His-phaA,pBBR-K-PcrtE-crtW,pBBR-K-PcrtE-crtWZ,pBBR-K-PcrtE-crtZW及其组合。这些表达载体在以下的实施例中定义更为详细。而且,本发明还包括含有本文所定义任一序列的表达载体,该表达载体被用于在适当的宿主细胞内表达类异戊二烯化合物,如类胡萝卜素,优选玉米黄质。本文中,短语“表达载体”是携带编码本文所述多核苷酸序列的DNA序列,并能够介导该序列表达的可复制载体。
在本文中,术语“可复制”指在该载体已经导入的、指定类型的宿主细胞中,该载体能够复制。目的多核苷酸序列的直接上游可以提供一段编码信号肽的序列,该肽的存在可以确保携带有载体的宿主细胞表达该编码多肽的分泌。该信号序列可以是与被选择多核苷酸序列天然相关连,或来自另外的来源。
该载体可以是任何可方便地进行重组DNA操作的载体,载体的选择通常依赖于该载体将要导入的宿主细胞。这样,该载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体的复制;这种载体的例子可包括质粒,噬菌体,粘粒或极微染色体。或者,该载体可以是这样的当其被导入宿主细胞时,其可以整合到宿主染色体组中,并随着该被整合的染色体一起复制。适当的载体如实施例所示。本发明的表达载体可以携带以下定义的本发明任一DNA序列,以及用于表达本发明以下定义的任何多肽。
本发明还包括含有本文所述的一个或多个多核苷酸序列和/或一个或多个表达载体的培养细胞。本文中,“培养细胞”包括任何能够在指定条件下生长并表达一个或多个本发明多核苷酸编码多肽的细胞。优选地,该培养细胞为酵母,真菌,细菌或藻类。更优选地,该培养细胞为副球菌,黄杆菌属(Flavobacterium),土壤杆菌属(Agrobacterium),产碱杆菌属(Alcaligenes),欧文氏杆菌属(Erwinia),大肠杆菌(E.coli)或枯草杆菌(B.subtilis)。甚至更优选地,该细胞为副球菌,如R-1506,R-1512,R1534或R114。本发明还包括本文所鉴定的、能够表达本文所公开多肽的任何细胞的后代。在本发明中,如果使用实施例2所述条件,某个细胞的AFLP DNA指纹与假定亲代细胞的无区别,则认为该细胞即为其后代。
这样,本发明的培养细胞可包括,例如SEQ ID NO42或SEQ ID NO42的下述残基2622-3644,3641-4690,4687-5853,5834-6970,6970-7887,7880-8878,以及SEQ ID NO157的残基59-292,295-1158或1185-1610,SEQ ID NO177的残基1-1170或1258-1980。这些序列可以单独地,或作为其它表达载体的一部分,被转移到细胞中。这些序列还可任选地与表达调控序列可操作相连。该培养细胞还可含有本文所鉴定多核苷酸序列的各个组合,如SEQ ID NO42,SEQ ID NO157和SEQ ID NO177。
本发明的培养细胞还可进一步含有编码一个或多个类胡萝卜素生物合成途径酶的多核苷酸。例如,本发明的培养细胞可含有一个或多个SEQ IDNO180,182和184的拷贝,这些拷贝可以单独或与本文所定义的任一多核苷酸序列一起包含在本发明培养细胞中。这样,本发明公开的多核苷酸序列可以单独地,或与其它能够提高类异戊二烯化合物靶物质(如象玉米黄质或虾青素的类胡萝卜素)产量的另一多核苷酸序列一起,被转移到培养细胞中。在这方面,本发明包括任何编码如类胡萝卜素生物合成相关多肽的多核苷酸的应用,所述多肽如GGPP合成酶,β-胡萝卜素-β4-加氧酶(酮酶),和/或β-胡萝卜素羟化酶。另外,还可将编码类胡萝卜素生物合成相关多肽的多核苷酸组合与一个或多个本文鉴定的多核苷酸在相同或不同的表达载体中联合使用。这种构建体可被转移到本发明的培养细胞中以形成能够表达目的类异戊二烯物质的细胞。
例如,本发明的培养细胞可含有一个或多个下述表达载体pBBR-K-mev-op16-1,pBBR-K-mev-op16-2,pDS-mvaA,pDS-idi,pDS-hcs,pDS-mvk,pDS-pmk,pDS-mvd,pDS-His-mvaA,pDS-His-idi,pDS-His-hcs,pDS-His-mvk,pDS-His-pmk,pDS-His-mvd,pBBR-K-Zea4,pBBR-K-Zea4-up,pBBR-K-Zea4-down,pBBR-K-PcrtE-crtE-3,pBBR-tK-PcrtE-mvaA,pBBR-tK-PcrtE-idi,pBBR-tK-PcrtE-hcs,pBBR-tK-PcrtE-mvk,pBBR-tK-PcrtE-pmk,pBBR-tK-PcrtE-mvd,pBBR-K-PcrtE-mvaA-crtE-3,pDS-His-phaA,pBBR-K-PcrtE-crtW,pBBR-K-PcrtE-crtWZ,pBBR-K-PcrtE-crtZW及其组合。
本发明的另一实施方案为生产类胡萝卜素的方法。该方法中,在能够表达如上定义多核苷酸序列所编码的多肽的条件下,培养如上定义的培养细胞。能够表达多肽的培养条件如下述实施例所述,但如需要可进行修改,以适应特定目的需求。然后从细胞或者如果分泌,从细胞培养基中分离类胡萝卜素。
本发明中,“类胡萝卜素”包括下述化合物八氢番茄红素,番茄红素,β-胡萝卜素,玉米黄质,角黄素,虾青素,福寿草黄素(adonixanthin),隐黄素,海胆酮和福寿草红素(adonirubin)及其组合。优选的类胡萝卜素为玉米黄质。
本发明的另一实施方案为制备产类胡萝卜素细胞的方法。该方法包括(a)将编码甲羟戊酸途径酶的多核苷酸序列导入细胞,所述酶在该细胞中能够表达;以及(b)选择出含有步骤(a)多核苷酸序列的细胞,并且该细胞所产生类胡萝卜素的水平为该细胞导入多核苷酸序列之前的1.1-1000倍。
本文中,短语“甲羟戊酸途径酶”指IPP生物合成的甲羟戊酸途径中相关的各种酶,并由atoB或phaA,hcs,mvaA,mvk,pmk和mvd基因编码。就本发明的目的而言,如果使用实施例1所示的任一活性试验能够检测到某种酶,则该酶“在细胞内表达”。检测类胡萝卜素产量的各方法是本领域公知的。实施例1,11和12分别提供了鉴定玉米黄质,番茄红素和虾青素的存在的常规试验方法。类似地,其它类胡萝卜素检测试验可用于检测细胞或培养基中如八氢番茄红素,角黄素,福寿草黄素,隐黄素,海胆酮和福寿草红素的存在。
这样,该方法可用于下述示范性类胡萝卜素的测定八氢番茄红素,番茄红素,β-胡萝卜素,玉米黄质,角黄素,虾青素,福寿草黄素(adonixanthin),隐黄素,海胆酮和福寿草红素(adonirubin)及其组合。该方法中,优选的类胡萝卜素为玉米黄质。
该方法包括制备一种细胞,该细胞生成类胡萝卜素的水平约为该细胞导入多核苷酸序列之前时的1.1-1000倍,优选约1.5-500倍,例如约100倍,或至少10倍。
该方法中,细胞生成类胡萝卜素的量约为1mg/L-10g/L。优选细胞的类胡萝卜素产量为100mg/L-约9g/L,例如,约500mg/L-8g/L,或约1g/L-5g/L。
该方法中,细胞可选自酵母,真菌,细菌或藻类。优选地,该细胞为副球菌(Paracoccus),黄杆菌属(Flavobacterium),土壤杆菌属(Agrobacterium),产碱杆菌属(Alcaligenes),欧文氏杆菌属(Erwinia),大肠杆菌(E.coli)或枯草杆菌(B.subtilis)。更优选地,该细胞为副球菌。
该方法中,细胞可以是突变细胞。本文中“突变细胞”是指任何含有非天然多核苷酸序列、或含有已被改变(如通过重排或缺失或取代1-100个,优选20-50个,更优选低于10个核苷酸)为不同于天然形式的多核苷酸序列的细胞。这种非天然序列可通过随机诱变,化学诱变,UV辐射等等获得。优选地,该突变导致一种或多种甲羟戊酸途径的基因表达量提高,从而提高类胡萝卜素如玉米黄质的产量。制备,筛选和鉴定这种突变细胞的方法是本领域公知的,并如以下的实施例所示。这种突变体的例子为R114或R1534。优选地,该突变细胞为R114。
该方法中,多核苷酸序列为SEQ ID NO42或SEQ ID NO42的下述残基2622-3644,3641-4690,4687-5853,5834-6970,6970-7887,7880-8878,以及SEQ ID NO157的残基59-292,295-1158或1185-1610,SEQ ID NO177的残基1-1170或1258-1980。这些序列可以单独地,或作为其它表达载体的一部分使用。这些序列还可任选地与表达调控序列可操作相连。在该方法中,还可以使用本文所鉴定多核苷酸序列的各个组合,如SEQ ID NO42,SEQ ID NO157和SEQ ID NO177。
可被选择用于该方法的表达载体包括pBBR-K-mev-op16-1,pBBR-K-mev-op16-2,pDS-mvaA,pDS-idi,pDS-hcs,pDS-mvk,pDS-pmk,pDS-mvd,pDS-His-mvaA,pDS-His-idi,pDS-His-hcs,pDS-His-mvk,pDS-His-pmk,pDS-His-mvd,pBBR-K-Zea4,pBBR-K-Zea4-up,pBBR-K-Zea4-down,pBBR-K-PcrtE-crtE-3,pBBR-tK-PcrtE-mvaA,pBBR-tK-PcrtE-idi,pBBR-tK-PcrtE-hcs,pBBR-tK-PcrtE-mvk,pBBR-tK-PcrtE-pmk,pBBR-tK-PcrtE-mvd,pBBR-K-PcrtE-mvaA-crtE-3,pDS-His-phaA,pBBR-K-PcrtE-crtW,pBBR-K-PcrtE-crtWZ,pBBR-K-PcrtE-crtZW及其组合。
该方法中,可使用任何常规方法将多核苷酸序列导入细胞。将多核苷酸序列导入细胞的适当方法包括转化,转导,转染,脂转染(lipofection),电穿孔[参见如Shigekawa和Dower,Biotechniques 6742-751(1988)],接合[参见如Koehler和Thorne,Journal of Bacteriology 1695771-5278(1987)]和基因枪法(biolistics)。
接合在转移多核苷酸序列中的应用,例如以表达载体的形式将多核苷酸转移到受体细菌中的应用通常是有效的,也是熟知的方法(如US5,985,623)。根据细菌的菌株,更通常使用感受态细胞与纯化DNA进行转化。
公知的电穿孔技术(体外和体内)是通过向定位于处理区域附近的电极施加短暂高压脉冲而进行的。在电极间所形成的电场会在细胞膜上产生瞬时形成的小孔,通过该小孔,外源物质就可进入细胞。已知的电穿孔应用中,该电场含有在约100μs的时期中,1000V/cm数量级的单一方形波脉冲。这样的脉冲可通过例如BTX Division of Genetronics,Inc制造的ElectorSquare PoratorT820的已知应用来产生。
基因枪法是运用微弹轰击技术,将多核苷酸运送到靶细胞的系统。通过加速将多核苷酸运送到靶细胞的方法的说明性实施方案为BiolisticsParticle Delivery System,其可用于推进DNA或细胞包覆的颗粒通过一个屏幕,如不锈钢或Nytex屏幕,到达覆盖有培养细胞的过滤器表面。该屏幕会使颗粒散开,这样颗粒不会过于集中地到达培养细胞。据认为居于离子轰击仪和待轰击细胞细胞之间的屏幕会减少粒子凝集的大小,可以通过减少由于过大微弹攻击受体细胞而造成的损失,从而提高转化频率。
为进行轰击,悬浮液中的细胞优选被浓缩到过滤器或固体培养基上。或者,可将其它靶细胞处理到固体培养基上。待轰击的细胞被固定到微弹阻停板下面适当的距离处。如果需要,还可在加速装置和待轰击细胞之间固定一个或多个屏幕。利用这些已知的技术,可以获得高于1000或更多数目的瞬时表达标记基因的细胞焦点。焦点中,轰击后48小时表达外源基因产物的细胞数目通常为1-10,平均为1-3。
在轰击转化中,可将轰击前培养条件和轰击参数最优化,以产生最大数目的稳定转化体。该项技术中轰击的物理和生物学参数都很重要。物理因素是那些与处置多核苷酸/-微弹沉淀相关的因素,或者是影响大或小轰击弹飞行和速度的因素。生物学因素包括在轰击之前和之后立即操作细胞的相关所有步骤,帮助减轻与轰击相关创伤的靶细胞渗透压的调整,还包括转化DNA的性质,如线性DNA或完整的超螺旋质粒。
相应地,可以考虑小范围地调整各种轰击参数以达到条件的最优化。技术人员可能特别期望调整物理参数,如间隙距(gap distance),飞行距离,组织距离(tissue distance)和氦压。技术人员还可以通过修饰影响受体细胞生理状态的条件从而影响转化和整合的效率,将损伤简化因子(traumareduction factors)(TRFs)最小化。例如,可以调整渗透状态,组织水合作用和受体细胞的传代培养阶段或细胞周期来优选转化。参照本文,本领域技术人员将公知其它常规的调整操作。
微粒介导的转化方法是本领域技术人员公知的。例如,US 5,015,580(将其引入本文作为参考)描述了使用这种技术进行的大豆转化。
本发明的另一实施方案是对细菌进行改造使其生产类异戊二烯化合物的方法。这样的细菌是按如下制备(a)在能够表达类异戊二烯的条件下,在培养基中培养亲代细菌,并从该培养基中筛选出突变细菌,该细菌生产的类异戊二烯水平为亲代细菌的约1.1-1000倍;(b)将含有SEQ ID NO42多核苷酸序列的表达载体导入突变细菌,该多核苷酸序列与表达调控序列可操作相连;以及(c)筛选出含有表达载体并且生产类异戊二烯的水平比步骤(a)中的突变体高出至少约1.1倍的细菌。
在该实施方案中,类异戊二烯化合物指以异戊烯二磷酸(IPP)单元的下述通式为结构基础的化合物。
这种化合物包括半萜,单萜,倍半萜,双萜,三萜(如植物甾醇,植物雌激素(phytoestrogens),植物昆虫脱皮激素,雌激素,植物雌激素(phytoestrogens)),四萜(类胡萝卜素)和多萜。优选地,类异戊二烯为类胡萝卜素,例如上述鉴定的类胡萝卜素之一,特别是玉米黄质。
细菌可以是使用本发明公开方法能够生成类异戊二烯化合物的任何细菌。优选地,该细菌为副球菌(Paracoccus),黄杆菌属(Flavobacterium),土壤杆菌属,产碱杆菌属(Alcaligenes),欧文氏菌属(Erwinia),大肠杆菌或枯草杆菌。甚至更优选地,该细胞为副球菌。优选地,亲代细菌为R-1506或R1512,突变细菌为R1534或R114,优选为R114。
在优化生产类异戊二烯的条件下,在培养基中培养细菌。培养基的选择和培养条件是本领域公知的。实施例1,11和12中所示分析试验提供测定培养基中某种类胡萝卜素的存在的示范性试验方法。通过优化培养条件以及测定靶类异戊二烯的产量,可以实现符合本文所述特定产量参数的突变株的培养和筛选。以这种方法,可以筛选出类异戊二烯生产水平比亲代细菌高约1.1-1000倍的突变细菌。优选地,该突变细菌生产的类异戊二烯比亲代细菌高约1.5-500倍,例如,比亲代细菌高至少约100倍或至少约10倍。然后培养该细菌,用于后续的步骤。
筛选出能够以期望的水平生产类异戊二烯的突变细菌后,使用前述的或实施例中所述的任一方法将表达载体导入该细菌。本文所定义的任一表达载体均可导入该突变细胞。优选地,该表达载体含有SEQ ID NO42。一旦将表达载体导入突变细菌后,筛选出类异戊二烯产量比未转化突变体高出至少约1.1倍,例如约5-20倍的稳定转化体。然后将该选出的转化体在适于类异戊二烯生成的条件下培养,接着从细胞或培养基中分离出类异戊二烯。
该方法的进一步步骤为向突变细菌中引入突变,该突变能够提高细菌的类异戊二烯化合物的产量。该突变可选自下述的至少一种失活聚羟基烷羧酸酯(polyhydroxyalkanoate)(PHA)途径,提高乙酰-CoA乙酰基转移酶的表达,提高FPP合成酶的表达,提高类胡萝卜素生物合成途径中酶的表达,提高转化异戊烯二磷酸(IPP)为二甲基丙烯二磷酸(dimethylallyldiphosphate)(DMAPP)的酶的表达。
失活聚羟基烷羧酸酯(polyhydroxyalkanoate)(PHA)途径可通过选择出不表达phaB(SEQ ID NO177的1258-1980位核苷酸)编码多肽的突变细菌而完成,或者使用SEQ ID NO177或其片段进行同源重组,通过破坏野生型phaB基因的表达而完成。
该方法中,提高乙酰-CoA乙酰基转移酶的表达可通过下述完成将含有SEQ ID NO175或SEQ ID NO177的1-1170位核苷酸所示多核苷酸序列的载体导入突变细菌,所述多核苷酸序列与表达调控序列可操作相连。该方法中,提高FPP合成酶的表达可通过下述完成将含有SEQ ID NO157的295-1158位核苷酸所示多核苷酸序列的载体导入突变细菌,所述多核苷酸序列与表达调控序列可操作相连。该方法中,提高类胡萝卜素基因的表达可通过下述完成将载体导入突变细菌,所述载体含有编码类胡萝卜素生物合成途径中一种或多种酶的多核苷酸序列,如选自下述的多核苷酸序列SEQ ID NO180,182和184,所述多核苷酸序列与表达调控序列可操作相连。
该方法中,优选类异戊二烯化合物为异戊烯二磷酸(IPP)。还优选该类异戊二烯化合物为类胡萝卜素,例如八氢番茄红素,番茄红素,β-胡萝卜素,玉米黄质,角黄素,虾青素,福寿草黄素(adonixanthin),隐黄素,海胆酮和福寿草红素(adonirubin)及其组合。
本发明的另一实施方案为副球菌属(Paracoccus)的微生物,该微生物具有下述特点(a)使用GeneCompar v2.0软件,缺口罚分(gap penalty)为0%条件下,利用同源性计算获得的相似度基质,与SEQ ID NO12的序列相似性大于97%;(b)在81.5℃,使用DNA:DNA杂交,与R-1512,R1534,R114或R-1506的相似性大于70%;(c)基因组DNA的G+C含量与R114,R-1512,R1534和R-1506的染色体组DNA的G+C含量相比,区别小于1%;以及(d)使用实施例2的AFLP方法,平均DNA指纹与菌株R-1512,R1534,R114和R-1506具有cluster约58%的相似性,附带条件为该微生物不属于副球菌种(MBIC3966)。
测定上述每一特征的方法在实施例2中充分描述,可以预期当使用这些方法时,很容易地检测出符合上述标准的微生物。优选本发明的微生物具有上述的每项特征(即a-d)。但是,a-d任一特征的组合也属于本发明的范围,只要该组合能够提供足够的信息可以确凿地从分类学角度描述与R114,R-1512,R1534和R-1506属于相同种的微生物,除副球菌种之外(MBIC3966)。
本发明的另一实施例是副球菌属的微生物,该微生物具有下述特征(a)含有至少约75%的细胞膜总脂肪酸的18:1w7c;(b)不能使用福寿草醇(adonitol),i-赤藓糖醇,龙胆二糖,β-甲基葡糖苷,D-山梨糖醇,木糖醇和奎尼酸作为碳源用于生长;和(c)使用L-天冬酰胺和L-天冬氨酸作为碳源用于生长,附带条件为该微生物不属于副球菌种(MBIC3966)。
实施例2也详细描述了测定每项这些特征的方法,可以预期当使用这些方法时,可以容易地检测出符合上述标准的微生物。优选本发明的微生物具有上述的每项特征(即a-c)。但是,a-c任一特征的组合也属于本发明的范围,只要该组合能够提供足够的信息可以确凿地从分类学角度描述与R114,R-1512,R1534和R-1506属于相同种的微生物,除副球菌种之外(MBIC3966)。
本发明的另一实施方案是副球菌属的微生物,该微生物具有下述特征(a)能够在40℃生长;(b)能够在含有8%NaCl的培养基中生长;(c)能够在pH9.1的培养基中生长;以及(d)黄色-橙色集落色素形成,附带条件为该微生物不属于副球菌种(MBIC3966)。
实施例2也详细描述了测定上述每项特征的方法,可以预期当使用这些方法时,可以容易地检测出符合上述标准的微生物。优选本发明的微生物具有上述的每项特征(即a-d)。但是,a-d任一特征的组合也属于本发明的范围,只要该组合能够提供足够的信息可以确凿地从分类学角度描述与R114,R-1512,R1534和R-1506属于相同种的微生物,除副球菌种之外(MBIC3966)。
本发明的微生物还可以使用上述11项特征的组合进行定义,只要该组合能够提供足够的信息可以确凿地从分类学角度描述与R114,R-1512,R1534和R-1506属于相同种的微生物,除副球菌种之外(MBIC3966)。
综上所述,本发明提供(1)含有选自下述氨基酸序列的分离多肽(a)SEQ ID NO43的1-340残基所示的氨基酸序列,特别是相应于SEQID NO43的68-97位的氨基酸序
查看更多专利详情