早鸽—汇聚行业精英
  • 联系客服
  • 帮助中心
  • 投诉举报
  • 关注微信
400-006-1351
您的问题早鸽都有答案
3000+专业顾问
搜索
咨询

用于提高表达的细菌前导序列制作方法

  • 专利详情
  • 全文pdf
  • 权力要求
  • 说明书
  • 法律状态
专利名称:用于提高表达的细菌前导序列的制作方法用于提高表达的细菌前导序列本申请是申请日为2008年1月30日、中国申请号为200880009677. 4、发明名称为“用于提高表达的细菌前导序列”的发明申请的分案申请。发明领域本发明在蛋白质生产领域内,具体针对靶向多肽用于生产正确加工的异源蛋白质的用途。发明背景超过150种重组生产的蛋白质和多肽已经获得美国食品和药品管理局(FDA)批准作为生物技术药物和疫苗使用,且另外的370种处于临床试验中。不像经由化学合成所生产的小分子治疗剂,蛋白质和多肽在活细胞中是最有效生成的。然而,当前在细菌中生产重组蛋白的方法通常生成不正确折叠的、聚集的或没有活性的蛋白质,而且许多类型的蛋白质要求使用已知方法低效率实现的次级修饰。用已知方法的一个主要问题在于由聚集的蛋白质构成的包含体在细胞质中的形成,这在过量的蛋白质积累于细胞中时发生。重组蛋白生产中的另一个问题是为所表达的蛋白质建立正确的二级和三级构象。一种障碍是细菌细胞质活跃地抵抗二硫键形成,二硫键形成通常是正确蛋白质折叠的基础(Derman等(199 kience 262:1744-7)。结果,许多重组蛋白(特别是那些具有真核起源的)在细菌中生产时是不正确折叠的,而且是没有活性的。已经开发了许多尝试以增加正确折叠的蛋白质在重组系统中的生成。例如,研究者变更了发酵条件(Schein (1989)Bio/Technology, 7 :1141-1149),改变了启动子强度,或者使用了过量表达的伴侣蛋白(Hockney (1994)TrendsBiotechnol. 12 :456-463),其能有助于防止包含体的形成。增加正确折叠的蛋白质的收获的一种替代方法是自胞内环境分泌蛋白质。具有信号序列的多肽的最常见分泌形式牵涉%(3系统。Sec系统负责具有N端信号多肽的蛋白质穿过细胞质膜的输出(参见 Agarraberes 和 Dice Q001)Biochim Biophys Acta. 1513 :1-24 ; Muller 等(2001)Prog Nucleic Acid Res Mol. Biol. 66 :107-157)。已经开发了多种策略来将蛋白质从细胞分泌入上清液中。例如美国专利 No. 5,348, 867 ;美国专利 No. 6,329,172 ;PCT 公开文本号 WO 96/17943 ;PCT 公开文本号 WO 02/40696 ;及美国申请公开文本2003/0013150。用于提高表达的其它策略涉及将蛋白质靶向至周质。一些调查聚焦于非Sec型分泌(参见例如PCT公开文本号WO 03/079007 ; 美国公开文本No. 2003/0180937 ;美国公开文本No. 2003/0064435 ;及PCT公开文本号WO 00/59537)。然而,大多数研究聚焦于用Sec型分泌系统分泌外源蛋白质。已经记载了许多在表达重组多肽或蛋白质中使用的分泌信号。参见例如美国专禾Ij No. 5,914,254 ;美国专利No. 4,963,495 ;欧洲专利No. 0 177 343 ;美国专利No. 5,082,783 ;PCT公开文本号WO 89/10971 ;美国专利No. 6,156,552 ;美国专利 No. 6,495,357 ;6,509,181 ;6,524,827 ;6,528,298 ;6,558,939 ;6,608,018 ;6,617,143 ;美国专利 No. 5,595,898 ;5,698,435 ;及 6,204,023 ;美国专利 No. 6,258,560 ;PCT 公开文本号 WO 01/21662, WO 02/068660 和美国申请公开文本 2003/0044906 ;美国专利 No. 5, 641, 671 ; 及欧洲专利No. EP 0,121,352。
依赖于信号序列将蛋白质靶向出细胞质的策略通常产生不正确加工的蛋白质。这对于氨基端分泌信号(诸如那些导致经由Sec系统进行的分泌的)是尤其正确的。经由这种系统所加工的蛋白质通常或是保留分泌信号的一部分(这需要通常不正确地受到切割的连接元件),或在末端处是截短的。
自上文所述技术显而易见的是,已经开发了许多策略来将蛋白质靶向至宿主细胞的周质。然而,已知的策略尚未导致正确加工的、有活性的重组蛋白(其可进行纯化以供治疗使用)的一致的高产率。先前策略的一个主要限制是具有差的分泌信号序列的蛋白质在不适当的细胞系统中的表达。
因此,本领域中仍需要能够分泌和正确地加工重组多肽的改善的大规模表达系统以生产正确加工形式的转基因蛋白质。
发明概述
本发明提供了用于在细胞表达系统中生产高水平的正确加工的感兴趣蛋白质或多肽的改善的组合物和方法。具体地,本发明提供了自细菌生物体衍生的分泌信号的新的氨基酸和核苷酸序列。在一个实施方案中,本发明的分泌信号包括具有如下序列的分离的多肽,所述序列是选自下组的荧光假单胞菌O^eudomonas fluorescens, P. fluorescens)分泌多肽或与其基本上同源蛋白质二硫键异构酶C(protein disulfide isomerase C, dsbC)、突变型憐酸结合蛋白(phosphate binding protein,pbp氺)、蛋白质二硫键异构酶 A (protein disulf ideisomerase A, dsbA)、CupA2、CupB2、CupC2、NikA、 Flgl、三十四肽重复家族蛋白(tetratricopeptide repeat family protein) (0RF5550)、 甲苯耐受蛋白(toluene tolerance protein) (Ttg2C)、和接纳甲基的趋化蛋白(methyl acceptingchemotaxis protein) (0RF8124)分泌多肽,以及其有生物学活性的变体、片段、 和衍生物。在另一个实施方案中,本发明的分泌信号包括具有如下序列的分离的多肽,所述序列是凝结芽孢杆菌(Bacillus COagulans)BCe分泌信号序列或与其基本上同源。编码本发明信号序列的核苷酸序列在载体和表达系统中是有用的,用于促进所表达的感兴趣蛋白质或多肽向革兰氏阴性细菌的周质或向胞外环境中的靶向。
包含所述分泌信号序列的DNA构建体在宿主细胞中是有用的,用于表达重组蛋白。感兴趣蛋白质的核苷酸序列可操作连接至本文所述分泌信号。细胞可在周质区室中表达所述蛋白质。在某些实施方案中,细胞还可穿过细胞外壁向胞外分泌所表达的重组蛋白。 宿主细胞包括真核细胞(包括酵母细胞、昆虫细胞、哺乳动物细胞、植物细胞等)和原核细胞(包括细菌细胞(诸如荧光假单胞菌、大肠杆菌)等)。可使用本发明的分泌多肽前导序列来表达任何感兴趣蛋白质,包括治疗用蛋白质、激素、生长因子、胞外受体或配体、蛋白酶、激酶、血液蛋白质、趋化因子、细胞因子、抗体等。
本申请涉及下述各项。
1. 一种分离的核酸分子,其包含选自下组的分泌多肽的分泌信号编码序列蛋白质二硫键异构酶C(dsbC)、突变型磷酸结合蛋白(pbp*)、蛋白质二硫键异构酶A(dsbA)、 Bee、CupA2、CupB2、CupC2、NikA、Flgl、三十四肽重复家族蛋白(0RF5550)、甲苯耐受蛋白(Ttg2C)、和接纳甲基的趋化蛋白(0RF8124)分泌多肽。
2.项1的核酸分子,其中所述核酸分子选自下组
a)包含SEQ ID NO :5、1、3、7、9、11、13、15、17、19、21、或23 的核苷酸序列的核酸分子;
b)包含与SEQ ID NO :5、3、7、9、11、13、15、17、21、或23的核苷酸序列具有至少 90%序列同一性的核苷酸序列的核酸分子,其中所述核苷酸序列编码分泌多肽;
c)编码包含 SEQ ID NO :6、2、4、8、10、12、14、16、18、20、22、或 24 的氨基酸序列的聚多肽的核酸分子;
d)包含编码与SEQ ID NO :6、4、8、10、12、14、16、18、22、或M的氨基酸序列具有至少90%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
e)包含编码与SEQ ID NO 20的氨基酸序列具有至少96%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
f)在严格条件下在SEQ ID NO :5、3、7、9、11、13、15、17、或21的核苷酸序列的基本上全长里杂交的核苷酸序列;和,
g)在严格条件下在基本上全长里与编码选自下组的氨基酸序列的核苷酸序列杂交的核苷酸序列SEQ ID NO :6、4、8、10、12、14、16、18、和 22。
3.项2的核酸分子,其中所述杂交条件包括约60°C至约70°C的温度。
4.项2或3的核酸分子,其中所述杂交条件包括约68°C的温度。
5.项1的核酸分子,其中所述核酸分子已经得到调节以反映选择用来表达所述核酸分子的宿主生物体的密码子偏爱。
6. 一种载体,其包含蛋白质二硫键异构酶C(dsbC)、突变型磷酸结合蛋白(pbp*)、 蛋白质二硫键异构酶A (dsbA)、Bee、CupA2、CupB2、CupC2、NikA、FlgI、三十四肽重复家族蛋白(0RF5550)、甲苯耐受蛋白(Ttg2C)、或接纳甲基的趋化蛋白(0RF8124)分泌多肽的分泌信号编码序列。
7.项6的载体,其中所述核酸分子选自下组
a)包含SEQ ID NO :5、1、3、7、9、11、13、15、17、19、21、或23 的核苷酸序列的核酸分子;
b)包含与SEQ ID NO :5、3、7、9、11、13、15、17、21、或23的核苷酸序列具有至少 90%序列同一性的核苷酸序列的核酸分子,其中所述核苷酸序列编码分泌多肽;
c)编码包含 SEQ ID NO :6、2、4、8、10、12、14、16、18、20、22、或 24 的氨基酸序列的聚多肽的核酸分子;
d)包含编码与SEQ ID NO :6、4、8、10、12、14、16、18、22、或M的氨基酸序列具有至少90%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
e)包含编码与SEQ ID NO 20的氨基酸序列具有至少96%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
f)在严格条件下在SEQ ID NO :5、3、7、9、11、13、15、17、或21的核苷酸序列的基本上全长里杂交的核苷酸序列;和,
g)在严格条件下在基本上全长里与编码选自下组的氨基酸序列的核苷酸序列杂交的核苷酸序列SEQ ID NO :6、4、8、10、12、14、16、18、和 22。
8.项7的载体,其中所述杂交条件包括约60°C至约70°C的温度。
9.项7或8的载体,其中所述杂交条件包括约68 °C的温度。
10.项6的载体,其中所述核酸分子已经得到调节以反映选择用来表达所述核酸分子的宿主生物体的密码子偏爱。
11.项6的载体,其中所述分泌信号编码序列是可操作连接至编码感兴趣蛋白质或多肽的序列的。
12.项11的载体,其中所述感兴趣蛋白质或多肽对于表达所述感兴趣蛋白质或多肽的宿主生物体而言是天然的。
13.项6的载体,其中所述感兴趣蛋白质或多肽对于荧光假单胞菌而言是天然的。
14.项11的载体,其中所述感兴趣蛋白质或多肽衍生自对于表达所述感兴趣蛋白质或多肽的宿主生物体而言不是天然的蛋白质或多肽。
15.项11的载体,其中所述感兴趣蛋白质或多肽来自不是假单胞菌的生物体。
16.项6的载体,其中所述感兴趣蛋白质或多肽衍生自真核生物体。
17.项16的载体,其中所述感兴趣蛋白质或多肽衍生自哺乳动物生物体。
18.项6的载体,其进一步包含所述信号多肽序列与所述感兴趣蛋白质或多肽序列之间的连接序列。
19.项18的载体,其中所述连接序列可被信号肽酶切割。
20.项6的载体,其中所述感兴趣蛋白质或多肽序列是可操作连接至第二信号序列的。
21.项20的载体,其中所述第二信号序列包含靶向至外膜分泌信号的序列。
22.项6的载体,其中所述载体进一步包含启动子。
23.项22的载体,其中所述启动子对于细菌宿主细胞是天然的。
24.项22的载体,其中所述启动子对于细菌宿主细胞不是天然的。
25.项23的载体,其中所述启动子对于大肠杆菌是天然的。
26.项22的载体,其中所述启动子是诱导型启动子。
27.项22的载体,其中所述启动子是Iac启动子或Iac启动子衍生物。
28. 一种重组细胞,其包含选自下组的分泌多肽的分泌信号编码序列蛋白质二硫键异构酶C(dsbC)、突变型磷酸结合蛋白(pbp*)、蛋白质二硫键异构酶A(dsbA)、 Bee、CupA2、CupB2、CupC2、NikA, Flgl、三十四肽重复家族蛋白(0RF5550)、甲苯耐受蛋白 (Ttg2C)、和接纳甲基的趋化蛋白(0RF8124)分泌多肽。
29.项28的重组细胞,其中所述编码序列选自下组
a)包含SEQ ID NO :5、1、3、7、9、11、13、15、17、19、21、或23 的核苷酸序列的核酸分子;
b)包含与SEQ ID NO :5、3、7、9、11、13、15、17、21、或23的核苷酸序列具有至少 90%序列同一性的核苷酸序列的核酸分子,其中所述核苷酸序列编码分泌多肽;
c)编码包含 SEQ ID NO :6、2、4、8、10、12、14、16、18、20、22、或 24 的氨基酸序列的聚多肽的核酸分子;
d)包含编码与SEQ ID NO :6、4、8、10、12、14、16、18、22、或M的氨基酸序列具有至少90%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
e)包含编码与SEQ ID NO 20的氨基酸序列具有至少96%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
f)在严格条件下在SEQ ID NO :5、3、7、9、11、13、15、17、或21的核苷酸序列的基本上全长里杂交的核苷酸序列;和,
g)在严格条件下在基本上全长里与编码选自下组的氨基酸序列的核苷酸序列杂交的核苷酸序列SEQ ID NO :6、4、8、10、12、14、16、18、和 22。
30.项28的细胞,其中所述分泌信号编码序列是在表达载体中的。
31.项观的细胞,其中所述分泌信号编码序列是可操作连接至编码感兴趣蛋白质或多肽的序列的。
32.项31的细胞,其中所述细胞表达可操作连接至所述分泌信号多肽的所述感兴趣蛋白质或多肽。
33.项32的细胞,其中所述蛋白质或多肽在所述细胞的周质区室中表达。
34.项32的细胞,其中所述细胞中的酶自所述感兴趣蛋白质或多肽切割所述分泌信号多肽。
35.项观的细胞,其中所述细胞衍生自细菌宿主。
36.项35的细胞,其中所述宿主是假单胞菌。
37.项36的细胞,其中所述宿主是荧光假单胞菌。
38.项35的细胞,其中所述宿主是大肠杆菌。
39. 一种分离的多肽,其包含选自下组的分泌多肽蛋白质二硫键异构酶 C(dsbC)、突变型磷酸结合蛋白(pbp*)、蛋白质二硫键异构酶A(dsbA)、Bee, CupA2、CupB2、 CupC2、NikA、FlgI、三十四肽重复家族蛋白(0RF5550)、甲苯耐受蛋白(Ttg2C)、和接纳甲基的趋化蛋白(0RF8124)分泌多肽。
40.项39的分离的多肽,其中所述多肽选自下组
a)包含SEQ ID NO :6、2、4、8、10、12、14、16、18、20、22、或24 的氨基酸序列的多肽;
b)由 SEQ ID NO :5、1、3、7、9、11、13、15、17、19、21、或 23 的核苷酸序列编码的多肽;
c)包含与SEQ ID NO :6、4、8、10、12、14、16、18、22、或M的氨基酸序列具有至少90%序列同一性的氨基酸序列的多肽,其中所述多肽是分泌信号多肽;
d)包含与SEQ ID NO 20的氨基酸序列具有至少96%序列同一性的氨基酸序列的多肽,其中所述多肽是分泌信号多肽;
e)由与 SEQ ID NO :5、3、7、9、11、13、15、17、21、或 23 的核苷酸序列至少 90%相同的核苷酸序列编码的多肽,其中所述多肽是分泌信号多肽;和,
f)由在严格条件下在SEQ ID NO :5、3、7、9、11、13、15、17、或21的核苷酸序列的基本上全长里杂交的核苷酸序列所编码的多肽。
41.项40的多肽,其中所述杂交条件包括约60°C至约70°C的温度。
42.项39的多肽,其中所述杂交条件包括约68°C的温度。
43.项39的多肽,其中所述分泌信号多肽是可操作连接至感兴趣蛋白质或多肽的。
44.项43的多肽,其中所述感兴趣蛋白质或多肽衍生自不是荧光假单胞菌生物体的生物体。
45.用于表达感兴趣蛋白质或多肽的表达系统,其包含
a)宿主细胞;禾口
b)载体,其包含编码可操作连接至选自下组的分泌信号多肽的所述感兴趣蛋白质或多肽的核酸分子蛋白质二硫键异构酶C(dsbC)、突变型磷酸结合蛋白(pbp*)、蛋白质二硫键异构酶A(dsbA)、Bee、CupA2、CupB2、CupC2、NikA, Flgl、三十四肽重复家族蛋白 (0RF5550)、甲苯耐受蛋白(Ttg2C)、和接纳甲基的趋化蛋白(0RF8124)分泌多肽。
46.项45的表达系统,其中所述分泌信号多肽由选自下组的核酸分子编码
a)包含SEQ ID NO :5、1、3、7、9、11、13、15、17、19、21、或23 的核苷酸序列的核酸分子;
b)包含与SEQ ID NO :5、3、7、9、11、13、15、17、21、或23的核苷酸序列具有至少 90%序列同一性的核苷酸序列的核酸分子,其中所述核苷酸序列编码分泌多肽;
c)编码包含 SEQ ID NO :6、2、4、8、10、12、14、16、18、20、22、或 24 的氨基酸序列的聚多肽的核酸分子;
d)包含编码与SEQ ID NO :6、4、8、10、12、14、16、18、22、或M的氨基酸序列具有至少90%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
e)包含编码与SEQ ID NO 20的氨基酸序列具有至少96%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
f)在严格条件下在SEQ ID NO :5、3、7、9、11、13、15、17、或21的核苷酸序列的基本上全长里杂交的核苷酸序列;和,
g)在严格条件下在基本上全长里与编码选自下组的氨基酸序列的核苷酸序列杂交的核苷酸序列SEQ ID NO :6、4、8、10、12、14、16、18、和 22。
47.项46的表达系统,其中所述杂交条件包括约60°C至约70°C的温度。
48.项46的表达系统,其中所述杂交条件包括约68°C的温度。
49.项45的表达系统,其中所述宿主细胞表达可操作连接至所述分泌信号多肽的所述感兴趣蛋白质或多肽。
50.项49的表达系统,其中所述感兴趣蛋白质或多肽在所述细胞的周质区室中表达。
51.项49的表达系统,其中所述细胞中的酶自所述感兴趣蛋白质或多肽切割所述信号多肽。
52.项45的表达系统,其中所述细胞衍生自细菌宿主。
53.项45的表达系统,其中所述宿主是假单胞菌。
54.项53的表达系统,其中所述宿主是荧光假单胞菌。
55.项52的表达系统,其中所述宿主是大肠杆菌。
56.项45的表达系统,其进一步包括发酵培养基。
57.项56的表达系统,其中所述发酵培养基包含化学诱导物。
58.用于在宿主细胞中表达重组蛋白的方法,包括提供包含如下载体的宿主细胞,所述载体编码可操作连接至选自下组的分泌信号多肽的感兴趣蛋白质或多肽蛋白质二硫键异构酶C(dsbC)、突变型磷酸结合蛋白(pbp*)、蛋白质二硫键异构酶A(dsbA)、 Bee、CupA2、CupB2、CupC2、NikA, FlgI、三十四肽重复家族蛋白(0RF5550)、甲苯耐受蛋白 (Ttg2C)、和接纳甲基的趋化蛋白(0RF8124)分泌多肽。
59.项58的方法,其中所述分泌信号多肽由选自下组的核酸分子编码
a)包含SEQ ID NO :5、1、3、7、9、11、13、15、17、19、21、或23 的核苷酸序列的核酸分子;
b)包含与SEQ ID NO :5、3、7、9、11、13、15、17、21、或23的核苷酸序列具有至少 90%序列同一性的核苷酸序列的核酸分子,其中所述核苷酸序列编码分泌多肽;
c)编码包含 SEQ ID NO :6、2、4、8、10、12、14、16、18、20、22、或 24 的氨基酸序列的聚多肽的核酸分子;
d)包含编码与SEQ ID NO :6、4、8、10、12、14、16、18、22、或M的氨基酸序列具有至少90%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
e)包含编码与SEQ ID NO :20的氨基酸序列具有至少96%氨基酸序列同一性的聚多肽的核苷酸序列的核酸分子,其中所述聚多肽是分泌多肽;
f)在严格条件下在SEQ ID NO :5、3、7、9、11、13、15、17、或21的核苷酸序列的基本上全长里杂交的核苷酸序列;和,
g)在严格条件下在基本上全长里与编码选自下组的氨基酸序列的核苷酸序列杂交的核苷酸序列SEQ ID NO :6、4、8、10、12、14、16、18、和 22。
60.项59的方法,其中所述杂交条件包括约60°C至约70°C的温度。
61.项59的方法,其中所述杂交条件包括约68°C的温度。
62.项58的方法,其中所述细胞在矿物盐培养基中培养。
63.项58的方法,其中所述细胞以高细胞密度培养。
64.项63的方法,其中所述细胞以至少20g/L的细胞密度培养。
65.项58的方法,其进一步包括纯化所述重组蛋白。
66.项65的方法,其中通过亲和层析来纯化所述重组蛋白。
67.项58的方法,其中所述感兴趣蛋白质或多肽和所述分泌信号多肽的所述可操作连接可被对于所述宿主细胞而言天然的酶切割。
68.项67的方法,其中所述分泌信号多肽是在表达期间中自所述感兴趣蛋白质或多肽切割的。
69.项58的方法,其中所述感兴趣蛋白质或多肽对于衍生所述宿主细胞的生物体而言是天然的。
70.项58的方法,其中所述感兴趣蛋白质或多肽对于荧光假单胞菌生物体而言是天然的。
71.项58的方法,其中所述感兴趣蛋白质或多肽对于衍生所述宿主细胞的生物体而言不是天然的。
72.项58的方法,其中所述感兴趣蛋白质或多肽衍生自不是假单胞菌的生物体。
73.项58的方法,其中所述感兴趣蛋白质或多肽衍生自真核生物体。
74.项58的方法,其中所述重组蛋白包含包括至少两个半胱氨酸残基的序列。
75.项58的方法,其中在所述细胞中的所述重组蛋白中形成至少一个二硫键。
76.项58的方法,进一步包括所述信号多肽序列和所述感兴趣蛋白质或多肽的序列之间的连接序列。
77.项69的方法,其中至少50%的所述感兴趣蛋白质或多肽包含天然氨基末端。
78.项77的方法,其中至少80%的所述感兴趣蛋白质或多肽包含天然氨基末端。
79.项78的方法,其中至少90%的所述感兴趣蛋白质或多肽包含天然氨基末端。
80.项58的方法,其中至少50%的所述重组蛋白是有活性的。
81.项80的方法,其中至少80%的所述重组蛋白是有活性的。
82.项58的方法,其中至少50%的所述重组蛋白在周质区室中表达。
83.项82的方法,其中至少75%的所述重组蛋白在周质区室中表达。
84.项83的方法,其中至少90%的所述重组蛋白在周质区室中表达。
85.项58的方法,其中所述宿主细胞是假单胞菌细胞。
86.项85的方法,其中所述细胞是荧光假单胞菌细胞。
87.项58的方法,其中所述细胞是大肠杆菌细胞。
附图简述


图1描绘了 dsbC SS-skp融合蛋白的表达构建体。
图2显示了约17kDa的Skp蛋白的表达(箭头)。标记2和3的条带与Skp蛋白一致。条带1表现出具有DNA结合蛋白(3691)和Skp两者。
图3A和;3B是dsbC SS_skp在荧光假单胞菌中表达后在0和M小时后在标记 2B-2(图3A)和2B-4(图的样品的可溶性⑶和不溶性⑴级分中的分析。在图3A 中,条带5、7和9是不溶性级分中的未加工dsbC-skp蛋白。条带6、8、和10是不溶性级分中的经加工dsbC-skp。条带1和3是可溶性级分中的经加工dsbC-skp。条带2和4是未知蛋白质。在图3B中,条带15、17、和19是不溶性级分中的未加工dsbC-skp蛋白。条带 16、18、和20是不溶性级分中的经加工dsbC-skp。条带11和13是可溶性级分中的经加工 dsbC-skp。条带12和14是未知蛋白质。
图4显示了表达DC694(dsbA-PA83)后蛋白质积累的Western分析。通过Western 分析评估0和M小时时可溶性(S)、不溶性(I)、和无细胞培养基(B)的积累。
图5显示了表达EP468-002. 2(dsbA)后蛋白质积累的Western分析。通过Western 分析评估诱导后0和M小时时可溶性( 和不溶性(I)蛋白质的积累。
图6展示了与pINS-008-5 (野生型pbp)分泌信号相比pINS-008_3 (pbp*)突变体的碱性磷酸酶活性。将细胞培养物调至1个OD6tltl单位,然后通过添加4-甲基伞形酮(MUP) 并在10分钟时测量荧光产物形成来测量WioA活性。阴性对照含有MUP,但没有细胞。
图7显示了表达pINS-008-3(pbp*)和pINS0008_5 (野生型pbp)后蛋白质积累的 Wfestern分析。通过^festern分析评估胰岛素原-phoA在可溶性(Sol)、不溶性(Insol)JP 胞外级分(Bro)中在10、116、和140小时时的积累。将培养物的等分试样调至20个0D_ 单位,通过SDS-PAGE分开,转移至滤纸,并用针对胰岛素的抗体(鸡多克隆,Abcam产品目录编号abl4042)显现。
图 8 显示了 EP484-003 和 EP484-004 级分的 SDS-PAGE 分析。显示了 SDS-PAGE 分析的代表性结果。在中央处显示了分子量标志物(L)。标示了 BSA标准品(BSA Stds.)。 箭头指示了所诱导的条带。每道下方的是级分类型可溶性(Sol)、不溶性(Ins)、或无细胞培养基(CFB)。每道上方的是诱导时(IO)或诱导后M小时时(124)的样品时间。在样品的每个分组下方显示了菌株号。EP484-004的IM可溶性级分中大的蛋白质条带对应于由 Bce前导序列促进的增强的基因表达。
图9展示了 Gal2 scFv表达的SDS-PAGE和Western分析。分析可溶性(S)和不溶性(I)级分。在每对泳道上方标示与融合的分泌前导。在每个SDS-PAGE凝胶(顶部)或Western印迹(底部)的左侧描绘分子量标志物。箭头标示(ial2的迁移。
图10表示硫氧还蛋白(TrxA)表达的SDS-PAGE分析。分析可溶性级分。在每对泳道上方标示与TrxA融合的分泌前导。在SDS-PAGE凝胶的左侧描绘分子量标志物。箭头标示未加工的(上方的箭头)和经加工的(下方的箭头)TrxA的迁移。
发明详述
I.综述
提供了用于在宿主细胞中生产高水平的正确加工的多肽的组合物和方法。具体地,提供了新的分泌信号,其促进可操作连接的感兴趣多肽向革兰氏阴性细菌的周质或向胞外环境中的靶向。出于本发明的目的,“分泌信号”、“分泌信号多肽”、“信号肽”或“前导序列”意指对于将可操作连接的感兴趣蛋白质或多肽靶向至革兰氏阴性细菌的周质或靶向入胞外空间中有用的肽序列(或编码所述肽序列的多核苷酸)。本发明的分泌信号序列包括选自下组的分泌多Jft :pbp*、dsbA、dsbC、Bce、CupA2、CupB2、CupC2、NikA、FlgI、0RF5550、 Ttg2C、和 0RF8124 分泌信号,及其片段和变体。在 SEQ IDNO :2、4、6、8、10、12、14、16、18、20、 22、和M中列出分泌信号的氨基酸序列。在SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、 和23中分别提供了相应的核苷酸序列。本发明包含这些序列以及其片段和变体。
本发明的方法提供了在通常生成不正确折叠的、聚集的或没有活性的蛋白质的细菌中生产重组蛋白的当前方法的改良。另外,许多类型的蛋白质要求次级修饰,其使用已知方法仅低效率地实现。本文中的方法通过自胞内环境分泌蛋白质来增加正确折叠的蛋白质的收获。在革兰氏阴性细菌中,自细胞质分泌的蛋白质可终止于周质间隙中,附着至外膜,或者在胞外培养基中。该方法还避免由聚集的蛋白质构成的包含体。向周质间隙中的分泌还具有公知的效果,即促进正确的二硫键形成(Bardwell等(1994)Phosphate Microorg. 270-5 ;Manoil (2000)Methods in Enzymo 1. 326 :35-47)。重组蛋白分泌的其它益处包括更有效的蛋白质分离;转基因蛋白质的正确折叠和二硫键形成,导致处于活性形式的蛋白质的百分比增加;包含体的形成减少和对宿主细胞的毒性降低;和处于可溶形式的重组蛋白的百分比增加。将感兴趣蛋白质分泌入培养物培养基中的潜力还可潜在地促进用于蛋白质生产的连续培养而非分批培养。
革兰氏阴性细菌已经发展出用于蛋白质穿过其双膜的主动输出的许多系统。这些分泌路径包括例如:ABC(I型)途径、Path/Fla(III型)途径、和Path/Vir(IV型)途径, 用于穿过质膜和外膜两者的1步转位;Sec (II型)、Tat、MscL和Holins途径,用于穿过质膜的转位;和Sec-加上-菌毛引座孔蛋白(fimbrial usher porin,FUP)、Sec-加上-自运输物(autotransporter, AT)、Sec-力口上-双配偶分泌(two partner secretion, TPS)、 Sec-加上-主端分枝(mainterminal branch,MTB)、和Tat-加上-MTB途径,用于穿过质膜和外膜的2步转位。不是所有细菌都具有所有这些分泌途径。
三种蛋白质系统(类型I、III和IV)在单一能量偶联步骤中分泌蛋白质穿过两膜。四种系统GecJatJscL和Holins)仅分泌穿过内膜,而其它四种系统(MTB、FUP、AT 和TPQ仅分泌穿过外膜。
在一个实施方案中,本发明的信号序列利用Sec分泌系统。Sec系统负责具有 N端信号多肽的蛋白质穿过细胞质膜的输出(参见Agarraberes和Dice (2001)Biochim Biophys Acta. 1513 1-24 ;Muller φ (2001)Prog Nucleic AcidRes Mol.Biol. 66 107-157)。在原核生物和真核生物中普遍地找到Sec家族的蛋白质复合物。细菌Sec系统由运输蛋白、伴侣蛋白(SecB)或信号识别颗粒(SRP)和信号肽酶(SP酶I和SP酶II)组成。大肠杆菌中的Sec运输复合物由三种整合内膜蛋白(SecYJecE和义⑷)和细胞质ATP组成。复合物以形成有活性的转位通道。伴侣蛋白义沙结合初生的多肽链以阻止其折叠,并将其靶向至%(^。随后线性多肽链被运输穿akcYEG通道,并且在切割信号多肽后,该蛋白质在周质中折叠。三种辅助蛋白(SecD、kcF*^jC) 形成一种复合物,其对于分泌不是必需的,但是在许多条件(特别在低温时)下刺激分泌, 高至10倍。
运输入周质中(即经由II型分泌系统)的蛋白质还可在进一步的步骤中输出入胞外培养基中。其机制一般是经由自运输物、双配偶分泌系统、主端分枝系统或菌毛引座孔蛋白。
革兰氏阴性细菌中的12种已知分泌系统中,已知8种利用作为所表达的蛋白质的一部分找到的靶向信号多肽。这些信号多肽与分泌系统的蛋白质相互作用,使得细胞正确地将蛋白质送往其合适的目的地。这8种基于信号多肽的分泌系统中的5种是那些牵涉 Sec系统的。这5种被说成是牵涉Sec依赖性细胞质膜转位,并且它们在那里起作用的信号多肽可称为Sec依赖性分泌信号。开发合适的分泌信号中的难题之一是确保信号得到合适的表达,并自所表达的蛋白质切除。
用于sec途径的信号多肽一般由下列三种域组成(i)带正电荷的η区,(ii)疏水性的h区,和(iii)不带电荷的但极性的c区。信号肽酶的切割位点位于c区中。然而,信号序列的程度保守和长度以及切割位点位置在不同蛋白质间可有所不同。
Sec依赖性蛋白质输出的特征(signature)是在所输出的蛋白质中存在短的(约 30个氨基酸)、主要疏水的氨基端信号序列。信号序列有助于蛋白质输出,并在所输出的蛋白质到达周质时被周质信号肽酶切去。典型的N端Sec信号多肽含有具有至少一个精氨酸或赖氨酸残基的N域,接着是含有一段疏水残基的域,和含有信号肽酶的切割位点的C域。
已经开发了细菌蛋白质生产系统,其中转基因蛋白质构建体被改造为含有感兴趣蛋白质和分泌信号两者的融合蛋白,试图将蛋白质靶向出细胞质。
荧光假单胞菌已经证明是用于生产多种蛋白质的改良平台,并且已经自此生物体鉴定出数种有效的分泌信号(参见美国申请公开文本号20060008877,通过提及而完整收入本文)。荧光假单胞菌以比通常在其它细菌表达系统中所看到的水平要高的水平生成正确加工形式的外源蛋白质,并以较高的水平将这些蛋白质运输至细胞周质,导致完全加工的重组蛋白的回收增加。因此,在一个实施方案中,本发明提供了用于通过表达与分泌信号连接的靶蛋白来在荧光假单胞菌细胞中生产外源蛋白质的方法。
本发明的分泌信号序列在假单胞菌中是有用的。与其它细菌表达系统相比,假单胞菌系统为多肽和酶的商业表达提供优势。具体地,荧光假单胞菌已经鉴定为有利的表达系统。荧光假单胞菌涵盖一组常见的、非病原性腐生生物,其拓殖土壤、水和植物表面环境。自荧光假单胞菌衍生的商品化酶已经用于降低环境污染,用作去污添加剂,及用于立体选择性水解。荧光假单胞菌还在农业上用于控制病原体。美国专利号4,695,462记载了重组细菌蛋白在荧光假单胞菌中的表达。在1985年和2004年之间,许多公司利用荧光假单胞菌的农业用途来生产杀虫的(pesticidal)、杀昆虫的(insecticidal)、和杀线虫的毒素,以及利用特定毒性序列和遗传操作来增强这些的表达。参见例如PCT公开文本号WO 03/068926 和 WO 03/068948 ;PCT 公开文本号 W003/089455 ;PCT 申请号 WO 04/005221 ;及美国专利公开文本号20060008877。
II.组合物
A.分离的多肽
在本发明的一个实施方案中,提供了分离的多肽,其中所述分离的多肽是对将可操作连接的感兴趣蛋白质或多肽靶向至革兰氏阴性细菌的周质或靶向入胞外空间中有用的新的分泌信号。在一个实施方案中,所述多肽具有如下氨基酸序列,其是Pbp*、dsbA、 dsbC、Bee、CupA2、CupB2、CupC2、NikA、Flgl、0RF5550、Ttg2C、或 0RF8124 分泌信号、或其片段或变体,或与其基本上同源。在另一个实施方案中,此分离的多肽是分泌信号和感兴趣蛋白质或多肽的融合蛋白。
在另一个实施方案中,多肽序列是SEQ ID NO :6、2、4、8、10、12、14、16、18、20、22、 或24中所列的分泌信号多肽、或者由SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、或23中所列的多核苷酸序列所编码的分泌信号多肽,或与其基本上同源。在另一个实施方案中, 所述多肽序列包含SEQID NO 2的至少第2位-第M位氨基酸、SEQ ID NO 4的至少第2 位-第22位氨基酸、SEQ ID NO 6的至少第2位-第21位氨基酸、SEQ ID NO 8的至少第 2位-第33位氨基酸、SEQ ID NO 10的至少第2位-第25位氨基酸、SEQ ID NO 12的至少第2位-第M位氨基酸、SEQ ID NO: 14的至少第2位-第23位氨基酸、SEQID NO 16的至少第2位-第21位氨基酸、SEQ ID NO 18的至少第2位-第21位氨基酸、SEQ ID NO 20的至少第2位-第21位氨基酸、SEQ ID NO 22的至少第2位-第33位氨基酸、或SEQ ID NO: M的至少第2位-第39位氨基酸。在又一个实施方案中,所述多肽序列包含SEQ ID NO :6、2、4、8、10、12、14、16、18、20、22、或24的片段,其自氨基端截短1个、2个、3个、4个、5 个、6个、7个、8个、9个、或10个氨基酸,但保留生物学活性,即分泌信号活性。
在一个实施方案中,同源多肽的氨基酸序列是给定最初多肽的变体,其中变体序列可通过用其它氨基酸残基替换最初多肽的高至或约30%的氨基酸残基来获得,包括高至约 1%,2%,3%,4%,5%,6%,7%,8%,9% ,10% ,11% >12% ,13% ,14% ,15% ,16%, 17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、或 30%,前提是变体保留最初多肽的想要的功能。基本上同源的变体氨基酸会是与给定多肽至少约 70%、至少约75%、至少约80%、约85%、约90%、约95%、约96%、约97%、约98%、或至少约99%同源的。变体氨基酸可以以多种方式获得,包括SEQ IDNO :6、2、4、8、10、12、14、16、18、20、22、或M的一个或多个氨基酸的氨基酸替代、删除、截短和插入,包括多至约1处、约 2处、约3处、约4处、约5处、约6处、约7处、约8处、约9处、约10处、约15处、约20处、 约25处、或更多处氨基酸替代、删除或插入。
通过“基本上同源的”或“基本上类似的”意指使用本文中所描述的比对程序之一使用标准参数与参照序列相比具有至少约60%或65%序列同一性、约70%或75%序列同一性、约80%或85%序列同一性、约90%、约91%、约92%、约93%、约94%、约95%、约 96%、约97%、约98%或约99%或更大序列同一性的氨基酸或核苷酸序列。本领域技术人员会认识到,通过考虑密码子简并性、氨基酸相似性、阅读框定位等,可适当地调整这些数值以确定由两种核苷酸序列所编码的蛋白质的相应同一性。
例如,优选的是,可在一个或多个预测的、优选非必需的氨基酸残基处进行保守的氨基酸替代。“非必需的”氨基酸残基是可自分泌信号多肽的野生型序列改变而不改变生物学活性的残基,而“必需的”氨基酸残基是生物学活性所需要的。“保守氨基酸替代”是其中氨基酸残基用具有类似侧链的氨基酸残基替换的。表1中列出了保守和半保守氨基酸残基的家族。
表1:类似氨基酸替代组保守组(8)半保守组(7)Arg, LysArg, Lys, HisAsp,GlnAsn, Asp, Gly, GlnAsn,Glulie, Leu, Vallie, Leu, Val, Met, PheAla, GlyAla, Gly, Pro, Ser, ThrSer, ThrSer, Thr, TyrPhe, TyrPhe, Trp, TyrCys (非半胱氨酸),SerCys (非半胱氨酸),Ser, Thr
本发明所涵盖的变异型蛋白质是有生物学活性的,即它们继续拥有天然蛋白质的想要的生物学活性,即保留分泌信号活性。通过“保留活性”意指变体会具有天然蛋白质的至少约30 %、至少约50 %、至少约70 %、至少约80 %、约90 %、约95 %、约100 %、约110 %、 约125%、约150%、至少约200%或更大分泌信号活性。
B.分离的多核苷酸
本发明还包括具有如下序列的分离的核酸,所述序列编码对于将可操作连接的感兴趣蛋白质或多肽靶向至革兰氏阴性细菌的周质或靶向入胞外空间中有用的新的分泌信号。在一个实施方案中,所述分离的多核苷酸编码与pbp*、dsbA、dsbC、Bee, CupA2、CupB2、 CupC2、NikA, Flgl、0RF5550、Ttg2C、或0RF81M分泌信号多肽基本上同源的多肽序列。在另一个实施方案中,本发明提供了如下核酸,其编码与SEQ ID NO :2的至少第2位-第M 位氨基酸、SEQ ID NO 4的至少第2位-第22位氨基酸、SEQ ID NO 6的至少第2位-第21位氨基酸、SEQ ID NO :8的至少第2位-第33位氨基酸、SEQ ID N0:10的至少第2 位-第25位氨基酸、SEQ ID NO 12的至少第2位-第M位氨基酸、SEQID NO 14的至少第2位-第23位氨基酸、SEQ ID NO 16的至少第2位-第21位氨基酸、SEQ ID NO 18的至少第2位-第21位氨基酸、SEQ ID NO 20的至少第2位-第21位氨基酸、SEQ ID NO 22的至少第2位-第33位氨基酸、或SEQ IDNO 24的至少第2位-第39位氨基酸基本上同源的多肽序列,或者提供了与SEQ ID NO :1、3、5、7、9、11、13、15、17、19、20、21、或23基本上同源的核酸,包括其生物学活性变体和片段。在另一个实施方案中,所述核酸序列与SEQ ID NO :1、3、5、7、9、11、13、15、17、19、20、21、或 23 的序列至少约 60%、至少约 65%、至少约 70%、约 75%、约 80%、约 85%、约 90%、约 95%、约 96%、约 97%、约 98%、或至少约 99% 相同。在另一个实施方案中,所述核酸编码如下多肽,其与SEQ ID N0:6、2、4、8、10、12、14、 16、18、20、22、或M的氨基酸序列至少约70 %、至少约75 %、至少约80 %、约85 %、约90 %、 约95%、约96%、约97%、约98%、或至少约99%相同。
本发明优选的分泌信号多肽由与SEQ ID NO 1或3的核苷酸序列基本上同源的核苷酸序列编码。使用诸如PCR、杂交等方法,可鉴定相应的分泌信号多肽序列,此类序列与本发明的序列基本上相同。参见例如Sambrook J.和Russell,D. W. (2001) Molecular Cloning :A Laboratory Manual. (Cold SpringHarbor Laboratory Press, Cold Spring Harbor, NY)及 Innis 等(1990)PCRProtocols :A Guide to Methods and Applications (Academic Press, NY)。变异型核苷酸序列还包括合成方式衍生的核苷酸序列,其已经例如通过使用定点诱变生成,但其仍编码本发明中所公开的分泌信号多肽,如下文所讨论的。本发明所涵盖的变异型分泌信号多肽是有生物学活性的,即它们继续拥有天然蛋白质的想要的生物学活性,即保留分泌信号活性。通过“保留活性”意指变体会具有至少约30%、至少约50%、至少70%、至少约80%、至少约85%、至少约90%、至少约95%、 约96%、约97%、约98%、至少约99%或更大的天然分泌信号多肽活性。用于测量分泌信号多肽活性的方法在本文中的别处有所讨论。
熟练技术人员会进一步理解的是,变化可通过突变而导入本发明的核苷酸序列中,由此导致所编码分泌信号多肽的氨基酸序列的变化,而不改变分泌信号多肽的生物学活性。如此,可如下创建变异型分离的核酸分子,即将一处或多处核苷酸替代、添加、或删除导入本文中所公开的相应核苷酸序列中,使得将一处或多处氨基酸替代、添加或删除导入所编码的蛋白质中。可通过标准技术(诸如定点诱变和PCR介导的诱变)来导入突变。本发明也涵盖此类变异型核苷酸序列。
C.核酸和氨基酸同源性
依照本领域中公知的多种方法之任一种来测定核酸和氨基酸序列同源性。有用的序列比对和同源性测定方法的例子包括那些下文所述的。
可使用美国国立生物技术信息中心(NCBI)程序MegaBLAST(目前可在http:// www. ncbi. nlm. nih. gov/BLAST/获得的)来实施类似序列的比对和搜索。以百分比同一性选项设置在例如氨基酸序列的70%或设置在例如核苷酸序列的90%使用此程序会鉴定出那些与查询序列具有70%或90%或更大序列同一性的序列。本领域中已知的其它软件也可用于比对和/或搜索类似的序列,例如与含有依照本发明的分泌信号序列的信息串至少 70 %或90 %相同的序列。例如,用于比较以鉴定与查询序列至少70 %或90 %相同的序列的序列比对可如下进行,即使用例如可在GCG序列分析软件包(可获自GeneticsComputer Group, University of Wisconsin Biotechnology Center,1710University Avenue, Madison, Wis. 53705)中获得的 GAP、BESTFIT、BLAST、FASTA、和 TFASTA 程序,其中缺省参数如在那里所指定的,加上设置在想要的百分比的序列同一性程度的参数。还有,例如可使用 CLUSTAL 程序(可在来自 htelligenetics,Mountain View, Cal.的 PC/Gene 软件包中获得的)。
这些和其它序列比对方法在本领域中是公知的,并且可通过手动比对、通过目视检查、或通过序列比对算法(诸如由上文所述程序所体现的那些中的任一种)的手动或自动应用来进行。多种有用的算法包括例如W. R. Pearson和D.J. Lipman,Proc. Natl. Acad. Sci. USA 85 :2444-48(1988 年 4 月)中所记载的相似性搜索方法;T. F. Smith 禾口 Μ. S. Waterman,于 Adv. Appl. Math. 2 :482-89 (1981)禾口于 J. Molec. Biol. 147 195-97 (1981)中所记载的局部同源性方法;S. B. Needleman 和 C. D. ffunsch, J. Molec. Biol. 48 (3) :443-53 (1970年3月)中所记载的同源性比对方法;和例如由W. R. Pearson, 于 Genomicsll (3) :635-50 (1991 年 11 月);由 W. R. Pearson,于 Methods Molec. Biol. 24 307-31 和 25 :365-89(1994);及由 D. G. Higgins 和 P. M. Sharp,于 Comp. Appl,ns in Biosci. 5 :151-53(1989)和于 Gene 73(1) :237-44(1988 年 12 月 15 日)所记载的多种方法。
除非另有说明,会使用GAP第10版(其使用Needleman和^msch (1970)见上文的算法)来测定序列同一性或相似性,其使用如下参数进行核苷酸序列的%同一性和% 相似性使用GAP权重(Weight) 50和长度权重(LengthWeight) 3,及nwsgapdna. cmp得分矩阵;氨基酸序列的%同一性或%相似性使用GAP权重8和长度权重2,及BL0SUM62得分程序。也可使用等同的程序。通过“等同的程序”意指与由GAP第10版所产生的相应比对相比时,对任何两种所讨论的序列产生具有相同核苷酸残基匹配和相同百分比序列同一性的比对的任何序列比较程序。在多个实施方案中,序列比较贯穿整个查询序列或目标序列或两者进行。
P.杂交条件
在本发明的另一方面,提供了与具有如下序列的分离的核酸杂交的核酸,所述序列编码具有与 pbp*、dsbA、dsbC、Bee、CupA2、CupB2、CupC2、NikA、Flgl、0RF5550、Ttg2C、或 0RF81M分泌信号多肽基本上类似的序列的多肽。在某些实施方案中,杂交的核酸会在高严格条件下结合。在多个实施方案中,杂交贯穿编码分泌信号多肽的核苷酸序列的基本上全长发生,例如,贯穿SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、或23中的一项或多项的基本上全长发生。若核酸分子在SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、或23中的一项或多项的全长的至少80%、全长的至少85%、至少90%、或至少95%里杂交,则该核酸分子与本文中所公开的编码分泌信号的核苷酸序列的“基本上全长”杂交。除非另有说明,“基本上全长”指编码分泌信号的核苷酸序列的全长的至少80%,其中长度以连续的核苷酸测量(例如杂交至SEQ ID NO 3的至少53个连续的核苷酸、SEQ IDNO 5的至少51个连续的核苷酸、SEQ ID NO 7的至少80个连续的核苷酸等)。
在一种杂交方法中,可使用整个或部分的编码分泌信号多肽的核苷酸序列来筛选 cDNA或基因组文库。用于构建此类cDNA和基因组文库的方法是本领域中普遍知道的,并披露于Sambrook和Russell,2001。所谓杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸,而且可以用可检测的基团(诸如32P)、或任何其它可检测的标志物(诸如其它放射性同位素、荧光化合物、酶、或酶辅因子)标记。可通过标记合成的寡核苷酸来制备供杂交用的探针,所述合成的寡核苷酸基于本文中所公开的已知的编码分泌信号多肽的核苷酸序列。另外还可使用基于核苷酸序列或所编码的氨基酸序列中的保守核苷酸或氨基酸残基而设计的简并引物。探针通常包含在严格条件下与本发明的编码分泌信号多肽的核苷酸序列或其片段或变体的至少约10个、至少约15个、至少约16个、17个、18个、19个、 20个、或更多个连续核苷酸杂交的核苷酸序列区域。用于制备供杂交用的探针的方法是本领域中普通知道的,并披露于Sambrook和Russel 1,2001,通过提及而收入本文。
在杂交技术中,整个或部分的已知核苷酸序列作为探针使用,所述探针与自选定生物体所克隆的基因组DNA片段或cDNA片段的群体(即基因组或cDNA文库)中所存在的其它相应核苷酸序列选择性杂交。杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸,而且可以用可检测的基团(诸如32P)、或任何其它可检测的标志物标记。如此,例如可通过标记合成的寡核苷酸来制备供杂交用的探针,所述合成的寡核苷酸基于本文中编码分泌信号多肽的核苷酸序列。用于制备供杂交用的探针和用于构建cDNA 和基因组文库的方法是本领域中普遍知道的,并且披露于Sambrook等(1989)Molecular Cloning :A Laboratory Manual (第 2 版,Cold Spring HarborLaboratory Press, Plainview, New York)。
例如,本文中所公开的整个编码分泌信号多肽的核苷酸序列或其一个或多个部分可作为如下探针使用,所述探针能够与编码分泌信号多肽的相应核苷酸序列和信使RNA特异性杂交。为了在多种条件下实现特异性杂交,此类探针包括独特的且优选长至少约10 个核苷酸或长至少约15个核苷酸的序列。此类探针可用于通过PCR来自选定生物体扩增相应的编码分泌信号多肽的核苷酸序列。此技术可用于自想要的生物体分离别的编码序列或用作诊断测定法以测定编码序列在生物体中的存在。杂交技术包括对铺板的DNA文库(或是噬菌斑或菌落)的杂交筛选;参见例如Sambrook等(1989)MolecularCloning A Laboratory Manual (第 2 版,Cold Spring Harbor Laboratory Press, Plainview, New York)。
此类序列的杂交可在严格条件下实施。通过“严格条件”或“严格杂交条件”意指探针会以比对其它序列大的可检测程度(例如超过背景的至少2倍)与其靶序列杂交的条件。严格条件是序列依赖性的,而且在不同情况中会是不同的。通过控制杂交和/或清洗条件的严格性,可鉴定出与探针100%互补的靶序列(同源探查)。或者,可调整严格条件以容许序列中的一些错配,使得检测出较低程度的相似性(异源探查)。一般而言,探针的长度小于约1000个核苷酸,优选长度小于500个核苷酸。
通常,严格条件会是那些如下的,其中盐浓度小于约1. 5M Na离子,通常约0. 01至 1. OM Na离子浓度(或其它盐类),于pH7. O至8. 3,且温度是至少约60°C,优选约68°C。还可通过添加去稳定剂(诸如甲酰胺)来实现严格条件。例示性的低严格条件包括用30至 35%甲酰胺、IM NaClU % SDS(十二烷基硫酸钠)的缓冲溶液于37°C进行的杂交,和在IX 至2X SSC (20X SSC = 3. OM NaCl/0. 3M柠檬酸三钠)中于50至55°C进行的清洗。例示性的中等严格条件包括在40至45%甲酰胺、1. OM NaClU% SDS中于37°C进行的杂交,和在0. 5X至IX SSC中于55至60°C进行的清洗。例示性的高严格条件包括在50%甲酰胺、IM NaCl、l% SDS中于37°C进行的杂交,和在0. IX SSC中于60至68°C进行的清洗。任选地, 清洗缓冲液可包含约0. 1 %至约1 % SDS0杂交的持续时间一般小于约M小时,通常约4至约12小时。
特异性通常是杂交后清洗的函数,至关重要的因素是最终清洗溶液的离子强度和温度。对于 DNA-DNA 杂合物,Tm 可自 Meinkoth 和 Wahl (1984) Anal. Biochem. 138 :267-284 的方程式估算:Tm = 81. 5°C +16. 6 (log Μ) +0. 41(% GC) -0. 61(% form) -500/L ;其中 M 是单价阳离子的摩尔浓度,% GC是DNA中鸟嘌呤和胞嘧啶核苷酸的百分比,% form是杂交溶液中甲酰胺的百分比,而L是以碱基对计的杂合物长度。Tm是50%的互补靶序列杂交至完全匹配的探针的温度(在规定的离子强度和PH下)。每的错配使1下降约1°C ; 如此,可调整Tm、杂交和/或清洗条件以杂交至具有想要的同一性的序列。例如,若寻找具有大于等于90%同一性的序列,则可使Tm下降10°C。一般而言,严格条件选择为比特定序列及其互补物在规定离子强度和PH的热熔点(Tm)低约5°C。然而,极严格条件可利用比热熔点(Tm)低1、2、3或4°C的杂交和/或清洗;中等严格条件可利用比热熔点(Tm)低6、 7、8、9或10°C的杂交和/或清洗;低严格条件可利用比热熔点(Tm)低11、12、13、14、15、或 20°C的杂交和/或清洗。使用所述方程式、杂交和清洗组合物、和想要的Tm,普通技术人员会理解,内在描述了杂交和/或清洗溶液的严格性的变化。若想要的错配程度导致Tm小于 450C (水溶液)或32°C (甲酰胺溶液),则优选提高SSC浓度以使得可使用更高的温度。对核酸杂交的广泛指导记载于Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes,部分 I,章 2 (Elsevier, New York);及 Ausubel 等编(1995)Current Protocols in Molecular Biology,章 2 (Greene Publishing andffiley-Interscience, New York)。参见 Sambrook 等(1989) Molecular Cloning ALaboratory Manual(第 2 版,Cold Spring Harbor Laboratory Press, Cold SpringHarbor, New York)。
E.密码子选择
可根据宿主生物体的密码子选择来调整本文中所公开的核酸序列。密码子选择或密码子偏爱在本领域中是公知的。选定的编码序列可通过改变其遗传密码来改良以匹配由细菌宿主细胞所采用的,并可增强其密码子序列来更好地接近宿主所采用的。可依照本领域普通技术人员已知的多种方法之任一种(例如寡核苷酸指导的诱变)来实施遗传密码选择和密码子频率增强。帮助此方法的有用的在线因特网资源包括例如(l)KazUsa DNA研究所 Q-6-7Kazusa-kamatari,Kisarazu,Chiba 292-0818Japan)的密码子选择数据库,并可在 www. kazusa. or. jp/codon 获得;和( 可自 NCBI 分类学数据库在 www. ncbi. nln. nih. gov/-Taxonomy/Utils/wprintgc. cgi ? mode = c获得的遗传密码表。例如,假单胞菌物种报告为利用NCBI分类学位置的遗传密码翻译表11,而在Kazusa位置报告为展现出www. kazusa. or. ip/codon/cgibin处所显示表格的密码子用法频率。认识到可关于密码子选择来调整分泌信号多肽、本文中别处所描述的感兴趣多肽或两者的编码序列。
F.表达载体
本发明的另一个实施方案包括表达载体,其包括编码对于将可操作连接的感兴趣蛋白质或多肽靶向至革兰氏阴性细菌的周质或靶向入胞外空间中有用的新的分泌多肽的核酸。在一个实施方案中,载体包含可操作连接至启动子的,编码与本文中所公开的分泌信号多肽基本上类似的多肽的多核苷酸序列。可表达的编码序列会可操作附着至能够在选定的宿主细胞中运行的转录启动子,以及所有其它所需要的转录和翻译调控元件。
术语“可操作连接的”指任何如下的构造,其中转录和任何翻译调控元件以相对于编码序列的这样一种或多种布置共价附着于编码序列以使得在宿主细胞中和通过宿主细胞的作用,调控元件可指导编码序列的表达。
载体通常会包含一种或多种表型选择标志和复制起点以确保载体的维持,并在想要时提供宿主内的扩增。依照本公开内容的适于转化的宿主包括假单胞菌属内的多种物种,并且特别优选的是荧光假单胞菌的宿主细胞株。
在一个实施方案中,载体进一步包含用于表达可操作连接至本文中所公开的分泌信号的感兴趣蛋白质或多肽的编码序列。可自多核苷酸表达重组蛋白和多肽,在所述多核苷酸中靶多肽编码序列可操作连接至前导序列和转录和翻译调控元件以形成功能性基因, 宿主细胞可自该功能性基因表达蛋白质或多肽。编码序列可以是靶多肽的天然编码序列 (若可获得的话),但是会更优选已经为了在选定的表达宿主细胞中的应用进行选择、改善或优化的编码序列例如,通过合成基因以反映宿主物种的密码子使用偏爱。在本发明的一个实施方案中,宿主物种是荧光假单胞菌,并在设计信号序列和/或蛋白质或多肽序列两者时考虑荧光假单胞菌的密码子偏爱。将一种或多种基因在一种或多种载体内构建或插入一种或多种载体中,然后可将所述载体转化入表达宿主细胞中。
其它调控元件可包括在载体(也称为“表达构建体”)中。此类元件包括但不限于例如转录增强子序列、翻译增强子序列、其它启动子、激活子、翻译起始和终止信号、转录终止子、顺反子调节物、多顺反子调节物、标签序列(诸如核苷酸序列“标签”和“标签”多肽编码序列),其促进所表达的多肽的鉴定、分开、纯化和/或分离。
在另一个实施方案中,表达载体进一步包含与分泌信号的编码序列或与感兴趣蛋白质或多肽的编码序列邻近的标签序列。在一个实施方案中,此标签序列容许纯化蛋白质。 标签序列可以是亲和标签,诸如六组氨酸亲和标签。在另一个实施方案中,亲和标签可以是谷胱甘肽-S-转移酶分子。标签还可以是荧光分子,诸如YFP或GFP,或此类荧光蛋白的类似物。标签还可以是对纯化有用的已知结合配偶体的已知抗原或配体、或抗体分子的一部分。
在蛋白质编码序列之外,依照本发明的蛋白质编码基因还可包括与其可操作连接的下列调控元件启动子、核糖体结合位点(RBQ、转录终止子、翻译起始和终止信号。有用的RBS可自在依照本发明的表达系统中可用作宿主细胞的任何物种获得,优选自选定的宿主细胞获得。许多特有的和多种共有的RBS是已知的,例如那些记载于D. Frishman等, Starts of bacterial genes -estimating the reliability of computer predictions, Gene 234(2) :257-65 (1999 年 7 月 8 日);及 Β· Ε· Suzek 等,A probabilistic method for identifying start codons inbacterial genomes, Bioinformatics 17(12) 1123-30 (2001年12月)的和由它们提及的。另外,可使用天然的或合成的RBS,例如那些记载于EP 0207459(合成的RBS) ;0. Ikehata等,Primary structure of nitrile hydratase deduced from thenucleotide sequence of a Rhodococcus species and its expression in Escherichiacoli,Eur. J. Biochem. 181(3) :563-70(1989)的(天然 RBS 序列 AAGGAAG)。法、载体、和翻译和转录元件及其它元件的进一步的例子记载于例如 Gilroy的美国专利No. 5,055, 294和Gilroy等的美国专利No. 5,128,130 ;Rammler等的美国专利No. 5,281,532 ;Barnes等的美国专利No. 4,695,455和4,861,595 ;Gray等的美国专利 No. 4,755,465 ;及 Wilcox 的美国专利 No. 5,169,760。
通过将增强子序列插入载体或质粒中来增加编码本发明蛋白质的DNA的转录。典型的增强子是大小通常约10-300bp的DNA顺式作用元件,其作用于启动子以增加其转录。 例子包括多种假单胞菌增强子。
一般而言,重组表达载体会包括复制起点和容许宿主细胞转化的选择标志和自高度表达的基因衍生以指导下游结构序列转录的启动子。此类启动子可以自编码酶(诸如 3-磷酸甘油酸激酶(PGK)、酸性磷酸酶或热休克蛋白等)的操纵子衍生。异源结构序列以合适的状态与翻译起始和终止序列和优选能够指导所翻译的多肽分泌的分泌序列装配在一起。任选地,异源序列可编码包含赋予想要的特性(例如所表达重组产物的稳定化或简化的纯化)的N端鉴定多肽的融合多肽。
用于在宿主细胞中表达重组蛋白的载体在本领域中是已知的,并且可使用这些中的任一种来表达依照本发明的基因。此类载体包括例如质粒、粘粒、和噬菌体表达载体。有用的质粒载体的例子包括但不限于表达质粒pBBRlMCS、pDSK519、pKT240, pML122、 pPSlO、RK2、RK6、pR01600、和RSF1010。此类有用的载体的其它例子包括那些记载于例如N. Hayase,于 Appl.Envir. Microbiol. 60(9) :3336-42(1994 年 9 月);Α· A. Lushnikov 等,于 Basic Life Sci. 30 :657-62 (1985) ;S. Graupner 禾口 W. Wackemagel,于 Biomolec. Eng. 17(1) :11-16. (2000 年 10 月);H. P. Schweizer,于 Curr. Opin. Biotech. 12(5) 439-45(2001 年 10 月);M. Bagdasarian 禾口 K. N. Timmis,于 Curr. TopicsMicrobiol. Immunol. 96 :47-67(1982) ;Τ. Ishii 等,于 FEMS Microbiol. Lett. 116(3) :307-13(1994 年 3 月 1 日);I. N. Olekhnovich 和 Y. K. Fomichev,于 Genel40(l) :63-65(1994 年 3 月 11 日);M-Tsuda 和 T. Nakazawa,于 Genel36(l_2) :257-62(1993 年 12 月 22 日); C. Nieto 等,于 Gene 87(1) :145-49(1990 年 3 月 1 日)J.D.Jones 和 N. Gutterson, 于 Gene 61(3) :299-306(1987) ;M. Bagdasarian 等,于 Gene 16(1-3) :237-47(1981 年 12 月);H. P. Schweizer 等,于 Genet. Eng. (NY) 23 :69-81(2001) ;P. Mukhopadhyay 等,于 J. Bact. 172 (1) :477-80 (1990 年 1 月);D. 0. Wood 等,于 J. Bact. 145 (3) 1448-51 (1981 年 3 月);及 R-Holtwick 等,于 Microbiology 147 (Pt 2) :337-44 (2001 年 2 月)的。
可用于宿主细胞的、包含本发明的分泌信号构建体的表达载体的进一步例子包括那些列于表2中的、自指示的复制子衍生的。
22表2:有用的表达栽体的例子复制子载体PPSlOPCN39,PCN51RSF1010PKT261-3PMMB66EHPEB 8PPLGNlPMYC1050RK2/RP1PRK415PJB653PRO 1600PUCPPBSP
表达质粒RSF1010 记载于例如 F. Heffron 等,于Proc. Nat,1 Acad. Sci. USA72 (9) 3623-27 (1975 年 9 月)及 K. Nagahari 和 K. Sakaguchi,于 J. Bact. 133 (3) 1527-29 (1978 年 3月)。质粒RSF1010及其衍生物是本发明中特别有用的载体。例示性的、有用的RSF1010衍生物(其在本领域中是已知的)包括例如pKT212、pKT214、pKT231及相关质粒,和pMYC1050 及相关质粒(参见例如Thompson等的美国专利No. 5,527,883和5,840,554),诸如例如 PMYC1803。质粒pMYC1803衍生自基于RSF1010的质粒pTJS260 (参见Wilcox的美国专利 No. 5,169,760),其携带来自RSF1010质粒的可调型四环素抗性标志及复制和转移基因座 (replication and mobilization loci)。其它例示性的有用的载体包括包括那些记载于 Puhler等的美国专利No. 4,680,264的。
在一个实施方案中,表达质粒作为表达载体使用。在另一个实施方案中,RSF1010 或其衍生物作为表达载体使用。在又一个实施方案中,PMYC1050或其衍生物,或pMYC4803 或其衍生物作为表达载体使用。
可通过包含于质粒中的选择标志基因来将质粒维持在宿主细胞中。这可以是抗生素抗性基因(其中将相应的抗生素添加至发酵培养基),或本领域中已知的任何其它类型的选择标志基因,例如原养型恢复基因,其中在相应的性状(例如生物催化性状,诸如氨基酸生物合成或核苷酸生物合成性状,或碳源利用性状)营养缺陷的宿主细胞中使用所述质粒。
依照本发明使用的启动子可以是组成型启动子或可调型启动子。有用的可调型启动子的常见例子包括那些自Iac启动子(即IacZ启动子)衍生的家族的,特别是记载于 DeBoer 的美国专利 No. 4,551,433 的 tac 和 trc 启动子,以及 Ptacl6、Ptacl7、PtacII、 PlacUV5、和T71ac启动子。在一个实施方案中,启动子不是自宿主细胞生物体衍生的。在某些实施方案中,启动子是自大肠杆菌生物体衍生的。
在依照本发明的表达系统中有用的非Iac型启动子的常见例子包括例如那些列于表3的。
表3:非toe启动子的例子启动子诱导物Pr尚温Pl尚温Pm烃基或面代笨甲酸盐Pu烃基或面代甲苯Psal水杨酸盐
参见例如J. Sanchez-Romero 禾口 V. De Lorenzo (1999) Genetic Engineeringof Nonpathogenic Pseudomonas strains as Biocatalysts for Industrial andEnvironmental Processes, 于 Manual of Industrial Microbiology andBiotechnology (A. Demain 禾口 J. Davies 编)页 460—74 (ASM Press, Washington, D. C.); H. Schweizer (2001)Vectors to express foreign genes and techniques tomonitor gene expression for Pseudomonads, Current Opinion in Biotechnology, 12 :439-445 ; 及 R. Slater 禾口 R. Williams(2000)The Expression of Foreign DNAin Bacteria, 于 Molecular Biology and Biotechnology (J. Walker 禾口 R. Rapley 编)页 125-54 (The Royal Society of Chemistry,Cambrid
查看更多专利详情

下载专利文献

下载专利