早鸽—汇聚行业精英
  • 联系客服
  • 帮助中心
  • 投诉举报
  • 关注微信
400-006-1351
您的问题早鸽都有答案
3000+专业顾问
搜索
咨询

植物细胞中草甘膦抗性编码核酸分子的优化表达制作方法

  • 专利名称
    植物细胞中草甘膦抗性编码核酸分子的优化表达制作方法
  • 发明者
  • 公开日
  • 申请日期
  • 优先权日
  • 申请人
  • 文档编号
  • 关键字
  • 专利摘要
    提供了一种可提供对草甘膦的抗性的编码5-烯醇丙酮酰-3-磷酸莽草酸合酶(EPSPS)的核酸分子,所述核酸分子已被优化用于在单子叶植物和双子叶植物中尤其是在大豆中表达。还提供了使用方法。
  • 发明内容
  • 专利说明
    植物细胞中草甘膦抗性编码核酸分子的优化表达
  • 专利详情
  • 全文pdf
  • 权力要求
  • 说明书
  • 法律状态
植物细胞中草甘膦抗性编码核酸分子的优化表达的制作方法[0001]相关申请的引用[0002]本申请要求先前提交的共同未决临时申请USSN61/419,703的优先权,所述临时申请的内容以引用的方式全文纳入本文。[0003]序列表[0004]本申请包括已通过EFS-Web以ASCII格式提交的序列表,并特此以引用的方式全文纳入本文。所述ASCII复本,创建于2011年11月22日,名称为210007PCT.txt,大小为26,865 字节。[0005]草甘膦(N-膦酰甲基甘氨酸)是除草剂中广泛使用的组分。草甘膦抑制5-烯醇丙酮酰-3-磷酸莽草酸合酶(EPSP合酶或EPSPS)。5-烯醇丙酮酰-3-磷酸莽草酸合酶参与植物细胞中芳香族氨基酸的合成。抑制EPSPS可有效地破坏蛋白质合成,从而杀死受影响的植物细胞。因为草甘膦是非选择性的,它既杀死杂草又杀死农作物。因此,改进农作物使其抗草甘膦以使得所需的植物在暴露于草甘膦后继续存活对农作物是有用的。[0006]重组DNA技术已被用于分离抗草甘膦的突变型EPSP合酶。可将这种抗草甘膦的突变型EPSP合酶转化到植物中并将草甘膦抗性赋予转化的植物。作为实例,如美国专利5, 633, 435所述,从土壤杆菌属(Agrobacterium)菌株CP4中分离出了耐草甘膦基因。全长玉米EPSPS基因在美国专利7,045,684中描述。其进入至叶绿体并切割叶绿体转运肽,生成成熟 EPSPS。参见 Herouet-Guicheney et al.(2009) “Safety evaluation of thedouble mutant5-enolypyruvylshikimate-3-phosphate synthase (2mEPSPS)from maizethat confers tolerance to glyphosate herbicide in transgenic pIants^RegulatoryToxicology and Pharmacology, Vol.54,Issue2, ppl43_153。该参考文献和引用的全部参考文献均以引用的方式纳入本文。[0007]已经通过引入突变产生了其他耐草甘膦基因。这些基因包括由Comai分离且在美国专利5,094,945,4, 769,061和4,535,060中描述的基因。如5,310,667所述,已通过将80位和120位之间的甘氨酸残基置换为丙氨酸残基而使用单突变体。双重突变体也在美国专利6,225,114和5,866,775描述,其中除了上述突变以外,将第二突变(苏氨酸残基置换在170位和210位之间的丙氨酸残基)引入至野生型EPSPS基因中。
[0008]其他工作通过引入携带位于以下位置的突变的修饰的玉米EPSPS基因产生了双重突变型EPSPS玉米:由GenBank登记号X63374的序列编码的氨基酸序列中的102位残基(从苏氨酸变为异亮氨酸)和106位残基(从脯氨酸变为丝氨酸),所述修饰的玉米EPSPS基因在美国专利6,566,587和6,040, 497中描述,所述美国专利均以引用的方式全文纳入本文。


[0009] 本发明涉及一种密码子优化的修饰的EPSPS序列,当在植物中表达时,该序列可赋予对草甘膦除草剂的抗性或耐受性。所述核苷酸序列被优化用于在植物中表达,优选用于在双子叶植物和单子叶植物中表达,最优选用于在大豆(Glycine max)植物中表达。所编码的氨基酸与野生型EPSPS多肽相比包括两个突变:与野生型玉米(Zea mays) EPSPS多肽相比,在相应的102位残基上苏氨酸成异亮氨酸和在相应的106位残基上脯氨酸成丝氨酸。



[0010]图1为Genbank登录号X63374中列出的序列,该序列是编码在进入并切除优化的叶绿体转运肽之后的预测成熟玉米EPSPS序列的野生型玉米(Zea mays) EPSPS核苷酸序列,该序列为SEQ ID NO:1 ;在所述核苷酸序列下面标出预测成熟玉米EPSPS的编码氨基酸序列,为SEQ ID N0:2。残基102和残基106为下划线粗体;在蛋白的102位上以异亮氨酸置换苏氨酸和106位上以丝氨酸置换脯氨酸的蛋白是双重突变型玉米EPSPS蛋白(2mEPSPS),为SEQ ID N0:3。图1公开了如SEQ ID NO:6的包括“atg”起始密码子的全长序列。
[0011]图2示出双重突变型玉米EPSPS基因(2mEPSPS vl)的核苷酸序列,为SEQ IDN0:4。ATG起始密码子位点为斜体。
[0012]图3示出优化的双重突变型玉米EPSPS基因(2mEPSPS v2)核酸分子,为SEQ IDN0:5。图3公开了如SEQ ID NO:7的包括“atg”起始密码子的全长序列。
[0013]图4A-B示出玉米2mEPSPS vl核酸分子(SEQ ID NO:4)和优化的DMMG核酸分子(2mEPSPS v2, SEQ ID NO:7)的比对。
[0014]图5为构建体pDAB8291的质粒图。
[0015]图6为表达2mEPSP`S v2的第一事件的蛋白质印迹。
[0016]图7为表达2mEPSPS v2的第二事件的蛋白质印迹。
[0017]序列说明
[0018]SEQ ID NO:1:为X63374玉米EPSPS野生型核苷酸序列(编码推测的成熟野生型EPSPS)o
[0019]SEQ ID NO: 2:为自X63374的推测的成熟野生型EPSPS氨基酸序列。
[0020]SEQ ID NO: 3:为推测的2mEPSPS双重突变型氨基酸序列。
[0021]SEQ ID N0:4:为编码双重突变型2mEPSPS的玉米天然序列核苷酸序列2mEPSPSvl O
[0022]SEQ ID N0:5:为编码双重突变型2mEPSPS的单子叶植物优化的核苷酸序列2mEPSPS v2。
[0023]SEQ ID NO:6:为包括ATG起始密码子的野生型EPSPS核苷酸序列。
[0024]SEQ ID NO: 7:为包括ATG起始密码子的编码双重突变型2mEPSPS的优化的核苷酸序列 2mEPSPS v20

[0025]为了获得异源基因在植物中的高表达,优选重新设计所述基因从而使它们在植物细胞中更有效地表达,当需要单子叶植物基因既在双子叶植物细胞又在单子叶植物细胞中表达时,尤其优选如此。已分离出编码5-烯醇丙酮酰-3-磷酸莽草酸合酶(EPSPS)的野生型基因,编码在进入并切割优化的叶绿体转运肽之后的推测成熟玉米EPSPS序列的玉米核苷酸序列可见于GenBank登录号X63374,也示于美国专利6,566,587(其中具体为序列识别号3),所述美国专利以引用的方式全文纳入本文。在本文中,所述序列为SEQ ID NO:1,也示于图1中。在图1中,野生型EPSPS核苷酸序列下面标出所编码的野生型氨基酸序列,为SEQID N0:2。草甘膦(N-膦酰甲基甘氨酸)是除草剂中广泛使用的组分。草甘膦抑制EPSPS,其参与植物细胞中芳香族氨基酸的合成。抑制EPSPS可有效地破坏蛋白质合成,从而杀死受影响的植物细胞。提供抗草甘膦的植物或植物细胞在多种应用中是有用的,其中具有所述抗性的植物细胞可对草甘膦暴露耐受。当在植物细胞中表达时,对野生型植物EPSPS核苷酸序列的修饰可提供这种抗性。参照图1,并且如‘587专利中所述,当比较EPSPS多肽和图1的野生型多肽时,所述蛋白质102位上以异亮氨酸置换苏氨酸和106位上以丝氨酸置换脯氨酸的修饰(所述两个位置在图1中都以下划线黑体示出)可得到双重突变型EPSPS多肽(2mEPSPS),在本文中为SEQ ID NO:3。当与合适的叶绿体转运肽一起在植物细胞中表达时,它在进入叶绿体中并加工为成熟的酶形式之后可提供对草甘膦的耐受性(图1)。
[0026]在本文中,用于在单子叶植物和双子叶植物中表达相同的2mEPSPS蛋白的基因2mEPSPS v2的设计被显示,为了优化的表达而重新设计该基因的蛋白编码区。本文描述了编码5-烯醇丙酮酰-3-磷酸莽草酸合酶(EPSP合酶或EPSPS)多肽的优化的核苷酸序列,所述优化的多肽由野生型EPSPS修饰而来。
[0027]1338碱基对的来自玉米的双重突变型核苷酸序列示于图2示出,为SEQ ID N0:4。该修饰的核苷酸序列被称为双重突变型玉米基因或DMMG,并且可提供对草甘膦的耐受性。这是玉米2mEPSPS核苷酸序列,也称为2mEPSPS vl。其编码SEQ ID NO:3的2mEPSPS多肽,该多肽与SEQ ID NO: 2的野生型EPSPS多肽相比包含残基102位以异亮氨酸置换苏氨酸和残基106位以丝氨酸置换脯氨酸。
[0028]优化了 SEQ ID NO:4的2mEPSPS vl核酸分子以改善在双子叶植物和单子叶植物中的表达,尤其是在大豆中的表达。根据优先的单子叶植物密码子选择来选择密码子选择,因为重新设计密码子选择使得所述蛋白质由对单子叶植物选择和双子叶植物选择都有偏好的密码子来编码,并除去有害序列和多余限制位点以提高DMMG编码序列的转录/翻译的效率并有利于DNA操作步骤。这样做,在双子叶植物尤其是大豆中表达2mEPSPS可提供对草甘膦施用的抗性。
[0029]图3示出优化的序列(SEQ ID NO: 5)。ATG起始位点为斜体并在所述优化序列SEQID NO: 5上面标出(包含“atg”起始密码子的全长序列以SEQ ID NO: 7公开)。优化的序列和突变型玉米序列编码相同的2mEPSPS蛋白(示于SEQ ID NO:3中)。
[0030]图4示出与来自玉米的天然玉米密码子2mEPSPS vlDNA序列(SEQ ID N0:4)比较,单子叶植物和双子叶植物优化的2mEPSPS v2DNA序列的核苷酸序列比对。虽然2mEPSPS蛋白质序列在氨基酸水上100%相同,但是它们是在核苷酸水平上仅为85.5%相同的基因版本I和基因版本2。所产生的差异是使用上述策略产生的密码子选择的结果。
[0031]优化的2mEPSPS v2核酸分子可用于其中草甘膦抗性可用于植物中的多种广泛应用。草甘膦、草硫膦和fosametine是膦酰甲基甘氨酸家族的广谱系统性除草剂。当提及草甘膦时,该术语应被认为包括N-膦酰甲基甘氨酸的任何有效除草形式和其任何盐及可在植物中导致草甘膦两性离子生成的形式。对于PEP (磷酸烯醇式丙酮酸)的结合而言,草甘膦是5-烯醇丙酮酰莽草酸-3-磷酸合酶(EC2.5.1.19)或EPSPS的竞争性抑制剂。向植物施用膦酰甲基甘氨酸除草剂之后,它被转移至植物中,在其中它在快速生长部分(尤其是茎和根端)积累,对敏感植物的破坏点造成损害。取决于除草剂的施用量,可抑制所述敏感植物的生长,即其生长变慢或完全停止。植物对草甘膦或其家族产品的耐受性可通过将这种优化的修饰EPSPS稳定地引入至它们的基因组中来获得。从例如美国专利4,535,060和6,566,587已知,可通过将编码EPSPS的基因引入至基因组中来赋予植物对上述类型的除草剂(尤其是N-膦酰甲基甘氨酸或草甘膦)的耐受性,所述编码EPSPS的基因携带有可使该酶在定位于质体区室之后对其竞争性抑制剂(草甘膦)抗性更大的突变。当提及对草甘膦除草剂的抗性或耐受性时,它是指除草剂对植物的任何影响都不会杀死植物;可以对植物有极小的影响或者是完全没有影响,使得对含有可提供抗性或耐受性的异源核酸分子的植物的任何不利影响小于不含可提供对草甘膦的抗性或耐受性的核酸分子的植物。
[0032]当在大豆(Glycine max)、大豆植物中表达时,这种核酸分子是尤其有用的。所述核酸分子可从任何宿主分离并被修饰以使其包含本发明的核酸分子,可以从玉米或大豆或其他植物分离,从微生物分离,或者可以通过合成产生;产生本发明的核酸分子的方法并不是至关重要的。
[0033]本文使用的术语核酸或多核苷酸是指脱氧核糖核苷酸或核糖核苷酸和其单链或双链形式的聚合物。因此,所述术语包括RNA和DNA—可以是基因或其部分、cDNA、合成的聚脱氧核糖核苷酸序列等,可以是单链或双链以及DNA/RNA杂合体。此外,本文所使用的术语包括天然存在的核酸分子,其可从细胞中分离,以及合成分子,其可通过例如化学合成方法或通过酶法(例如通过聚合酶链式反应(PCR))制备。除非特别限定,否则所述术语包括含有天然核苷酸的已知类似物的核酸,所述核酸具有与参比核酸相似的结合性质并以与天然存在核苷酸相似的方式进行代谢。所述术语核酸可与基因、cDNA和基因编码的mRNA互换使用。
[0034]术语“互补的”用于描述能够彼此杂交的核苷酸碱基之间的关系。例如,就DNA而言,腺嘌呤核苷与胸腺嘧啶互补,胞嘧啶与鸟嘌呤互补。因此,本发明还包括与所述全序列互补的分离的核酸片段。
[0035]脱氧核糖核苷酸(DNA)是含`有4种单核苷酸单元的聚合物,(D) dAMP (2’ -(D)脱氧腺苷_5_ —磷酸)、dGMP (2’-(D)脱氧鸟苷-5- —磷酸)、dCMP (2’-(D)脱氧胞苷_5_ —磷酸)和dTMP (2’ -(D)脱氧胸苷-5- —磷酸)在各序列中通过3’,5’ -磷酸二酯桥连接。所述结构DNA由多个称为“密码子”的编码氨基酸的核苷酸三联体组成。所述密码子对应如下的各种氨基酸:Arg(CGA、CGC、CGG、CGT、AGA、AGG) ;Leu(CTA、CTC, CTG, CTT, TTA, TTG);Ser (TCA、TCC、TCG、TCT、AGC, AGT) ;Thr(ACA、ACC、ACG, ACT) ;Pro (CCA、CCC、CCG、CCT);Ala (GCA、GCC、GCG, GCT) ;Gly(GGA、GGC, GGG, GGT) ;Ile(ATA、ATC, ATT) ;Val (GTA、GTC,GTG、GTT) ;Lys(AAA、AAG) ;Asn (AAC、AAT) ;Gln (GAA、CAG) ;His (CAC、CAT) ;Glu (GAA、GAG);Asp(GAC、GAT) ;Tyr (TAC、TAT) ;Cys (TGC、TGT) ;Phe (TTC、TTT) ;Met (ATG)和 Trp (UGG)。此外,由于遗传密码子的冗余(即除了两种氨基酸以外,所有的氨基酸对应多于一种密码子),存在可编码具体氨基酸序列的许多可能的DNA序列。
[0036]在本文讨论的氨基酸序列中,使用了标准的单字母或三字母命名法。在说明书下文中出现的所有肽结构以其中N末端氨基出现在左边和C末端羧基出现在右边的常规形式表示。同样,在蛋白质中出现的天然存在氨基酸的氨基酸命名如下:丙氨酸(Ala ;A)、天冬酰胺(Asn ;N)、天冬氨酸(Asp ;D)、精氨酸(Arg ;R)、半胱氨酸(Cys ;C)、谷氨酸(Glu ;E)、谷氨酰胺(Gin ;Q)、甘氨酸(Gly ;G)、组氨酸(His ;H)、异亮氨酸(lie ;1)、亮氨酸(Leu ;L)、赖氨酸(Lys ;K)、甲硫氨酸(Met ;M)、苯丙氨酸(Phe ;F)、脯氨酸(Pro ;P)、丝氨酸(Ser ;S)、苏氨酸(Thr ;T)、色氨酸(Trp ;W)、酪氨酸(Tyr ;Y)和缬氨酸(Val ;V)。当氨基酸残基是未知的时候,可使用“X”,括号表示确定的指定是不可能的,括号内的氨基酸名称是基于已知信息的最可能的估计。
[0037]当提及杂交技术时,可将已知核苷酸序列的全部或一部分用作探针,所述探针可选择性杂交存在于选择植物的克隆基因组DNA片段或cDNA片段的集合(即基因组文库或cDNA文库)中的其他相应的核苷酸序列。所述杂交探针可以是基因组DNA片段、质粒DNA片段、cDNA片段、RNA片段、PCR扩增的DNA片段、寡核苷酸或其他多核苷酸,并且可以以可检测基团(例如32P)或任何其他可检测标记物标记。因此,例如,用于杂交的探针可通过标记基于本发明的DNA序列的合成寡核苷酸制成。制备用于杂交的探针的方法和构建cDNA文库和基因组文库的方法通常是本领域已知的,并且已被公开(Sambrook et al.,1989)。
[0038]例如,本文公开的序列或其一个或多个部分可用作能够特异性杂交相应序列的探针。为了在多种条件下实现特异性杂交,这种探针包括要筛选的序列中的独特序列,长度优选为至少约10个核苷酸,长度更优选至少约20个核苷酸。或者,这种序列可用于通过PCR从选择的植物中扩增相应的序列。该技术可用于从所需的植物中分离序列,或可用作诊断测定以确定植物中的序列存在情况。杂交技术包括杂交筛选以噬菌斑或菌落铺板的DNA文库(Sambrook et.al., 1989)。
[0039]这种序列的杂交可在严格条件下进行。“严格条件”或“严格杂交条件”是指探针将会与其靶序列杂交至与其他序列相比更容易检测的程度(即背景的至少2倍)的条件。严格条件是序列依赖性的,在不同的环境中不同。通过控制杂交条件和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。或者,可调整严格条件以允许序列中有一些错配使得可检测更低程度`的相似性(异源探测)。通常,探针的长度少于约1000个核苷酸,优选长度少于500个核苷酸。
[0040]通常,严格条件是这样的条件:在pH7.0至8.3下盐浓度低于约1.5MNa+离子,通常约0.01至1.0M Na+离子浓度(或其他盐),并且温度对于短探针(例如10至50个核苷酸)为至少约30°C,对于长探针(例如多于50个核苷酸)为至少约60°C。严格条件也可以通过加入去稳定剂(例如甲酰胺)来实现。示例性的低严格条件包括以37°C下于含有30-35%甲酰胺、IM NaCU0.1%SDS (十二烷基硫酸钠)的缓冲溶液杂交,并且在50-55°C下在I X-2 X SSC(20XSSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性的中等严格条件包括在37°C下于40-45%甲酰胺、1.0M NaCl、l%SDS中杂交,并且在55_60°C下在0.5X-1XSSC中洗涤。示例性的高严格条件包括在37°C下于50%甲酰胺、1.0M NaCU0.1%SDS中杂交,并且在60_65°C下在0.1XSSC中洗涤。
[0041]特异性通常是杂交后洗涤的函数,关键因素是最终洗涤溶液的离子强度和温度。对于 DNA-DNA 杂合体,Tni 可用 Meinkoth 和 Wahl1Anal.Biochem.,138:267-284(1984)的等式估算:1=81.5 °C+16.6 (log M) +0.41 (%GC) - 0.61 (%form) - 500/L ;其中 M 为单价阳离子的容积摩尔数,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%form为杂交溶液中甲酰胺的百分比,L为以碱基对表示的杂交体的长度。Tm为(在确定的离子强度和pH下)50%的互补靶序列与完全匹配的探针杂交时的温度。对于每1%的错配,Tffl降低约1°C ;因此,为了杂交所需同一性的序列,可调节Tm、杂交条件和/或洗涤条件。例如,如果要寻求具有≥90%同一性的序列,则可将Tm降低10°C。通常,在确定的离子强度和pH下,严格条件选择为比特定序列和其互补序列的热解链温度(Tm)低约5°C。然而,极严格条件可采用在比热解链温度(Tm)低1、2、3或4°C的温度下杂交和/或洗涤;中等严格条件可采用在比热解链温度(Tm)低6、7、8、9或10°C的温度下杂交和/或洗涤;低严格条件可采用在比热解链温度低11、12、13、14、15或20°C的温度下杂交和/或洗涤。使用所述等式、杂交和洗涤组合物以及所需的 Tm,本领域普通技术人员将会理解,杂交和/或洗涤溶液的严格度的变化在本质上已经被描述。如果所需的错配程度导致Tm低于45°C (水溶液)或32°C (甲酰胺溶液),则优选增加SSC的浓度使得可以使用更高的温度。对核酸杂交的详尽指导可在以下文献中找至丨J:Ti issen, Laboratory Techniques in Biochemistry and MolecularBiology—Hybridization with Nucleic Acids Probes, Part I,Chapter2, Ausubel, etal., Eds., Greene Publishing and ffiley-1nterscience, New York (1995)。
[0042]特异性还是杂交后洗涤的函数,关键因素是最终洗涤溶液的离子强度和温度。对于 DNA-DNA 杂合体,Tm 可用以下等式估算:Tm=81.5°C +16.6 (log M) +0.41 (%GC)-0.61 (%form) - 500/L ;其中M为单价阳离子的容积摩尔数,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%form为杂交溶液中甲酰胺的百分比,L为以碱基对表示的杂交体的长度(Meinkoth和Wahl, 1984)。Tm为(在确定的离子强度和pH下)50%的互补祀序列与完全匹配的探针杂交时的温度。对于每1%的错配,Tm降低约1°C;因此,为了杂交所需同一性的序列,可调节Tm、杂交条件和/或洗涤条件。例如,如果要寻求具有90%同一性的序列,则可将Tm降低10°C。通常,在确定的离子强度和pH下,严格条件选择为比特定序列和其互补序列的热解链温度(Tm)低约5°C。然而,极严格条件可采用在比热解链温度(Tm)低1、2、3或4°C的温度下杂交和/或洗涤;中等严格条件可采用在比热解链温度(Tm)低6、7、8、9或10°C的温度下杂交和/或洗涤;低严格条件可采用在比热解链温度低11_20°C的温度下杂交和/或洗涤。使用所述等式、杂交和洗涤组合物以及所需的Tm,本领域普通技术人员将会理解,杂交溶液和/或洗涤溶液的严格度的变化在本质上已经被描述。如果所需的错配程度导致Tm低于45°C (水溶液)或32°C (甲酰胺溶液),则优选增加SSC的浓度使得可以使用更高的温度。对核酸杂交的详尽指导可在以下文献中找到:(1997)Ausubelet al, Short Protocolsin Molecular Biology, page2_40, Third Edit.(1997)和 Sambrook et al.(1989)。
[0043]通常,对应本发明的核苷酸序列并且可与本文公开的核苷酸序列杂交的序列与所公开的序列至少 50% 同源、70% 同源,甚至 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同源或更高。也就是说,探针和靶之间的序列相似性是一个范围,共享至少约50%、约70%以及甚至约85%或更高的序列相似性。
[0044]以下术语被用于描述两条或多条核酸或多核苷酸之间的序列关系:(a) “参比序列”,(b) “对比窗口”,(C) “序列同一性”以及(d) “序列同一性百分比”。
[0045](a)本文使用的“参比序列”是用作序列对比基础的给定序列。参比序列可以是指定序列的子集或整体;例如,作为全长启动子序列的区段或全启动子序列。
[0046](b)本文使用的“对比窗口”是指多核苷酸序列的连续的指定区段,其中多核苷酸序列与参比序列(不包含插入或缺失)相比在对比窗口中可包含插入或缺失(即,缺口),以最佳比对所述两条序列。通常,对比窗口长度为至少20个连续核苷酸,任选可以为30、40、50、100或者更长。本领域技术人员可理解,由于多核苷酸序列中包含缺口,为了精确地反映与参比序列的相似性,缺口惩罚通常被引入并从匹配数目减去。
[0047]比对用于对比的序列的方法是本领域公知的。因此,可使用数学算法来完成对任意两条序列间百分比同一性的确定。
[0048]最佳比对用于对比的序列可使用本领域已知的任何方法来分析序列同一性(同源性),例如通过称为“PILEUP”的渐进比对法(Morrison, Mol.Biol.Evo1.14:428-441 (1997),其作为使用PILEUP的实例);通过Smith和Watermanby的局部同源性算法(Adv.Appl.Math.2:482 (1981));通过 Needleman 和 Wunsch 的同源性比对算法(J.Mol.Biol.48:443(1970));通过 Pearson 的搜索相似性的方法(Proc.Natl.Acad.Sc1.USA85:2444(1988));通过这些算法的计算机实现(例如Wisconsin Genetics软件包(Genetics Computer Group, 575Science Dr., Madison, ffis.) 中的 GAP、BEST FIT、FASTA 和 TFASTA) ;ClustalW (Intelligenetics (Mountain View,Calif.)的 PC/Gene 程序中的 CLUSTAL,描述于例如 Higgins, Gene73:237-244 (1988) ;Corpet, NucleicAcids Res.16:10881-10890 (1988) ;Huang, Computer Applications in theBiosciences8:155-165(1992);和 Pearson, Methods in Mol.Biol.24:307-331(1994)中;Pfam (Sonnhammer, Nucleic Acids Res.26:322-325 (1998) ;TreeAlign (Hein, MethodsMol.Biol.25:349-364(1994) ; MEG-ALIGN和SAM序列比对计算机程序;或通过肉眼观察进行比对。 [0049]适合用于确定序列相似性的算法的另一个实例是BLAST算法,其被描述于Altschul et al, J.Mol.Biol.215:403—410 (1990)中。Altschul, S.F., et al., (1993)J.Mol.Biol.215:403-410的BLAST程序(基本局部比对搜索工具)在默认参数下搜索与BLAST “GENEMBL”数据库中包含的序列的同一性。使用BLASTN算法在默认参数下可以分析序列与GENEMBL数据库中包含的所有公开可得DNA序列的同一性。
[0050]进行BLAST分析的软件可从美国国家生物技术信息中心(National Center forBiotechnology Information, www.ncb1.nlm.nih.gov/)公开获得;对于 “PowerBLAST” 变体,还可参见Zhang, Genome Res.7:649-656 (1997)。该算法包括首先通过在查询序列中识别如下的长度为W的短字串而识别高得分序列对(HSP):在与数据库序列中相同长度的字串比对时所述短字串匹配或者满足某个正值的阈值T。T称为相邻字串阈值(Altschul etal, J.Mol.Biol.215:403-410(1990)。将这些初始相邻字串命中作为种子用于启动搜索,以发现包含它们的更长HSP。字串命中沿着每条序列在两个方向上延伸,只要累积比对分值可以增加。在每个方向上延伸字串命中停止的条件是:所述累积比对分值从其所达到的最大值下降X量;由于一个或多个负得分残基比对的累积,所述累积分值达到0或小于0 ;或者达到任何一序列末端。所述BLAST算法参数W、T和X决定了所述比对的敏感度和速度。所述BLAST程序使用默认的字长(W) 11、BL0SUM62打分矩阵(参见Henikoff,Proc.Natl.Acad.Sc1.USA89:10915-10919 (1992))比对(B) 50、期望(E) 10、M=5、N=_4 和双链对比。术语BLAST是指可进行两条序列间相似性的统计分析的BLAST算法;参见例如Karlin, Proc.Natl.Acad.Sc1.USA90:5873-5787 (1993)。所述BLAST算法提供的一种相似性量度是最小和概率(P(N)),其提供两条核苷酸序列或氨基酸序列之间随机出现匹配的概率的指示。例如,如果在核酸与参比核酸的对比中最小和概率小于约0.1,更优选小于约0.1,更优选小于约0.01,最优选小于约0.001,那么所述测试核酸被认为与参比序列相似。
[0051]在一个实施方案中,可使用GAP (全局比对程序)。GAP使用Needleman和Wunsch(J.Mol.Biol.48:443-453, 1970)的算法来发现两条完整序列匹配数目最多且缺口数目最少的比对。在常用的Wisco丨ISillPackage⑩(Accelrys, Inc.,San Diego, CA)第 10 版中,
对于蛋白质序列来说,默认的缺口产生惩罚值和缺口延伸惩罚值分别为8和2。对核苷酸序列来说,默认的缺口产生惩罚为50,而默认的缺口延伸惩罚为3。百分比相似性是相似的符号的百分比。忽略越过缺口的符号。当符号对的打分矩阵值大于或者等于0.50(相似性阈值)时,就记录相似性。通用的打分系统是BL0SUM62矩阵(Henikoff and Henikoff, Proteins, 17:49-61 (1993)),其是目前BLAST程序的默认选择。BL0SUM62使用三种矩阵的组合以覆盖全部的偶然性。Altschul, J.Mol.Biol.36:290-300(1993)以引用的方式全文纳入本文,其为Wisconsin软件包_询版本10 (Accelrys, Inc., San Diego, CA)中使用的打分矩阵(参见 Henikoff&Henikoff (1989)Proc.Natl.Acad.Sc1.USA89:10915)。
[0052](c)在两条核酸序列的情形中,本文使用的“序列同一性”或“同一性”是指:在特定的对比窗口上比对获得最大的对应时,所述两条序列中相同的残基。
[0053](d)本文使用的“序列同一性百分比”是指通过比较在对比窗口上两条最佳对比的序列而确定的值,其中,为了最佳比对两条序列,多核苷酸序列的所述部分与参比序列(不含插入或缺失)相比在对比窗口中可 以包含插入或缺失(即缺口)。所述百分比是这样计算的:测定两条序列中出现相同核酸碱基的位置的数目以获得匹配位置的数目,将匹配位置的数目除以对比窗口中的位置总数,再将所述结果乘以100,以获得序列同一性百分比。
[0054]本发明的序列的同一性是指这样的多核苷酸序列:具有至少65%序列同一性,更优选至少70%序列同一丨丨生,更优选至少75%序列同一丨丨生,更优选至少80%同一丨丨生,更优选至少 85%86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 序列同一性。
[0055]可采用与本发明的核酸分子有关的多种测定。对于DNA印迹分析,将DNA用限制性内切酶酶切并在琼脂糖凝胶上分级,以通过分子量分离所述DNA,然后转移至尼龙膜上。然后,将其与以32P (或其他探针标记物)放射性标记的探针片段杂交并在SDS溶液中洗涤。在蛋白质印迹分析中,不是分离DNA,而是提取关注的蛋白质,并将其置于丙烯酰胺凝胶上。然后,将所述蛋白质印迹至膜上并与标记物质接触。参见,例如Hood etal., “Commercial Production of Avidin from Transgenic Maize;Characterizationof Transformants, Production, Processing, Extraction and Purification^MolecularBreeding3:291-306 (1997) ;Towbin et al, (1979) “Electrophoretic transfer ofproteins from polyacrylamide gels to nitrocellulose sheets:procedure and someappIications^Proc Natl Acad Sci USA76(9):4350-4354 ;Renart et al.“Transfer ofproteins from gels to diazobenzyloxymethy1-paper and detection with antisera:amethod for studying antibody specificity and antigen structure,,Proc Natl AcadSci USA76 (7): 3116-3120。在RNA印迹分析中,将RNA分离并分析。
[0056]ELISA或酶联免疫测定自1971年就为人所知。一般而言,将溶解于缓冲液中的抗原涂敷于塑料表面。当加入血清时,抗体可连接于固相上的抗原上。当这些抗体与酶缀合时,可证明它们的存不存在。加入合适的底物将可检测可被定量的结合缀合物的量。常用的ELISA测定使用生物素化的抗(蛋白质)的多克隆抗体和碱性磷酸酶缀合物的测定。例如,用于定量确定漆酶水平的ELISA可以是抗体夹心测定,所述测定利用市售的多克隆兔抗体。所述抗体与碱性磷酸酶缀合用于检测。在另一个实例中,检测胰岛素或胰蛋白酶原的ELISA测定使用了生物素化的胰岛素多克隆抗体或生物素化的胰蛋白酶原多克隆抗体和链霉亲和素-碱性磷酸酶的缀合物。
[0057]前述技术可用于多种情况,在一个实施方案中,其可用于检测植物细胞中核酸分子和/或所编码的多肽的存在情况。例如,可以以多种方式确定所述分子的存在情况,包括使用所述序列的引物或探针、用于检测所编码蛋白质的ELISA测定、用于检测所述蛋白的蛋白质印迹、用于检测RNA或DNA的RNA印迹或DNA印迹、和/或分离序列并测定其与所述核酸分子的百分比同一性或检测可操作连接的标记物的存在情况。此外,可检测双重突变型EPSPS蛋白的存在情况的抗体公开于美国专利7,807,791中,所述专利以引用的方式纳入本文。
[0058]在将核酸插入至细胞中的情形中,术语“引入的”包括转染或转化或转导,包括将核酸纳入至真核细胞或原核细胞中,在这些细胞中所述核酸被纳入至所述细胞的基因组(例如染色体、质粒、质体或线粒体DNA)中,被转移至自主复制子中或被瞬时表达(例如转染的mRNA)。当提及将核苷酸序列引入至植物中时,意在包括转化至所述细胞中,以及将具有所述序列的植物与另一植物杂交,使得第二植物包含所述异源序列,如常规植物育种技术中那样。这种育种技术对于本领域的技术人员是熟知的。对于植物育种技术的详述,参见Poehlman(1995)Breeding Field Crops.AYIPublication C0., WestportConn, 4th Edit。回交法可用于将基因引入植物中。该技术用于将性状引入植物已有数十年。对于该技术和公知的其他植物育种法的描述的实例可在参考文献例如上文的Poelman和Plant BreedingMethodology, edit.Neal Jensen, John ffiley&Sons, Inc.(1988)中找到。在典型的回交方案中,将原始关注的品种(回归亲本)与携带要转移的关注的单基因的第二品种(非回归亲本)杂交。然后,将从该杂交所得的子代与回归亲本再次杂交,并重复该过程直至获得这样的植物:其中,除了来自非回归亲本的单转移的基因以外,在回归亲本中的所需的形态特征或生理特征基本上全部在转化的植物中恢复。
[0059]如本文使用的,当核苷酸区段是指被置于与另一 DNA区段的功能关系中时,它被称为是可操作连接的。例如,如果信号序列的DNA表达参与多肽分泌的前蛋白,则将其可操作地连接至编码所述多肽的DNA上;如果启动子或增强子促进编码序列的转录,则将其可操作地连接至所述序列上。通常,可操作连接的DNA序列是连续的,在信号序列的情形中,其是连续的并且在阅读相中。然而,增强子不需要与其控制转录的编码序列连续。连接通过在方便的限制位点或插入代替其的连接物(adapter )或接头处进行连接来实现。表达盒除包括启动子外可以包括一个或多个增强子。增强子意欲是指可提高启动子的利用的顺式作用序列。这种增强子可以是基 因的天然增强子或者来自异源基因的增强子。此外,现认为一些启动子可包含一个或多个天然增强子或类增强子元件。一个这类增强子的实例是35S增强子,其可以是单增强子或者是双增强子。参见,例如McPherson et al、美国专利5,322,938。
[0060]广义上,本文使用的术语植物包括处于发育任何阶段的植物或植物部分,包括植物插条、植物细胞、植物细胞培养物、植物器官、植物种子和小植物(plantlet)。植物细胞是植物的结构和生理单元,包括原生质体和细胞壁。植物细胞可以为如下的形式:分离的单细胞或细胞的集合体(例如易碎的愈伤组织)或培养的细胞,或者可以是更高组织的单元(例如植物组织、植物器官或植物)的部分。因此,植物细胞可以是原生质体、配子生成细胞或者可再生成完整植物的细胞的细胞或集合物。因此,包含多种植物细胞且能够再生成完整植物的种子被认为是用于本公开的目的的植物细胞。植物组织或植物器官可以是种子、原生质体、愈伤组织,或者是可形成结构或功能单元的任何其他植物细胞群。植物中尤其有用的部分包括可收获的部分和用于繁殖子代植物的部分。植物的可收获部分可以是植物的任何有用部分,例如花、花粉、幼苗、块茎、叶、茎、果实、种子、根等。对繁殖有用的植物部分包括种子、果实、插条、幼苗、块茎、根状茎等。组织培养物优选能够再生具有前述近交玉米植物的生理特征和形态特征的植物,和能够再生具有与前述近交玉米植物基本相同的基因型的植物。优选地,在这种组织培养物中的可再生细胞会是胚、原生质体、分生细胞、愈伤组织、花粉、叶、花药、根、根尖、穗丝(silk)、花、核、穗(ear)、穗轴(cob)、外壳(husk)或茎。此外,本发明还提供了从本发明的组织培养物中再生得到的植物。
[0061]构建体是通过多种技术插入至细胞基因组中的遗传材料包。
[0062]本文使用的术语载体广义上是指编码外源核酸的任何质粒或病毒。植物分子生物学中常用的载体的实例是双元载体,其可被设计为包含构建体,参见Bevan M., (1984)Nucl.Acids Res.,12(22):8711-8721。所述术语也应被理解为包括有助于将核酸转移至病毒体或细胞中的非质粒和非病毒化合物,例如聚赖氨酸化合物等。所述载体可以是适于作为用于将核酸或其突变体递送至细胞的递送载体的病毒载体,或者所述载体可以是适用于同样目的的非病毒载体。用于将DNA递送至细胞或组织的病毒载体或非病毒载体的实例是本领域熟知的,并被描述于例如Ma et al.(1997, Proc.Natl.Acad.Sc1.U.S.A.94:12744-12746)中。病毒载体的实例包括但不限于重组痘苗病毒、重组腺病毒、重组反转录病毒、重组腺伴随病毒、重组禽痘病毒等(Cranage et al.,1986,EMBOJ.5:3057-3063 ;国际专利申请N0.W094/17810,公开于1984年8月18日;国际专利申请N0.W094/23744,公开于1994年10月27日)。非病毒载体的实例包括但不限于脂质体、DNA的多胺衍生物等。
`[0063]一般而言,可用于构建重组基因(任选包括改进表达的多种修饰)的方法在细节上可能不同。但是,常规采用的方法包括PCR扩增,或重叠、互补的合成寡核苷酸的设计和合成,所述合成寡核苷酸可退火并连接在一起,以产生具有方便限制性位点的基因,用于从另一已克隆的来源克隆或亚克隆或者从文库中克隆。对于分子生物学家来说,所涉及的方法是标准方法(Sambrook et al., 1989.Molecular Cloning:A Laboratory Manual, 2ndEdition.Cold Spring Harbor Laboratory Press, Plainview, NY)。
[0064]在本发明的方法中,可采用指导基因在植物中表达的多个启动子。这种启动子可选自组成型启动子、化学调控启动子、可诱导启动子、组织特异性启动子、种子优先的启动子。组成型启动子包括例如核心CaMV35S启动子(Odell et al.(1985)Nature313:810-812);水稻肌动蛋白(McElroyet al.(1990)Plant Cell2:163-171);玉米泛素(美国专利 5,510,474 ;Christensen et al.(1989)Plant Mol.Biol.12:619-632和 Christensen et al.(1992)Plant Mol.Biol.18:675-689) ;pEMU (Last et al.(1991)Theor.Appl.Genet.81:581-588) ;MAS (Velten et al.(1984)EMBO J.3:2723-2730),Rsyn7启动子的核心启动子以及公开于W099/43838和美国专利6,072,050中的其他组成型启动子;水稻肌动蛋白(McElroy et al.(1990) Plant Cell2:163-171) ;pEMU(Last et al.(1991) Theor.Appl.Genet.81:581-588) ;MAS (Velten et al.(1984)EMBO J.3:2723-2730) ;ALS启动子(美国专利5,659,026);水稻肌动蛋白启动子(美国专利 5, 641, 876 ;W000/70067 );玉米组蛋白启动子(Chabouteet al.Plant MolecularBiology, 8:179-191 (1987),Brignon et al.,Plant Mol Bio22(6):1007-1015 (1993);Rasco-Gaunt et al., Plant Cell R印? 21 (6): 569-576 (2003))等。其他组成型启动子包括例如美国专利 5,608,149,5, 608,144,5, 604,121,5, 569,597,5, 466,785,5, 399,680、5,268,463 和 5,608,142。
[0065]可用的植物相容性启动子的范围包括组织特异性启动子和可诱导启动子。可诱导调控元件是这样的元件:在响应诱导物时能够直接地或间接地激活一条或多条DNA序列或基因的转录。在缺乏诱导物的情况下,将不会转录所述DNA序列和基因。通常,特异性结合可诱导调控元件以激活转录的蛋白因子以无活性形式存在,随后其被所述诱导物直接或间接转化为活性形式。所述诱导物可以是化学试剂例如蛋白质、代谢物、生长调节剂、除草剂或酚类化合物,或者是由热、冷、盐或毒性元素直接施加的生理应激或通过病原体或致病物(例如病毒)的作用间接施加的生理应激。通常,特异性结合可诱导调控元件以激活转录的蛋白因子以无活性形式存在,随后其被诱导物直接或间接转化为活性形式。所述诱导物可以是化学试剂例如蛋白质、代谢物、生长调节剂、除草剂或酚类化合物,或者由热、冷、盐或毒性元素直接施加的生理应激或通过病原体或致病物(例如病毒)的作用间接施加的生理应激。含有可诱导调控元件的植物细胞可通过对所述细胞或植物外部施用所述诱导物,例如通过喷洒、浇水、加热或类似的方法,来使其暴露于诱导物下。
[0066]任何的可诱导启动子都可用于本发明。参见Ward et al.Plant Mol.Bio1.22:361-366 (1993)。示例性的可诱导启动子包括蜕皮激素受体启动子(美国专利6,504,082);对铜响应的来自 ACEl 系统的启动子(Mett et al.PNAS90:4567-4571 (1993));对苯磺酰胺除草剂安全剂响应的来自玉米的In2-1基因和In2-2基因(美国专利5, 364, 780 ;Hershey et al.,Mol.Gen.Genetics227:229-237(1991)和 Gatz et al., Mol.Gen.Genetics243:32-38 (1994));来自 TnlO 的 Tet 阻抑物(Gatz et al.,Mol.Gen.Genet.227:229-237 (1991);或来自类固醇基因,其转录活性由糖皮质类固醇激素诱导(Schena et al., Proc.Natl.Acad.Sc1.U.S.A.88:10421 (1991));玉米 GST 启动子,由用作萌前除草剂的疏水性亲电子化合物激活;以及烟草PR-1a启动子,由水杨酸激活。其他关注的化学调控的启动子包括响应留类化合物的启动子(参见,例如Schena etal.(1991)Proc.Natl.Acad.Sc1.USA88:10421-10425 和 McNellis et al.(1998)PlantJ.14(2):247-257中糖皮质激素诱导的启动子)和四环素诱导的启动子和四环素抑制的启动子(参见,例如 Gatz et al.(1991)Mol.Gen.Genet.227:229-237 和美国专利 5,814,618和 5,789,156)。
[0067]冷响应调控元件或热休克调控元件,其转录分别受对暴露于冷或热反应的影响(Takahashi et al., Plant Physiol.99:383-390,1992);醇脱氢酶基因的启动子(Gerlachet al., PNAS USA79:2981-2985 (1982) ;ffalker et al.,PNAS84(19):6624-6628 (1987)),其由厌氧条件诱导;以及来自豌豆rbcS基因或豌豆psaDb基因的光诱导启动子(Yamamoto et al.(1997) Plant J.12 ⑵:255-265);光诱导调控兀件(Feinbaum etal.,Mol.Gen.Genet.226:449,1991;Lam and ChuajScience248:471,1990 ;Matsuokaet al.(1993)Proc.Natl.Acad.Sc1.USA90 (20):9586-9590 ;Orozco et al.(1993)Plant Mol.Bi0.23 (6): 1129-1138);植物激素诱导的调控兀件(Yamaguch1-Shinozakiet al.,Plant Mol.Biol.15:905, 1990 ;Kares et al.,Plant Mol.Biol.15:225,1990)等。可诱导调控元件也可以是玉米In2-1基因或In2-2基因的可响应苯磺酰胺除草剂安全剂的启动子(Hershey et al.,Mol.Gen.Gene.227:229-237,1991; Gatz et al.,Mol.Gen.Genet.243:32-38,1994),和转座子 TnlO 的 Tet 阻抑物(Gatz et al.,Mol.Gen.Genet.227:229-237,1991)。应激诱导的启动子包括盐/水应激诱导的启动子,例如P5CS(Zang et al.(1997)Plant Sciencesl29:81-89);冷诱导启动子,例如 corl5a (Hajelaet al.(1990)Plant Physiol.93:1246-1252)、corl5b (Wlihelm et al.(1993)Plant MolBiol23:1073-1077).wscl20(0uellet et al.(1998)FEBS Lett.423-324-328).ci7(Kirchet al.(1997)Plant Mol Biol.33:897-909)、ci21A (Schneider et al.(1997)PlantPhysiol.113:335-45);干旱诱导启动子,例如 Trg-31 (Chaudhary et al (1996)Plant Mol.Biol.30:1247-57)、rd29 ( Kasuga et al.(1999) Nature Biotechnology 18:287-291);渗透诱导启动子,例如 Rabl7 (Vilardell et al.(1991)Plant Mol.Biol.17:985-93)和渗透蛋白(Raghothama et al.(1993)Plant Mol Biol23:1117-28);和热诱导启动子,例如热休克蛋白(Barros et al.(1992)Plant Mol.19:665-75 ;Marrs et al.(1993)Dev.Genet.14:27-41)、smHSP (Waters et al.(1996)J.Experimental Botany47:325-338)和来自欧芹泛素启动子的热休克诱导元件(W003/102198)。其他应激诱导启动子包括rip2(美国专利 5,332,808 和美国公开 N0.2003/0217393)和 rd29a (Yamaguch1-Shinozaki etal.(1993)Mol.Gen.Genetics236:331-340)。一些启动子可通过创伤诱导,包括土壤杆菌(Agrobacterium) pmas 启动子(Guevara-Garcia et al.(1993)Plant J.4 (3):495-505)和土壤杆菌 0RF13 启动子(Hansen et al.,(1997)Mol.Gen.Genet.254(3):337-343)。
[0068]组织优先的启动子可用于在特定的植物组织中靶向增强的转录和/或表达。当提及优先表达时,是指在与在其他植物组织中相比在特定植物组织中以更高的水平表达。这种类型的启动子的实例包括种子优先表达,例如由菜豆蛋白启动子(Bustoset al.1989.The Plant Cell Vol.1,839-853)和玉米球蛋白-1 基因(Belanger,etal.1991Geneticsl29:863-972)提供的。对于双子叶植物,种子优先的启动子包括但不限于大豆菜豆蛋白、油菜籽蛋白、伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)等。对于单子叶植物,种子优先的启动子包括但不限于玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、Y _玉米醇溶蛋白、waxy、shrunkenUshrunken2、球蛋白I等。种子优先的启动子还包括主要对种子中的特定组织指导基因表达的启动子,例如Y-玉米醇溶蛋白的胚乳优先的启动子、来自烟草的隐蔽性启动子(Fobert et al.1994.T-DNA tagging of a seed coat-specific cryptic promoter intobacc0.Plant J.4:567-577)、来自玉米的 P-基因启动子(Chopra et al.1996.Allelesof the maize P gene with distinct tissue specificities encode Myb-homo1gousproteins with C—terminal replacements.Plant Ce 117:1149-1158, Erratum inPlant Cell.1997,1:109)、来自玉米的球蛋白-1 启动子(Belenger and Kriz.1991.Molecular basis for Allelic Polymorphism of the maize Globulin-lgene.Geneticsl29:863-972)和对种皮或玉米籽粒外皮指导表达的启动子,例如果皮特异性谷氨酉先胺合成酶启动子(Muhitch et al.,2002.1solation of a Promoter SequenceFrom the Glutamine Synthetase1^Gene Capable of Conferring Tissue-SpecificGene Expression in Transgenic Maize.Plant Sciencel63:865-872),GenBank 登录号AF359511。
[0069]可以包括载体的其他元件,这也取决于基因的拟定用途。实例包括选择标记物、靶序列或调控序列、转运肽序列例如优化的转运肽序列(参见美国专利5,510,471)稳定序列例如 RB7MAR (参见,Thompson and Myatt,(1997)Plant Mol.Biol.,34:687-692and W09727207)或前导序列、内含子等。植物表达载体和报告基因的一般性描述和实例可在 Gruber,et al.,“Vectors for Plant Transformation” inMethod in Plant Molecular Biology and Biotechnology,Glick et al eds;CRC Presspp.89-119 (1993)中找到。合适的表达载体的选择将取决于宿主和将所述表达载体引入所述宿主的方法。表达盒在关注的异源核苷酸序列的3 ‘末端还包括在植物中有功能的转录终止区或翻译终止区。所述终止区可以是本发明的启动子核苷酸序列天然的,可以是关注的DNA序列天然的,或者可以来自其他来源。方便的终止区可获自农杆菌(A.tumefaciens)的T1-质粒,例如章鱼碱合酶和胭脂碱合酶(nos)终止区(Depickeret al., Mol.and Appl.Genet.1:561-573 (1982)和 Shaw et al.(1984) Nucleic AcidsResearch vol.12,N0.20pp7831_7846 (nos))。还可参见,Guerineau et al.Mol.Gen.Genet.262:141-144 (1991) ;Proudfoot,Cell64:671-674 (1991) ;Sanfacon et al.GenesDev.5:141-149(1991) ;Mogen et al.Plant Cell2:1261-1272 (1990) ;Munroe etal.Gene91:151-158 (1990) ;Ballas et al.Nucleic Acids Res.17:7891-7903 (1989);Joshi et al.Nucleic Acid Res.15:9627-9639(1987)。
[0070]用于选择转染细胞或`组织或植物部分或植物的报告基因和标记物基因可包括在转化载体中。可选择标记物的实例包括可赋予对抗代谢物(例如除草剂或抗体)的抗性的标记物,例如可赋予对甲氨蝶呤的抗性的二氢叶酸还原酶(Reiss,Plant Physiol.(Life Sc1.Adv.) 13:143-149,1994 ;也可参见 Herrera Estrella et al.,Nature303:209-213,1983;Meijer et al.,Plant Mol.Biol.16:807-820,1991);可赋予对氨基糖甙类的新霉素、卡那霉素和巴龙霉素的抗性的新霉素磷酸转移酶(Herrera-Estrella,EMBOJ.2:987-995,1983 和 Fraley et al.Proc.Natl.Acad.Sci USA80:4803 (1983))和可赋予对潮霉素的抗性的潮霉素磷酸转移酶(Marsh,Gene32:481-485,1984 ;还可参见 Waldron et al.,Plant Mol.Biol.5:103-108, 1985 ;Zhijian et al.,PlantSciencel08:219-227, 1995);使细胞利用吲哚代替色氨酸的trpB ;使细胞利用histinol代替组氨酸的 hisD (Hartman, Proc.Natl.Acad.Sc1.,USA85:8047,1988);使细胞利用甘露糖的甘露糖-6-磷酸异构酶(W094/20627);可赋予对鸟氨酸脱羧酶抑制剂2_( 二氟甲基)-DL-鸟氨酸(DFMO)的抗性的鸟氨酸脱羧酶(McConlogue,1987,In:CurrentCommunications in Molecular Biology, Cold Spring Harbor Laboratoryed.);和可赋予对杀稻痕素S的抗性的来自土曲霉(Aspergillus terreus)的脱氨酶(Tamura,Biosc1.Biotechnol.Biochem.59:2336-2338,1995)。其他的选择标记物包括例如可赋予对草甘膦的抗性的突变型 EPSP 合酶(Hinchee et al.,BioTechnology91:915-922,1998)、可赋予对咪唑啉酮的抗性或对磺酰脲的抗性的突变型乙酰乳酸合酶(Lee et al.,EMBOJ.7:1241-1248,1988)、可赋予对莠去净(atrazine)的抗性的突变型psbA (Smeda etal.,Plant Physiol.103:911-917,1993)或突变型初卟啉原氧化酶(参见美国专利N0.5,767,373)或可赋予对除草剂(例如草铵膦)的抗性的其他标记物。合适的可选择标记基因的实例包括但不限于编码对以下物质的抗性的基因:氯霉素(Herrera Estrella etal., EMBO J.2:987-992,1983)、链霉素(Jones et al.,Mol.Gen.Genet.210:86-91,1987)、壮观霉素(Bretagne-Sagnard et al., Transgenic Res.5:131-137,1996)、博来霉素(Hille et al., Plant Mol.Biol.7:171-176,1990)、氨横酸(Guerineau et al., PlantMol.Biol.15:127-136,1990)、溴苯腈(Stalker et al.,Science242:419-423,1988)、草甘勝(Shaw et al.,Science233:478-481,1986)、草丁 勝(DeBlock et al., EMBOJ.6:2513-2518, 1987)等。使用选择基因的一个选项是草铵膦抗性编码DNA,在一个实施方案中,可以是CaMV35S启动子或泛素启动子控制下的草丁膦乙酰转移酶(PAT)基因、优化的玉米PAT基因或bar基因。所述基因赋予对双丙氨酰膦的抗性(参见,Wohllebenetal., (1988)Gene70:25-37) ;Gordon-Kamm et al., Plant Cell2:603;1990;Uchimiya etal.,BioTechnologyll:835, 1993 ;White et al., Nucl.Acids Res.18:1062, 1990;Spenceret al., Theor.Appl.Genet.79:625-631, 1990 ;和 Anzai et al., Mol.Gen.Gen.219:492, 1989)。PAT基因的一个版本是描述于美国专利N0.6,096, 947中的优化的玉米PAT基因。
[0071]此外,可采用这样的标记物,即其有助于鉴定含有编码所述标记物的核苷酸的植物细胞。当所述序列的存在可产生可测定的产物并可无需破坏植物细胞而产生产物时,可评分(Scorable)或可筛选的标记物是有用的。实例包括(6-葡糖醛酸糖苷酶或UidA基因(GUS),所述UidA基因编码已知有多种显色底物的酶(例如,美国专利5,268,463 和 5,599,670);氯霉素乙酰转移酶(Jefferson et al.The EMBO Journalvol.6N0.13pp.3901-3907);碱性磷 酸酶。在优选的实施方案中,所使用的标记物是P _胡萝卜素或前维生素A (Ye et al,Science287:303-305-(2000))。所述基因已被用于增强水稻的营养,但是在此实例中,其被改用作筛选标记物,连接关注的基因的所述基因可通过其提供的金黄色来检测。与所述基因被用于其为植物贡献营养的情况不同,仅需要较少量的蛋白质。通常,其他筛选标记物包括花色素苷/黄酮类化合物基因(参见
Taylor and Briggs, The Plant Cell (1990) 2:115-127 中的讨论)-包括例如 R-基因
座基因,该基因编码可调控植物组织中花青素苷色素(红色)产生的产物(Dellaporta etal., in Chromosome Structure and Function, Kluwer Academic Publishers, Appelsand Gustafson eds.,pp.263-282 (1988));控制黄酮类色素生物合成的基因,例如玉米Cl基因(Kao et al., Plant Cell(1996)8:1171-1179 ;Scheffler et al.Mol.Gen.Genet.(1994) 242:40-48 )和玉米 C2 (ffienand et al.,Mol.Gen.Genet.(1986) 203:202_207);B 基因(Chandler et al., Plant Cell (1989) 1:1175-1183) ;pl 基因(Grotewold et al, Proc.Natl.Acad.Sci USA(1991)88:4587-4591 ;Grotewold et al.,Cell (1994)76:543-553 ;Sidorenko et al., Plant Mol.Biol.(1999) 39:11-19) ;bronze 基因座基因(Ralston etal.,Genetics(1988) 119:185-197 ;Nash et al.,Plant Cell(1990)2(11):1039-1049)等。适合的标记物的其他实例包括青色荧光蛋白(CYP)基因(Bolte et al.(2004) J.CellSciencell7:943-54and Kato et al.(2002)Plant Physioll29:913_42)、黄色荧光蛋白基因(来自 Evrogen 的 PHIYFP? ;参见 Bolte et al.(2004) J.Cell Sciencell7:943_54);编码荧光素酶的Iux基因,所述荧光素酶的存在情况可使用X光片、闪烁计数法、荧光分光光度法、低照度摄像机、光子计数照相机或多孔发光测定法(multiwell Iuminometry)检测(Teeri et al.(1989)EMBO J.8:343);绿色荧光蛋白(GFP)基因(Sheen et al., PlantJ.(1995)8(5):777-84);和DsRed2,用该标记物基因转化的植物细胞是红色的,因此可用视觉选择(Dietrich et al.(2002) Biotechniques2 (2): 286-293)。其他实例包括 3_内酰胺酶基因(Sutcliffe, Proc.Nat’ 1.Acad.Sc1.U.S.A.(1978) 75:3737),该基因编码已知存在多种显色底物(例如PADAC,显色头孢霉素)的酶;xylE基因(Zukowsky et al.,Proc.Nat’ 1.Acad.Sc1.U.S.A.(1983)80:1101),该基因编码可转化显色儿茶酚的儿茶酚双加氧酶;a -淀粉酶基因(Ikuta et al., Biotech.(1990)8:241);和酪氨酸酶基因(Katz etal., J.Gen.Microbiol.(1983) 129:2703),该基因编码能够将酪氨酸氧化为DOPA和多巴醌(其可进而浓缩以形成易于检测的化合物黑色素)的酶。明显的是,本领域技术人员可获得许多这类标记物。[0072]表达盒可另外地包括5 ‘前导序列。这种前导序列可以发挥作用以增强翻译。翻译前导序列在本领域是已知的,包括例如小RNA病毒前导序列、EMCV前导序列(脑心肌炎病毒 5 ‘非编码区,Elroy-Stein et al.Proc.Nat.Acad.Sc1.USA86:6126-6130 (1989);马铃薯Y病毒组前导序列,例如TEV前导序列(烟草蚀纹病毒),Carrington and FreedJournal of Virology, 64:1590-1597 (1990), MDMV 前导序列(玉米矮花叶病毒),Allisonet al.;Virologyl54:9_20 (1986);人免疫球蛋白重链结合蛋白(BiP), Macejak etal.Nature353:90-94 (1991);来自苜蓿花叶病毒外壳蛋白mRNA (AMV RNA4)的非翻译前导序列,Jobling et al.Nature325:622-625 (1987);烟草花叶病毒前导序列(TMV),Gallieet al.(1989)Molecular Biology of RNA, pages237_256 ;和玉米裡绿斑驳病毒前导序列(MCMV), Lommel et al.Virology81:382-385 (1991)。还参见 Della-Cioppa et al.PlantPhysiology84:965-968(1987)。
[0073]所述构建体还可以包括增强翻译和/或mRNA稳定性的序列例如内含子。一个这类内含子的实例是拟南芥(Arabidopsis thaliana)组蛋白H3.1II变体的基因II的第一内含子。Chaubet et al.Journal of Molecular Biology, 225:569-574(1992)。
[0074]在需要使异源核苷酸序列表达的产物定位至特定的细胞器(尤其是质体、造粉体)或定位至内质网或在细胞表面或细胞外分泌的情况中,表达盒还可包括转运肽的编码序列。这种转运肽在本领域是已知的,包括但不限于酰基载体蛋白、RUBISC0的小亚基、植物EPSP合酶的转运妝和向日葵(Heilianthus annus)(参见Lebrun et al.美国专利 5,510,417)、玉米(Zea mays) Brittle-1 叶绿体转运妝(Nelson et al.PlantPhysiol117 (4):1235-1252 (1998) ;SulIivan et al.Plant Cell3 (12):1337-48 ;Sullivan et al.,Planta (1995) 196(3):477-84 ;Sullivan et al.,J.Biol.Chem.(1992) 267 (26): 18999-9004)等。此外,嵌合转运肽是本领域已知的,例如优化的转运肽(参见,美国专利5,510,471)。本领域技术人员会容易理解,在将产物表达至特定细胞器的过程中可用的多种选择。例如,大麦a淀粉酶经常被用于指导表达至内质网(Rogers, J.Biol.Chem.260:3731-3738 (1985))。转运肽的使用是公知的(例如,参见美国专利5,717,084、5,728,925)。
[0075]任选地,可将本发明的核苷酸序列与另一关注的核苷酸序列结合。术语“关注的核苷酸序列”是指这样的核酸分子(其也被称为多核苷酸):可以是RNA分子以及DNA分子,可以是编码所需多肽或蛋白质的分子,所述术语还可以是指不构成整个基因且不一定编码多肽或蛋白质的核酸分子(例如启动子)。例如,可将本发明的核酸分子与另一核酸分子结合或“堆叠”,所述另一核酸分子可提供对草甘膦或其他除草剂的另外的抗性或耐受性,和/或可提供对选择昆虫或疾病的抗性,和/或增强的营养,和/或改进的农艺特性,和/或可用于饲料、食物、工业、制药或其他用途的蛋白质或其他产物。在植物基因组内含有构建体的核酸的堆叠可通过植物育种、转基因植物的再转化,或者通过同源重组的靶向整合加入新性状来实现。
[0076]这种核苷酸序列包括但不限于下面提供的这些实例:
[0077]1.可赋予对害虫或疾病的抗性的基因或编码序列(例如,iRNA)。
[0078](A)植物疾病抗性基因。植物防卫经常由植物中疾病抗性基因(R)的产物和病原体中相应的无毒(Avr)基因的产物之间的特异性相互作用激活。可以用克隆的抗性基因来转化植物变种以设计抗特定病原体株的植物。这种基因的实例包括用于抗黄枝孢霉(Cladosporium fulvum)的番爺 Cf_9 基因(Jones et al.,1994Science266:789)、用于抗丁香假单胞菌(Pseudomonas syringae)番爺致病变种的编码蛋白激酶的番爺Pto基因(Martin et al.,1993Science262:1432)和用于抗丁香假单胞菌的拟南芥RSSP2基因(Mindrinos et al.,1994Cell78:1089)。
[0079](B).苏芸金芽胞杆菌(Bacillus thuringiensis)蛋白、其衍生物或以其为模型的合成多肽,例如Bt 8 -内毒素基因的核苷酸序列(Geiser et al., 1986Gene48:109)和营养期杀虫(VIP)基因(参见,例如 Estruch et al.(1996) Proc.Natl.Acad.Sc1.93:5389-94)。此外,编码S -内毒素基因的DNA分子可从美国典型培养物保藏中心(American TypeCulture Collection)购得,ATCC 登录号为 40098,67136,31995 和 31998。
[0080](C)凝集素,例如多个君子兰(Clivia miniata)甘露糖结合凝集素基因的核苷酸序列(Van Damme et al., 1994Plant Molec.Biol.24:825)。
[0081](D)维生素结合蛋白,例如抗生素蛋白和用作抗虫害的杀幼虫剂的抗生素蛋白同系物。参见美国专利N0.5,659,026。
[0082](E)酶抑制剂,例如蛋白酶抑制剂或淀粉酶抑制剂。这类基因的实例包括水稻半胱氨酸蛋白酶抑制剂(Abe et al.,1987J.Biol.Chem.262:16793)、烟草蛋白酶抑制剂 I (Huub et al., 1993Plant Molec.Biol.21:985)和 a -淀粉酶抑制剂 Sumitani etal., 1993Biosc1.Biotech.Biochem.57:1243)。
[0083](F)昆虫特异性的激素或信息素例如蜕皮甾类和保幼激素其变体、基于其的模仿物或者其拮抗物或激动剂,例如杆状病毒表达的克隆的保幼激素酯酶(一种保幼激素的灭活剂)(Hammock et al.,1990Nature344:458)。
[0084](G)昆虫特异性肽或神经肽,其在表达时破坏受影响的害虫的生理机能。J.Biol.Chem.269:9。这类基因的实例包括昆虫利尿激素受体(Regan, 1994),太平洋折翅蠊(Diploptera punctata)中鉴定的allostatin (Pratt, 1989)、昆虫特异性麻痹性神经毒素(美国专利 N0.5,266,361)。
[0085](H)自然界中蛇、黄蜂等产生的昆虫特异性毒液,例如蝎子虫毒肽(Pang, 1992Genell6:165)。
[0086](I)使得单萜、倍半萜、留醇、氧肟酸、苯丙素衍生物或具有杀虫活性的另一非蛋白质分子超积累的酶。
[0087](J)参与生物活性分子的修饰(包括翻译后修饰)的酶;例如:天然的或合成的糖酵解酶、蛋白水解酶、脂肪分解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶。这种基因的实例包括callas基因(PCT公开的申请W093/02197)、几丁质酶编码序列(例如,可以从ATCC获得,登录号为3999637和 67152)、烟草钩虫几丁质酶(Kramer et al.,1993Insect Molec.Biol.23:691)和欧芹ubi4_2 多聚泛素蛋白基因(Kawalleck et al., 1993Plant Molec.Biol.21:673)。
[0088](K)促进信号转导的分子。这类分子的实例包括绿豆钙调蛋白cDNA克隆的核苷酸序列(Botella et al., 1994Plant Molec.Biol.24:757)和玉米钙调蛋白 cDNA 克隆的核苷酸序列(Griess et al., 1994Plant Physiol.104:1467)。
[0089](L)疏水性moment肽。参见美国专利N0.5,659,026和5,607, 914,后者教导了可赋予疾病抗 性的合成抗微生物肽。
[0090](M)膜通透酶,通道形成剂(channel former)或通道阻滞剂,例如可使得转基因番爺植物抗青枯假单胞菌(Pseudomonas solanacearum)的杀菌肽裂解肽类似物(Jayneset al., 1993Plant Sc1.89:43)。
[0091](N)病毒侵入性蛋白或从其衍生出的复合毒素。例如,转化的植物细胞中病毒外壳蛋白的累积给予对受从中获得外壳蛋白的病毒以及相关病毒影响的病毒感染和/或疾病发生的抗性。已经对转化植物赋予了外壳蛋白介导的对以下病毒的抗性:苜蓿花叶病毒、黄瓜花叶病毒、烟草线条病毒、马铃薯X病毒、马铃薯Y病毒、烟草蚀纹病毒、烟草格格病毒和烟草花叶病毒。参见,例如 Beachy et al.(1990)Ann.Rev.Phytopathol.28:451。
[0092](0)昆虫特异性抗体或从其衍生的免疫毒素。因此,靶向昆虫肠道中关键代谢功能的抗体会使受影响的酶失活,杀死昆虫。例如,Taylor et al.(1994)Abstract#497, SeventhInf I。关于分子植物-微生物相互作用的专题论文表明通过产生单链抗体片段使转基因烟草中的酶失活。
[0093](P)病毒特异性抗体。参见,例如,Tavladoraki et al.(1993) Nature266:469,该文献表明表达重组抗体基因的转基因植物可免受病毒攻击。
[0094](Q)自然界中由病原体或寄生虫产生的发育停滞蛋白。因此,真菌内切a-l,4_D多聚半乳糖醛酸酶通过溶解植物细胞壁同型a -1, 4-D-半乳糖醛酸酶有利于真菌定植和植物营养素释放(Lamb et al.,1992) Bio/TechnologylO: 1436。克隆和鉴定编码大豆多聚半乳糖醛酸内切酶抑制蛋白的基因描述于Toubart et al (1992Plant J.2:367)中。
[0095](R)自然界中由植物产生的发育停滞蛋白,例如大麦核糖体失活基因具有增强的真菌疾病抗性(Longemann et al.,1992) ? Bio/TechnologylO: 3305。
[0096](S)其中RNA分子用于抑制靶基因表达的RNA干扰。在一个实例中,RNA分子部分或全部为双链,其可引发沉默反应,导致dsRNA被切割成小干扰RNA,随后所述小干扰RNA被纳入至可破坏同源mRNA的祀复合体中。参见,例如,Fire et al.,美国专利
6,506, 559; Graham et al.6,573,099。
[0097]2.可赋予对除草剂的抗性的基因
[0098](A)编码对抑制生长点或分生组织的除草剂(例如咪唑酮类或磺酰脲)的抗性或耐受性的基因。该类别中的示例性基因编码突变型乙酰乳酸合酶(ALS) (Lee et
al., 1988EMB0J.7:1241)-也被称为乙酰羟酸合酶(AHAS) (Miki et al., 1990Theor.Appl.Genet.80:449)。
[0099](B)编码草甘膦抗性或耐受性的一个或多个其他基因,所述草甘膦抗性或耐受性由突变型EPSP合酶和aroA基因给予,或由基因例如GAT (草甘膦乙酰转移酶或GOX (草甘膦氧化酶)和其他膦酰化合物例如草铵膦(PAT基因和bar基因),和pyridinoxy或苯氧基丙酸和环己二酮(ACC酶抑制剂编码基因)通过代谢失活给予。参见,例如,美国专利N0.4,940,835,该专利公开了可赋予草甘膦抗性的EPSPS形式的核苷酸序列。编码突变型aroA基因的DNA分子可以以ATCC登录号39256获得,所述突变型基因的核苷酸序列公开在美国专利N0.4,769,061中。欧洲专利申请N0.0333033和美国专利N0.4,975,374公开了可赋予对除草剂(例如L-草丁膦)的抗性的谷氨酰胺合酶基因的核苷酸序列。草丁膦乙酰转移酶基因的核苷酸序列提供在欧洲申请N0.0242246中。De Greef et al.(1989)Bio/Technology?:61描述了可表达编码草丁膦乙酰转移酶活性的嵌合bar基因的转基因植物的产生。可赋予对苯氧基丙酸抗性和环己二酮(例如稀禾定和吡氟氯禾灵)的抗性的示例性基因是描述在 Marshall et al.(1992)Theor.Appl.Genet.83:435 中的 Accl-Sl 基因、Accl-S2基因和Accl_S3基因。
[0100](C)编码对可抑制光合作用的除草剂例如三嗪(psbA基因和gs+基因)和氰苯(腈水解酶基因)的抗性或耐受性的基因。Przibilla et al.(1991)Plant Cell3:169描述了使用编码突变型psbA基因的质粒来转化衣滴虫(Chlamydomonas)。腈水解酶基因的核苷酸序列公开在美国专利N0.4,810, 648中,含有这些基
查看更多专利详情

下载专利文献

下载专利