用于乳腺癌治疗和诊断的组合物及其应用方法_专利（乳腺癌,诊断,组合）-早鸽网

早鸽—汇聚行业精英

注册

联系客服
帮助中心
投诉举报
关注微信

您的问题早鸽都有答案

3000+专业顾问

搜索

咨询

早鸽首页专利号查询用于乳腺癌治疗和诊断的组合物及其应用方法

用于乳腺癌治疗和诊断的组合物及其应用方法

专利名称

用于乳腺癌治疗和诊断的组合物及其应用方法
发明者
公开日
申请日期
优先权日
申请人
文档编号
关键字

乳腺癌诊断组合治疗用于
技术领域

本发明普遍涉及用于治疗乳腺癌的组合物和方法本发明更具体地涉及含有在乳腺癌组织中优先表达的蛋白质的至少一部分的多肽，及编码这些多肽的多核苷酸这些多肽和多核苷酸可在用于治疗乳腺癌的疫苗和药用组合物中使用
背景技术

专利详情
全文pdf
权力要求
说明书
法律状态

专利名称：用于乳腺癌治疗和诊断的组合物及其应用方法在美国和全世界，乳腺癌对于妇女是一个重要的健康问题。尽管该疾病的检测和治疗已经有进展，但乳腺癌仍是妇女中癌症相关死亡的第二个主要原因，在美国每年影响到超过180000名的妇女。对于北美洲的妇女，一生中患乳腺癌的机会为八分之一。当前没有用于预防或治疗乳腺癌的疫苗或其他普遍成功的方法。疾病的处理目前依靠早期诊断(通过常规乳腺检查过程)和攻击性治疗的组合，这可包括多种治疗如手术、放射治疗、化学治疗和激素治疗的一种或多种。特定乳腺癌的治疗过程通常根据多种预后参数选择，包括对特异肿瘤标志物的分析。参见，例如，Porter-Jordan和Lippman，乳腺癌(Breast Cancer)873-100(1994)。然而，应用明确的标志物通常导致难以解释的结果，在乳腺癌患者中观察到的高死亡率表明该疾病的治疗、诊断和预防需要提高。因此，本领域中需要改进治疗和诊断乳腺癌的方法。本发明满足了这些需要，并进一步提供了其他相关优点。发明概述本发明提供用于癌症如乳腺癌治疗和诊断的组合物和方法。一方面，提供了分离的多肽，其含有乳腺肿瘤蛋白或其变体的至少一部分。某些部分和其他变体是免疫原性的，使该变体与蛋白质特异抗血清反应的能力基本不减弱。在某些实施方案中，该多肽含有一种由选自下列的多核苷酸编码的氨基酸序列(a)SEQ ID NO1-61，63-175，178，180，182-313，320-324，342，353，366-368，377，382，385，389，395，397，400，408，411，413，414，416，417，419-423，426，427，429，431，435-438，441，443-446，450，453，454和463-468中所示的核苷酸序列；(b)所述核苷酸序列的互补序列；和(c)(a)或(b)的序列的变体。在具体实施方案中，本发明的多肽含有肿瘤抗原的至少一部分，其含有选自SEQ ID NO62、176、179、181和469-473的氨基酸序列。在相关方面，提供了编码上述多肽的分离的多核苷酸，或其部分(如编码乳腺肿瘤蛋白的至少15个连续氨基酸残基的一部分)。在具体实施方案中，这些多核苷酸含有一种序列，其选自SEQ ID NO1-61，63-175，178，180，182-313，320-324，342，353，366-368，377，382，385，389，395，397，400，408，411，413，414，416，417，419-423，426，427，429，431，435-438，441，443-446，450，453，454和463-468中所示的序列及其变体。本发明进一步提供含有上述多核苷酸的表达载体，以及用这些表达载体转化或转染的宿主细胞。在优选实施方案中，宿主细胞选自大肠杆菌、酵母和哺乳动物细胞。另一方面，本发明提供含有第一种和第二种本发明的多肽，或一种本发明的多肽和一种已知乳腺肿瘤抗原的融合蛋白。本发明也提供含有至少一种上述多肽，或编码这种多肽的多核苷酸，和生理学可接受的载体的药用组合物，以及疫苗。为了预防或治疗用途，含有至少一种这样的多肽或多核苷酸以及一种免疫刺激剂。也提供了含有一种或多种上述融合蛋白的药用组合物和疫苗。本发明进一步提供了含有下列成分的药用组合物(a)一种可与乳腺肿瘤蛋白特异结合的抗体或其抗原结合片段；和(b)一种生理学可接受的载体。
在其他方面，本发明提供含有下列成分的药用组合物(a)一种表达如上所述的多肽的抗原递呈细胞；和(b)一种药学可接受的载体或赋形剂。抗原递呈细胞包括树突细胞、巨噬细胞、单核细胞、成纤维细胞和B细胞。
在相关方面，提供了含有下列成分的疫苗(a)一种表达如上所述的多肽的抗原递呈细胞；和(b)一种免疫刺激剂。
在另一方面，提供了抑制患者乳腺癌发展的方法，包括施用有效量的至少一种上述药用组合物和/或疫苗。
在一个方面，本发明还提供从生物学样品中除去肿瘤细胞的方法，包括使生物学样品接触可与乳腺肿瘤蛋白特异反应的T细胞，其中在足以从样品中去除表达该蛋白质的细胞的条件下和时间内进行接触步骤。
在相关方面，提供抑制患者癌症发展的方法，包括向患者施用一种如上所述处理的生物学样品。
在其他方面，还提供了刺激和/或扩展乳腺肿瘤蛋白特异的T细胞的方法，包括在足以刺激和/或扩展T细胞的条件下和时间内使T细胞接触下列之一或多种(i)如上所述的多肽；(ii)编码这种多肽的多核苷酸；和/或(iii)表达这种多肽的抗原递呈细胞。也提供了含有如上所述制备的T细胞的分离的T细胞群体。
在其他方面，本发明提供了抑制患者癌症发展的方法，包括对患者施用有效量的如上所述的T细胞群体。
本发明还提供抑制患者癌症发展的方法，包括下列步骤(a)使自患者分离的CD4+和/或CD8+T细胞与下列一种或多种一起温育(i)含有乳腺肿瘤蛋白的至少一种免疫原性部分的一种多肽；(ii)编码这种多肽的多核苷酸；和(iii)表达这种多肽的抗原递呈细胞；和(b)对患者施用有效量的增殖T细胞，从而抑制患者癌症的发展。增殖的细胞可以但不必在对患者施用前克隆。
此处公开的多肽可用于乳腺癌的诊断和监测。在本发明的一个方面，提供了检测患者癌症的方法，其包括(a)使自患者获得的生物学样品接触能与上述多肽之一结合的结合剂；和(b)检测样品中可与该结合剂结合的多肽的量；和(c)将多肽量与预定的阈值(cut-offvalue)相比较，从而确定患者中癌症的存在与否。在优选实施方案中，结合剂是一种抗体，最优选地是一种单克隆抗体。癌症可以是乳腺癌。
在有关方面，提供了监测患者癌症进展的方法，包括(a)使自患者获得的生物学样品接触能与上述多肽之一结合的结合剂；(b)检测样品中可与该结合剂结合的多肽的量；(c)使用在随后的时间点从患者获得的生物学样品重复步骤(a)和(b)；和(d)比较步骤(b)和(c)中检测的多肽的量。
在有关方面，本发明提供可与本发明的多肽结合的抗体，优选地单克隆抗体，以及含有这些抗体的诊断试剂盒，和使用这些抗体抑制乳腺癌发展的方法。
在其他方面，本发明还提供确定患者中癌症存在与否的方法，包括下列步骤(a)使自患者获得的生物学样品接触能与编码乳腺肿瘤蛋白的多核苷酸杂交的寡核苷酸；(b)检测样品中可与该寡核苷酸杂交的多核苷酸、优选地mRNA的水平；和(c)将可与该寡核苷酸杂交的多核苷酸水平与预定的阈值相比较，从而确定患者中癌症的存在与否。在某些实施方案中，通过聚合酶链反应检测mRNA的量，例如使用至少一种可与编码上述多肽的多核苷酸或这种多核苷酸的互补序列杂交的寡核苷酸引物。在其他实施方案中，用杂交技术检测mRNA的量，其中使用一种可与编码上述多肽的多核苷酸或这种多核苷酸的互补序列杂交的寡核苷酸探针。
在有关方面，提供含有上述寡核苷酸探针或引物的诊断试剂盒。
在参考下列详述后，本发明的这些和其他方面将成为显然的。此处公开的所有参考文献在此均完整引用作为参考。
附图简述与序列表

图1显示克隆SYN18C6的Northern印迹的结果(SEQ ID NO40)。
SEQ ID NO1是确定的JBT2的cDNA序列。
SEQ ID NO2是确定的JBT6的cDNA序列。
SEQ ID NO3是确定的JBT7的cDNA序列。
SEQ ID NO4是确定的JBT10的cDNA序列。
SEQ ID NO5是确定的JBT13的cDNA序列。
SEQ ID NO6是确定的JBT14的cDNA序列。
SEQ ID NO7是确定的JBT15的cDNA序列。
SEQ ID NO8是确定的JBT16的cDNA序列。
SEQ ID NO9是确定的JBT17的cDNA序列。
SEQ ID NO10是确定的JBT22的cDNA序列。
SEQ ID NO11是确定的JBT25的cDNA序列。
SEQ ID NO12是确定的JBT28的cDNA序列。
SEQ ID NO13是确定的JBT32的cDNA序列。
SEQ ID NO14是确定的JBT33的cDNA序列。
SEQ ID NO15是确定的JBT34的cDNA序列。
SEQ ID NO16是确定的JBT36的cDNA序列。
SEQ ID NO17是确定的JBT37的cDNA序列。
SEQ ID NO18是确定的JBT51的cDNA序列。
SEQ ID NO19是确定的JBTT1的cDNA序列。
SEQ ID NO20是确定的JBTT7的cDNA序列。
SEQ ID NO21是确定的JBTT11的cDNA序列。
SEQ ID NO22是确定的JBTT14的cDNA序列。
SEQ ID NO23是确定的JBTT18的cDNA序列。
SEQ ID NO24是确定的JBTT19的cDNA序列。
SEQ ID NO25是确定的JBTT20的cDNA序列。
SEQ ID NO26是确定的JBTT21的cDNA序列。
SEQ ID NO27是确定的JBTT22的cDNA序列。
SEQ ID NO28是确定的JBTT28的cDNA序列。
SEQ ID NO29是确定的JBTT29的cDNA序列。
SEQ ID NO30是确定的JBTT33的cDNA序列。
SEQ ID NO31是确定的JBTT37的cDNA序列。
SEQ ID NO32是确定的JBTT38的cDNA序列。
SEQ ID NO33是确定的JBTT47的cDNA序列。
SEQ ID NO34是确定的JBTT48的cDNA序列。
SEQ ID NO35是确定的JBTT50的cDNA序列。
SEQ ID NO36是确定的JBTT51的cDNA序列。
SEQ ID NO37是确定的JBTT52的cDNA序列。
SEQ ID NO38是确定的JBTT54的cDNA序列。
SEQ ID NO39是确定的SYN17F4的cDNA序列。
SEQ ID NO40是确定的SYN18C6的cDNA序列。
SEQ ID NO41是确定的SYN19A2的cDNA序列。
SEQ ID NO42是确定的SYN19C8的cDNA序列。
SEQ ID NO43是确定的SYN20A12的cDNA序列。
SEQ ID NO44是确定的SYN20G6的cDNA序列。
SEQ ID NO45是确定的SYN20G6-2的cDNA序列。
SEQ ID NO46是确定的SYN21B9的cDNA序列。
SEQ ID NO47是确定的SYN21B9-2的cDNA序列。
SEQ ID NO48是确定的SYN21C10的cDNA序列。
SEQ ID NO49是确定的SYN21G10的cDNA序列。
SEQ ID NO50是确定的SYN21G10-2的cDNA序列。
SEQ ID NO51是确定的SYN21G11的cDNA序列。
SEQ ID NO52是确定的SYN21G11-2的cDNA序列。
SEQ ID NO53是确定的SYN21H8的cDNA序列。
SEQ ID NO54是确定的SYN22A10的cDNA序列。
SEQ ID NO55是确定的SYN22A10-2的cDNA序列。
SEQ ID NO56是确定的SYN22A12的cDNA序列。
SEQ ID NO57是确定的SYN22A2的cDNA序列。
SEQ ID NO58是确定的SYN22B4的cDNA序列。
SEQ ID NO59是确定的SYN22C2的cDNA序列。
SEQ ID NO60是确定的SYN22E10的cDNA序列。
SEQ ID NO61是确定的SYN22F2的cDNA序列。
SEQ ID NO62是确定的SYN18C6的cDNA序列。
SEQ ID NO63是确定的B723P的cDNA序列。
SEQ ID NO64是确定的B724P的cDNA序列。
SEQ ID NO65是确定的B770P的cDNA序列。
SEQ ID NO66是确定的B716P的cDNA序列。
SEQ ID NO67是确定的B725P的cDNA序列。
SEQ ID NO68是确定的B717P的cDNA序列。
SEQ ID NO69是确定的B771P的cDNA序列。
SEQ ID NO70是确定的B722P的cDNA序列。
SEQ ID NO71是确定的B726P的cDNA序列。
SEQ ID NO72是确定的B727P的cDNA序列。
SEQ ID NO73是确定的B728P的cDNA序列。
SEQ ID NO74-87是与已知序列显示同源性的分离克隆的确定的cDNA序列。
SEQ ID NO88是确定的13053的cDNA序列。
SEQ ID NO89是确定的13057的cDNA序列。
SEQ ID NO90是确定的13059的cDNA序列。
SEQ ID NO91是确定的13065的cDNA序列。
SEQ ID NO92是确定的13067的cDNA序列。
SEQ ID NO93是确定的13068的cDNA序列。
SEQ ID NO94是确定的13071的cDNA序列。
SEQ ID NO95是确定的13072的cDNA序列。
SEQ ID NO96是确定的13073的cDNA序列。
SEQ ID NO97是确定的13075的cDNA序列。
SEQ ID NO98是确定的13078的cDNA序列。
SEQ ID NO99是确定的13079的cDNA序列。
SEQ ID NO100是确定的13081的cDNA序列。
SEQ ID NO101是确定的13082的cDNA序列。
SEQ ID NO102是确定的13092的cDNA序列。
SEQ ID NO103是确定的13097的cDNA序列。
SEQ ID NO104是确定的13101的cDNA序列。
SEQ ID NO105是确定的13102的cDNA序列。
SEQ ID NO106是确定的13119的cDNA序列。
SEQ ID NO107是确定的13131的cDNA序列。
SEQ ID NO108是确定的13133的cDNA序列。
SEQ ID NO109是确定的13135的cDNA序列。
SEQ ID NO110是确定的13139的cDNA序列。
SEQ ID NO111是确定的13140的cDNA序列。
SEQ ID NO112是确定的13146的cDNA序列。
SEQ ID NO113是确定的13147的cDNA序列。
SEQ ID NO114是确定的13148的cDNA序列。
SEQ ID NO115是确定的13149的cDNA序列。
SEQ ID NO116是确定的13151的cDNA序列。
SEQ ID NO117是确定的13051的cDNA序列。
SEQ ID NO118是确定的13052的cDNA序列。
SEQ ID NO119是确定的13055的cDNA序列。
SEQ ID NO120是确定的13058的cDNA序列。
SEQ ID NO121是确定的13062的cDNA序列。
SEQ ID NO122是确定的13064的cDNA序列。
SEQ ID NO123是确定的13080的cDNA序列。
SEQ ID NO124是确定的13093的cDNA序列。
SEQ ID NO125是确定的13094的cDNA序列。
SEQ ID NO126是确定的13095的cDNA序列。
SEQ ID NO127是确定的13096的cDNA序列。
SEQ ID NO128是确定的13099的cDNA序列。
SEQ ID NO129是确定的13100的cDNA序列。
SEQ ID NO130是确定的13103的cDNA序列。
SEQ ID NO131是确定的13106的cDNA序列。
SEQ ID NO132是确定的13107的cDNA序列。
SEQ ID NO133是确定的13108的cDNA序列。
SEQ ID NO134是确定的13121的cDNA序列。
SEQ ID NO135是确定的13126的cDNA序列。
SEQ ID NO136是确定的13129的cDNA序列。
SEQ ID NO137是确定的13130的cDNA序列。
SEQ ID NO138是确定的13134的cDNA序列。
SEQ ID NO139是确定的13141的cDNA序列。
SEQ ID NO140是确定的13142的cDNA序列。
SEQ ID NO141是确定的14376的cDNA序列。
SEQ ID NO142是确定的14377的cDNA序列。
SEQ ID NO143是确定的14383的cDNA序列。
SEQ ID NO144是确定的14384的cDNA序列。
SEQ ID NO145是确定的14387的cDNA序列。
SEQ ID NO146是确定的14392的cDNA序列。
SEQ ID NO147是确定的14394的cDNA序列。
SEQ ID NO148是确定的14398的cDNA序列。
SEQ ID NO149是确定的14401的cDNA序列。
SEQ ID NO150是确定的14402的cDNA序列。
SEQ ID NO151是确定的14405的cDNA序列。
SEQ ID NO152是确定的14409的cDNA序列。
SEQ ID NO153是确定的14412的cDNA序列。
SEQ ID NO154是确定的14414的cDNA序列。
SEQ ID NO155是确定的14415的cDNA序列。
SEQ ID NO156是确定的14416的cDNA序列。
SEQ ID NO157是确定的14419的cDNA序列。
SEQ ID NO158是确定的14426的cDNA序列。
SEQ ID NO159是确定的14427的cDNA序列。
SEQ ID NO160是确定的14375的cDNA序列。
SEQ ID NO161是确定的14378的cDNA序列。
SEQ ID NO162是确定的14379的cDNA序列。
SEQ ID NO163是确定的14380的cDNA序列。
SEQ ID NO164是确定的14381的cDNA序列。
SEQ ID NO165是确定的14382的cDNA序列。
SEQ ID NO166是确定的14388的cDNA序列。
SEQ ID NO167是确定的14399的cDNA序列。
SEQ ID NO168是确定的14406的cDNA序列。
SEQ ID NO169是确定的14407的cDNA序列。
SEQ ID NO170是确定的14408的cDNA序列。
SEQ ID NO171是确定的14417的cDNA序列。
SEQ ID NO172是确定的14418的cDNA序列。
SEQ ID NO173是确定的14423的cDNA序列。
SEQ ID NO174是确定的14424的cDNA序列。
SEQ ID NO175是确定的B726P-20的cDNA序列。
SEQ ID NO176是预测的B726P-20的氨基酸序列。
SEQ ID NO177是一种PCR引物。
SEQ ID NO178是确定的B726P-74的cDNA序列。
SEQ ID NO179是预测的B726P-74的氨基酸序列。
SEQ ID NO180是确定的B726P-79的cDNA序列。
SEQ ID NO181是预测的B726P-79的氨基酸序列。
SEQ ID NO182是确定的19439.1的cDNA序列，显示与mammaglobin基因有同源性。
SEQ ID NO183是确定的19407.1的cDNA序列，显示与人角蛋白基因有同源性。
SEQ ID NO184是确定的19428.1的cDNA序列，显示与人染色体17克隆有同源性。
SEQ ID NO185是确定的B808P(19408)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO186是确定的19460.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO187是确定的19419.1的cDNA序列，显示与Igκ轻链有同源性。
SEQ ID NO188是确定的19411.1的cDNA序列，显示与人α-1胶原蛋白有同源性。
SEQ ID NO189是确定的19420.1的cDNA序列，显示与mus肌蛋白酶-3有同源性。
SEQ ID NO190是确定的19432.1的cDNA序列，显示与人高迁移组盒有同源性。
SEQ ID NO191是确定的19412.1的cDNA序列，显示与人纤溶酶原激活物基因有同源性。
SEQ ID NO192是确定的19415.1的cDNA序列，显示与有丝分裂原活化蛋白激酶有同源性。
SEQ ID NO193是确定的19409.1的cDNA序列，显示与硫酸软骨素蛋白聚糖蛋白有同源性。
SEQ ID NO194是确定的19406.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO195是确定的19421.1的cDNA序列，显示与人纤连蛋白有同源性。
SEQ ID NO196是确定的19426.1的cDNA序列，显示与视黄酸受体效应器3有同源性。
SEQ ID NO197是确定的19425.1的cDNA序列，显示与MyD88mRNA有同源性。
SEQ ID NO198是确定的19424.1的cDNA序列，显示与肽转运蛋白(TAP-1)mRNA有同源性。
SEQ ID NO199是确定的19429.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO200是确定的19435.1的cDNA序列，显示与人多形上皮粘蛋白有同源性。
SEQ ID NO201是确定的B813P(19434.1)的cDNA序列，显示与人GATA-3转录因子有同源性。
SEQ ID NO202是确定的19461.1的cDNA序列，显示与人AP-2基因有同源性。
SEQ ID NO203是确定的19450.1的cDNA序列，显示与DNA结合调节因子有同源性。
SEQ ID NO204是确定的19451.1的cDNA序列，显示与Na/H交换调节辅因子有同源性。
SEQ ID NO205是确定的19462.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO206是确定的19455.1的cDNA序列，显示与人组蛋白HAS.ZmRNA有同源性。
SEQ ID NO207是确定的19459.1的cDNA序列，显示与PAC克隆179N16有同源性。
SEQ ID NO208是确定的19464.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO209是确定的19414.1的cDNA序列，显示与Iipophilin B有同源性。
SEQ ID NO210是确定的19413.1的cDNA序列，显示与染色体17克隆hRPK.209_J_20有同源性。
SEQ ID NO211是确定的19416.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO212是确定的19437.1的cDNA序列，显示与人克隆24976mRNA有同源性。
SEQ ID NO213是确定的19449.1的cDNA序列，显示与鼠PGM核心蛋白DNA有同源性。
SEQ ID NO214是确定的19446.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO215是确定的19452.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO216是确定的19483.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO217是确定的19526.1的cDNA序列，显示与人IipophilinC有同源性。
SEQ ID NO218是确定的19484.1的cDNA序列，显示与分泌的胶粘腺蛋白XAG-2有同源性。
SEQ ID NO219是确定的19470.1的cDNA序列，显示与任何已知基因无显著有同源性。
SEQ ID NO220是确定的19469.1的cDNA序列，显示与人HLA-DM基因有同源性。
SEQ ID NO221是确定的19482.1的cDNA序列，显示与人pS2蛋白基因有同源性。
SEQ ID NO222是确定的B805P(19468.1)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO223是确定的19467.1的cDNA序列，显示与人血小板反应蛋白mRNA有同源性。
SEQ ID NO224是确定的19498.1的cDNA序列，显示与参与细胞周期控制的CDC2基因有同源性。
SEQ ID NO225是确定的19506.1的cDNA序列，显示与人TREB蛋白cDNA有同源性。
SEQ ID NO226是确定的B806P(19505.1)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO227是确定的19486.1的cDNA序列，显示与I型表皮角蛋白有同源性。
SEQ ID NO228是确定的19510.1的cDNA序列，显示与糖蛋白的葡萄糖转运蛋白有同源性。
SEQ ID NO229是确定的19512.1的cDNA序列，显示与人赖氨酰羟化酶基因有同源性。
SEQ ID NO230是确定的19511.1的cDNA序列，显示与人palimotoyl蛋白硫酯酶有同源性。
SEQ ID NO231是确定的19508.1的cDNA序列，显示与人α烯醇酶有同源性。
SEQ ID NO232是确定的B807P(19509.1)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO233是确定的B809P(19520.1)的cDNA序列，显示与染色体11q13.31上的克隆102D24有同源性。
SEQ ID NO234是确定的19507.1的cDNA序列，显示与toprosomeβ亚基有同源性。
SEQ ID NO235是确定的19525.1的cDNA序列，显示与人尿激酶原前体有同源性。
SEQ ID NO236是确定的19513.1的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO237是确定的19517.1的cDNA序列，显示与人PAC128M19克隆有同源性。
SEQ ID NO238是确定的19564.1的cDNA序列，显示与人细胞色素P450-IIB有同源性。
SEQ ID NO239是确定的19553.1的cDNA序列，显示与人GABA-A受体pi亚基有同源性。
SEQ ID NO240是确定的B811P(19575.1)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO241是确定的B810P(19560.1)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO242是确定的19588.1的cDNA序列，显示与主动脉羧肽酶样蛋白有同源性。
SEQ ID NO243是确定的19551.1的cDNA序列，显示与人BCL-1基因有同源性。
SEQ ID NO244是确定的19567.1的cDNA序列，显示与人蛋白酶体相关mRNA有同源性。
SEQ ID NO245是确定的B803P(19583.1)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO246是确定的B812P(19587.1)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO247是确定的B802P(19392.2)的cDNA序列，显示与人染色体17有同源性。
SEQ ID NO248是确定的19393.2的cDNA序列，显示与人nicein B2链有同源性。
SEQ ID NO249是确定的19398.2的cDNA序列，显示与人MHC II类DQαmRNA有同源性。
SEQ ID NO250是确定的B804P(19399.2)的cDNA序列，显示与人Xp22 BAC GSHB-184P14有同源性。
SEQ ID NO251是确定的19401.2的cDNA序列，显示与人ikB激酶-b基因有同源性。
SEQ ID NO252是确定的20266的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO253是确定的B826P(20270)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO254是确定的20274的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO255是确定的20276的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO256是确定的20277的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO257是确定的B823P(20280)的cDNA序列，显示与任何已知基因无显著同源性。。
SEQ ID NO258是确定的B821P(20281)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO259是确定的B824P(20294)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO260是确定的20303的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO261是确定的B820P(20310)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO262是确定的B825P(20336)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO263是确定的B827P(20341)的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO264是确定的20941的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO265是确定的20954的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO266是确定的20961的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO267是确定的20965的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO268是确定的20975的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO269是确定的20261的cDNA序列，显示与人p120连环蛋白有同源性。
SEQ ID NO270是确定的B822P(20262)的cDNA序列，显示与人膜糖蛋白4F2有同源性。
SEQ ID NO271是确定的20265的cDNA序列，显示与人Na，K-ATPaseα1有同源性。
SEQ ID NO272是确定的20267的cDNA序列，显示与人心脏HS90部分cds有同源性。
SEQ ID NO273是确定的20268的cDNA序列，显示与人mRNA GPI-锚定蛋白p137有同源性。
SEQ ID NO274是确定的20271的cDNA序列，显示与人切割刺激因子77kDa亚基有同源性。
SEQ ID NO275是确定的20272的cDNA序列，显示与人p190-B有同源性。
SEQ ID NO276是确定的20273的cDNA序列，显示与人核糖体结合糖蛋白有同源性。
SEQ ID NO277是确定的20278的cDNA序列，显示与人鸟氨酸氨基转移酶有同源性。
SEQ ID NO278是确定的20279的cDNA序列，显示与人S-腺苷甲硫氨酸合成酶有同源性。
SEQ ID NO279是确定的20293的cDNA序列，显示与人x灭活转录物有同源性。
SEQ ID NO280是确定的20300的cDNA序列，显示与人细胞色素p450有同源性。
SEQ ID NO281是确定的20305的cDNA序列，显示与人延伸因子-1α有同源性。
SEQ ID NO282是确定的20306的cDNA序列，显示与人上皮ets蛋白有同源性。
SEQ ID NO283是确定的20307的cDNA序列，显示与人信号转导蛋白mRNA有同源性。
SEQ ID NO284是确定的20313的cDNA序列，显示与人GABA-A受体pi亚基mRNA有同源性。
SEQ ID NO285是确定的20317的cDNA序列，显示与人酪氨酸磷酸酶有同源性。
SEQ ID NO286是确定的20318的cDNA序列，显示与人组织蛋白酶B有同源性。
SEQ ID NO287是确定的20320的cDNA序列，显示与人2-磷酸丙酮酸水合酶α烯醇化酶有同源性。
SEQ ID NO288是确定的20321的cDNA序列，显示与人E-钙粘着蛋白有同源性。
SEQ ID NO289是确定的20322的cDNA序列，显示与人hsp86有同源性。
SEQ ID NO290是确定的B828P(20326)的cDNA序列，显示与人x灭活转录物有同源性。
SEQ ID NO291是确定的20333的cDNA序列，显示与人染色质调节剂SMARCA5有同源性。
SEQ ID NO292是确定的20335的cDNA序列，显示与人鞘脂激活蛋白1有同源性。
SEQ ID NO293是确定的20337的cDNA序列，显示与人肝细胞生长因子激活剂抑制剂2型有同源性。
SEQ ID NO294是确定的20338的cDNA序列，显示与人细胞粘附分子CD44有同源性。
SEQ ID NO295是确定的20340的cDNA序列，显示与人类核因子(红细胞产生的)1有同源性。
SEQ ID NO296是确定的20938的cDNA序列，显示与人粘着斑蛋白mRNA有同源性。
SEQ ID NO297是确定的20939的cDNA序列，显示与人延伸因子EF-1-α有同源性。
SEQ ID NO298是确定的20940的cDNA序列，显示与人nestin基因有同源性。
SEQ ID NO299是确定的20942的cDNA序列，显示与人胰核糖核酸酶有同源性。
SEQ ID NO300是确定的20943的cDNA序列，显示与人钴胺传递蛋白I有同源性。
SEQ ID NO301是确定的20944的cDNA序列，显示与人β-微管蛋白有同源性。
SEQ ID NO302是确定的20946的cDNA序列，显示与人HS1蛋白有同源性。
SEQ ID NO303是确定的20947的cDNA序列，显示与人组织蛋白酶B有同源性。
SEQ ID NO304是确定的20948的cDNA序列，显示与人睾丸增强基因转录物有同源性。
SEQ ID NO305是确定的20949的cDNA序列，显示与人延伸因子EF-1-α有同源性。
SEQ ID NO306是确定的20950的cDNA序列，显示与人ADP-核糖基化因子3有同源性。
SEQ ID NO307是确定的20951的cDNA序列，显示与人色氨酰-tRNA合成酶IFP53或WRS有同源性。
SEQ ID NO308是确定的20952的cDNA序列，显示与人细胞周期蛋白依赖的蛋白激酶有同源性。
SEQ ID NO308是确定的20957的cDNA序列，显示与人α-微管蛋白同工型1有同源性。
SEQ ID NO309是确定的20959的cDNA序列，显示与人酪氨酸磷酸酶-61bp缺失有同源性。
SEQ ID NO310是确定的20966的cDNA序列，显示与人酪氨酸磷酸酶有同源性。
SEQ ID NO311是确定的B830P(20976)的cDNA序列，显示与人核因子NF45有同源性。
SEQ ID NO312是确定的B829P(20977)的cDNA序列，显示与人delta-6脂肪酸去饱和酶有同源性。
SEQ ID NO313是确定的20978的cDNA序列，显示与人核顺乌头酸酶有同源性。
SEQ ID NO314是确定的19465的cDNA序列，显示与任何已知基因无显著同源性。
SEQ ID NO315是克隆23176的确定的cDNA序列。
SEQ ID NO316是克隆23140的确定的cDNA序列。
SEQ ID NO317是克隆23166的确定的cDNA序列。
SEQ ID NO318是克隆23167的确定的cDNA序列。
SEQ ID NO319是克隆23177的确定的cDNA序列。
SEQ ID NO320是克隆23217的确定的cDNA序列。
SEQ ID NO321是克隆23169的确定的cDNA序列。
SEQ ID NO322是克隆23160的确定的cDNA序列。
SEQ ID NO323是克隆23182的确定的cDNA序列。
SEQ ID NO324是克隆23232的确定的cDNA序列。
SEQ ID NO325是克隆23203的确定的cDNA序列。
SEQ ID NO326是克隆23198的确定的cDNA序列。
SEQ ID NO327是克隆23224的确定的cDNA序列。
SEQ ID NO328是克隆23142的确定的cDNA序列。
SEQ ID NO329是克隆23138的确定的cDNA序列。
SEQ ID NO330是克隆23147的确定的cDNA序列。
SEQ ID NO331是克隆23148的确定的cDNA序列。
SEQ ID NO332是克隆23149的确定的cDNA序列。
SEQ ID NO333是克隆23172的确定的cDNA序列。
SEQ ID NO334是克隆23158的确定的cDNA序列。
SEQ ID NO335是克隆23156的确定的cDNA序列。
SEQ ID NO336是克隆23221的确定的cDNA序列。
SEQ ID NO337是克隆23223的确定的cDNA序列。
SEQ ID NO338是克隆23155的确定的cDNA序列。
SEQ ID NO339是克隆23225的确定的cDNA序列。
SEQ ID NO340是克隆23226的确定的cDNA序列。
SEQ ID NO341是克隆23228的确定的cDNA序列。
SEQ ID NO342是克隆23229的确定的cDNA序列。
SEQ ID NO343是克隆23231的确定的cDNA序列。
SEQ ID NO344是克隆23154的确定的cDNA序列。
SEQ ID NO345是克隆23157的确定的cDNA序列。
SEQ ID NO346是克隆23153的确定的cDNA序列。
SEQ ID NO347是克隆23159的确定的cDNA序列。
SEQ ID NO348是克隆23152的确定的cDNA序列。
SEQ ID NO349是克隆23161的确定的cDNA序列。
SEQ ID NO350是克隆23162的确定的cDNA序列。
SEQ ID NO351是克隆23163的确定的cDNA序列。
SEQ ID NO352是克隆23164的确定的cDNA序列。
SEQ ID NO353是克隆23165的确定的cDNA序列。
SEQ ID NO354是克隆23151的确定的cDNA序列。
SEQ ID NO355是克隆23150的确定的cDNA序列。
SEQ ID NO356是克隆23168的确定的cDNA序列。
SEQ ID NO357是克隆23146的确定的cDNA序列。
SEQ ID NO358是克隆23170的确定的cDNA序列。
SEQ ID NO359是克隆23171的确定的cDNA序列。
SEQ ID NO360是克隆23145的确定的cDNA序列。
SEQ ID NO361是克隆23174的确定的cDNA序列。
SEQ ID NO362是克隆23175的确定的cDNA序列。
SEQ ID NO363是克隆23144的确定的cDNA序列。
SEQ ID NO364是克隆23178的确定的cDNA序列。
SEQ ID NO365是克隆23179的确定的cDNA序列。
SEQ ID NO366是克隆23180的确定的cDNA序列。
SEQ ID NO367是克隆23181的确定的cDNA序列。
SEQ ID NO368是克隆23143的确定的cDNA序列。
SEQ ID NO369是克隆23183的确定的cDNA序列。
SEQ ID NO370是克隆23184的确定的cDNA序列。
SEQ ID NO371是克隆23185的确定的cDNA序列。
SEQ ID NO372是克隆23186的确定的cDNA序列。
SEQ ID NO373是克隆23187的确定的cDNA序列。
SEQ ID NO374是克隆23190的确定的cDNA序列。
SEQ ID NO375是克隆23189的确定的cDNA序列。
SEQ ID NO376是克隆23202的确定的cDNA序列。
SEQ ID NO378是克隆23191的确定的cDNA序列。
SEQ ID NO379是克隆23188的确定的cDNA序列。
SEQ ID NO380是克隆23194的确定的cDNA序列。
SEQ ID NO381是克隆23196的确定的cDNA序列。
SEQ ID NO382是克隆23195的确定的cDNA序列。
SEQ ID NO383是克隆23193的确定的cDNA序列。
SEQ ID NO384是克隆23199的确定的cDNA序列。
SEQ ID NO385是克隆23200的确定的cDNA序列。
SEQ ID NO386是克隆23192的确定的cDNA序列。
SEQ ID NO387是克隆23201的确定的cDNA序列。
SEQ ID NO388是克隆23141的确定的cDNA序列。
SEQ ID NO389是克隆23139的确定的cDNA序列。
SEQ ID NO390是克隆23204的确定的cDNA序列。
SEQ ID NO391是克隆23205的确定的cDNA序列。
SEQ ID NO392是克隆23206的确定的cDNA序列。
SEQ ID NO393是克隆23207的确定的cDNA序列。
SEQ ID NO394是克隆23208的确定的cDNA序列。
SEQ ID NO395是克隆23209的确定的cDNA序列。
SEQ ID NO396是克隆23210的确定的cDNA序列。
SEQ ID NO397是克隆23211的确定的cDNA序列。
SEQ ID NO398是克隆23212的确定的cDNA序列。
SEQ ID NO399是克隆23214的确定的cDNA序列。
SEQ ID NO400是克隆23215的确定的cDNA序列。
SEQ ID NO401是克隆23216的确定的cDNA序列。
SEQ ID NO402是克隆23137的确定的cDNA序列。
SEQ ID NO403是克隆23218的确定的cDNA序列。
SEQ ID NO404是克隆23220的确定的cDNA序列。
SEQ ID NO405是克隆19462的确定的cDNA序列。
SEQ ID NO406是克隆19430的确定的cDNA序列。
SEQ ID NO407是克隆19407的确定的cDNA序列。
SEQ ID NO408是克隆19448的确定的cDNA序列。
SEQ ID NO409是克隆19447的确定的cDNA序列。
SEQ ID NO410是克隆19426的确定的cDNA序列。
SEQ ID NO411是克隆19441的确定的cDNA序列。
SEQ ID NO412是克隆19454的确定的cDNA序列。
SEQ ID NO413是克隆19463的确定的cDNA序列。
SEQ ID NO414是克隆19419的确定的cDNA序列。
SEQ ID NO415是克隆19434的确定的cDNA序列。
SEQ ID NO416是克隆B820P的确定的延伸cDNA序列。
SEQ ID NO417是克隆B821P的确定的延伸cDNA序列。
SEQ ID NO418是克隆B822P的确定的延伸cDNA序列。
SEQ ID NO419是克隆B823P的确定的延伸cDNA序列。
SEQ ID NO420是克隆B824P的确定的延伸cDNA序列。
SEQ ID NO421是克隆B825P的确定的延伸cDNA序列。
SEQ ID NO422是克隆B826P的确定的延伸cDNA序列。
SEQ ID NO423是克隆B827P的确定的延伸cDNA序列。
SEQ ID NO424是克隆B828P的确定的延伸cDNA序列。
SEQ ID NO425是克隆B829P的确定的延伸cDNA序列。
SEQ ID NO426是克隆B830P的确定的延伸cDNA序列。
SEQ ID NO427是克隆266B4的确定的cDNA序列。
SEQ ID NO428是克隆22892的确定的cDNA序列。
SEQ ID NO429是克隆266G3的确定的cDNA序列。
SEQ ID NO430是克隆22890的确定的cDNA序列。
SEQ ID NO431是克隆264B4的确定的cDNA序列。
SEQ ID NO432是克隆22883的确定的cDNA序列。
SEQ ID NO433是克隆22882的确定的cDNA序列。
SEQ ID NO434是克隆22880的确定的cDNA序列。
SEQ ID NO435是克隆263G1的确定的cDNA序列。
SEQ ID NO436是克隆263G6的确定的cDNA序列。
SEQ ID NO437是克隆262B2的确定的cDNA序列。
SEQ ID NO438是克隆262B6的确定的cDNA序列。
SEQ ID NO439是克隆22869的确定的cDNA序列。
SEQ ID NO440是克隆21374的确定的cDNA序列。
SEQ ID NO441是克隆21362的确定的cDNA序列。
SEQ ID NO442是克隆21349的确定的cDNA序列。
SEQ ID NO443是克隆21309的确定的cDNA序列。
SEQ ID NO444是克隆21097的确定的cDNA序列。
SEQ ID NO445是克隆21096的确定的cDNA序列。
SEQ ID NO446是克隆21094的确定的cDNA序列。
SEQ ID NO447是克隆21093的确定的cDNA序列。
SEQ ID NO448是克隆21091的确定的cDNA序列。
SEQ ID NO449是克隆21089的确定的cDNA序列。
SEQ ID NO450是克隆21087的确定的cDNA序列。
SEQ ID NO451是克隆21085的确定的cDNA序列。
SEQ ID NO452是克隆21084的确定的cDNA序列。
SEQ ID NO453是克隆2BT1-40的第一部分cDNA序列。
SEQ ID NO454是克隆2BT1-40的第二部分cDNA序列。
SEQ ID NO455是克隆21063的确定的cDNA序列。
SEQ ID NO456是克隆21062的确定的cDNA序列。
SEQ ID NO457是克隆21060的确定的cDNA序列。
SEQ ID NO458是克隆21053的确定的cDNA序列。
SEQ ID NO459是克隆21050的确定的cDNA序列。
SEQ ID NO460是克隆21036的确定的cDNA序列。
SEQ ID NO461是克隆21037的确定的cDNA序列。
SEQ ID NO462是克隆21048的确定的cDNA序列。
SEQ ID NO463是B726P(称作B726P-spliced_seq_B726P)的共有DNA序列。
SEQ ID NO464是B726P第二种剪切形式(称作27490.seq_B726P)的确定的cDNA序列。
SEQ ID NO465是B726P第三种剪切形式(称作27068.seq_B726P)的确定的cDNA序列。
SEQ ID NO466是B726P第二种剪切形式(称作23113.seq_B726P)的确定的cDNA序列。
SEQ ID NO467是B726P第二种剪切形式(称作23103.seq_B726P)的确定的cDNA序列。
SEQ ID NO468是B726P第二种剪切形式(称作19310.seq_B726P)的确定的cDNA序列。
SEQ ID NO469是由SEQ ID NO463上游ORF编码的预测的氨基酸序列。
SEQ ID NO470是由SEQ ID NO464编码的预测的氨基酸序列。
SEQ ID NO471是由SEQ ID NO465编码的预测的氨基酸序列。
SEQ ID NO472是由SEQ ID NO466编码的预测的氨基酸序列。
SEQ ID NO473是由SEQ ID NO467编码的预测的氨基酸序列。
发明详述如上所述，本发明一般地涉及用于治疗和诊断癌症如乳腺癌的组合物和方法。此处所述的组合物可包含乳腺肿瘤多肽，编码这些多肽的多核苷酸，结合剂如抗体、抗原递呈细胞(APC)和/或免疫系统细胞(例如T细胞)。本发明的多肽通常包含乳腺肿瘤蛋白的至少一部分(如免疫原性部分)或其变体。“乳腺肿瘤蛋白”是一种在乳腺肿瘤细胞中表达的蛋白质，如用此处提供的典型测定法所测定的，其表达水平至少两倍于、优选地至少五倍于在正常组织中的表达水平。某些乳腺肿瘤蛋白是可与乳腺癌患者的抗血清可检测地反应(用免疫测定，如ELISA或Western印迹)的肿瘤蛋白。本发明的多核苷酸通常包含编码这种多肽的全部或部分，或与这种序列互补的DNA或RNA序列。抗体通常是能与上述多肽结合的免疫系统蛋白，或其抗原结合片段。抗原递呈细胞包括表达上述多肽的树突细胞、巨噬细胞、单核细胞、成纤维细胞和B细胞。可在这些组合物中使用的T细胞通常是对于上述多肽特异的T细胞。
本发明基于人乳腺肿瘤蛋白的发现。SEQ ID NO1-175、178、180和182-468中列出了编码特异肿瘤蛋白的多核苷酸的序列。乳腺肿瘤蛋白多核苷酸本发明中包括此处所述的编码乳腺肿瘤蛋白的任何多核苷酸或其部分或其他变体。优选的多核苷酸含有编码乳腺肿瘤蛋白一部分的至少15个连续核苷酸，优选地至少30个连续核苷酸，更优选地至少45个连续核苷酸。更优选地，一种多核苷酸编码乳腺肿瘤蛋白的免疫原性部分。本发明中也包括与任何这些序列互补的多核苷酸。多核苷酸可以是单链(编码或反义)或双链的，可以是DNA(基因组、cDNA或合成的)或RNA分子。RNA分子包括含有内含子并一一对应于DNA分子的HnRNA分子，和不含内含子的mRNA分子。其他编码或非编码序列可以但不必存在于本发明的多核苷酸中，多核苷酸可以但不必与其他分子和/或支持材料连接。
多核苷酸可含有天然序列(即，编码乳腺肿瘤蛋白的内源序列或其部分)或可含有这种序列的变体。多核苷酸变体可含有一种或多种置换、添加、缺失和/或插入，使编码多肽的免疫原性相对于天然肿瘤蛋白不降低。对编码多肽免疫原性的影响一般如此处所述评估。变体与编码乳腺肿瘤蛋白或其部分的多核苷酸序列优选地显示至少约70％的同一性，更优选地至少约80％的同一性，最优选地至少约90％的同一性。术语“变体”也包括异种来源的同源基因。
当如下所述排比两种多核苷酸或多肽序列的最大一致性时，如果两种序列的核苷酸或氨基酸序列相同，则认为这两种序列“相同”。两种序列的对比方法一般是在对比窗口中比较序列来鉴定和比较序列相似性的局部区域。此处使用的“对比窗口”是指至少约20个，通常30至约75个，40至约50个连续位点的片段，其中可在最佳排比两种序列后将一种序列与相同数量的连续位点的参照序列相比较。
序列的最佳排比可用生物信息学软件Lasergene组中的Megalign程序(DNASTAR，Inc.，Madison，WI)进行，使用缺省参数。该程序包括了下列参考文献中所述的几种排比方案Dayhoff，MO(1978)“用于检测较远关系的蛋白质-基质的进化改变模型”，在Dayhoff，MO编写的《蛋白质序列与结构图谱》，国家生物医学研究基金会，华盛顿，第5卷，增3，345-358；Hein J.(1990)“排比与系统发生的统一方法”，626-645，《酶学方法》，183卷，学院出版社，San Diego，CA；Higgins，D.G.和Sharp，P.M.(1989)CABIOS 5151-153；Myers，E.W.和Muller W.(1988)CABIOS 411-17；Robinson，E.D.(1971)Comb.Theor.11105；Santou，N.Nes，M.(1987)分子生物学进展(Mol.Biol.Evol.)4406-425；Sneath，P.H.A.和Sokal，R.R.(1973)《数字分类学——数字分类学的原理与实践》，Freeman Press，San Francisco，CA；Wilbur，W.J.和Lipman，D.J.(1983)美国国家科学院院报80726-730。
优选地，通过在至少20个位点的对比窗口上比较两种最佳排列的序列测定“序列同一性百分比”，其中与用于最佳排比两种序列的参照序列(不含添加或缺失)相比，对比窗口中多核苷酸序列的部分可包含20％或更低、通常5-15％％或10-12％的添加或缺失(即缺口)。此百分数的计算方法是，测定在两种序列中存在相同核酸碱基或氨基酸残基的位点数，得到匹配的位点数，匹配位点数除以参照序列中的位点总数(即窗口大小)，结果乘以100，得到序列同一性百分数。
变体也可与天然基因或其部分或互补序列基本同源。这类多核苷酸变体能在中度严格条件下与天然存在的编码天然乳腺肿瘤蛋白的DNA序列(或互补序列)杂交。合适的中度严格条件包括用5×SSC、0.5％SDS、1.0mM EDTA(pH8.0)溶液预洗；在0-65℃下在5×SSC中杂交过夜，或者，如果有种间同源性，于45℃下在0.5×SSC中杂交过夜；随后用含0.1％SDS的2×、0.5×和0.2×SSC的每一种在65℃下洗涤两次20分钟。
本领域技术人员应当理解，由于遗传密码的简并性，存在许多编码如此处所述的多肽的核苷酸序列。这些多核苷酸中的一些具有与任何天然基因的核苷酸序列的最小同源性。但是，本发明特别涉及由于密码子使用的差异而不同的多核苷酸。另外，含有此处提供的多核苷酸序列的等位基因也在本发明范围之内。等位基因是由于核苷酸的一个或多个突变如缺失、添加或置换而改变的内源基因。得到的mRNA和蛋白质可能，但不必具有改变的结构或功能。等位基因可用标准技术(如杂交、扩增和/或数据库序列对比)鉴定。
多核苷酸序列可用多种技术制备。例如，如下详述，通过为肿瘤相关表达筛查cDNA微阵列(即，用此处所述典型测定法所测定的，在乳腺肿瘤中的表达比在正常组织中至少高5倍)，可鉴定多核苷酸。这些筛查可用Synteni微阵列(Palo Alto，CA)按照使用说明书(基本如Schena等人，美国国家科学院院报9310614-10619，1996和Heller等人，美国国家科学院院报942150-2155，1997所述)进行。另外，也可从用表达此处所述蛋白质的细胞制备的cDNA扩增多肽。这些多核苷酸可通过聚合酶链反应(PCR)扩增。为此，可根据此处提供的序列设计序列特异的引物，也可购买或合成。
可通过众所周知的技术用扩增的部分从合适的文库(例如乳腺肿瘤cDNA文库)中分离全长基因。在这些技术中，用适于扩增的一种或多种多核苷酸探针或引物筛查(cDNA或基因组)文库。优选地，大小选择一种文库使之包含更大的分子。也可为了鉴定基因的5’和上游区优选随机引物文库。为了获得内含子并延伸5’序列而优选基因组文库。
对于杂交技术，部分序列可用众所周知的技术标记(例如，切口平移或用32P末端标记)。然后用标记探针杂交含变性细菌集落的滤膜(或含有噬斑的筛子)来筛查细菌或噬菌体文库(参见，Sambrook等人，《分子克隆实验室指南》，冷泉港实验室，冷泉港，NY，1989)。选择杂交的集落或噬斑并扩充，分离DNA进一步分析。例如，使用来源于部分序列的引物和来源于载体的引物，通过PCR可分析cDNA克隆，以确定其他序列的量。可产生限制酶切图谱和部分序列来鉴定一种或多种重叠克隆。然后可用标准技术测定完整序列，其中可包括产生一系列缺失克隆。然后将得到的重叠序列装配为一个连续序列。用众所周知的技术通过连接合适的片段能产生全长cDNA分子。
此外，有大量扩增技术可用于由部分cDNA序列获得全长编码序列。在这些技术中，一般通过PCR进行扩增。可用多种可购得的试剂盒进行这一扩增步骤。引物可用本领域周知的软件设计。引物优选地长22-30个核苷酸，具有至少50％的GC含量，并可在约68℃-72℃时与靶序列退火。扩增区域可如上所述测序，重叠序列装配为连续序列。
一种这样的扩增技术是反向PCR(参见，Triglia等人，核酸研究168186，1988)，它使用限制酶在已知基因区中产生一条片段。然后通过分子内连接环化该片段，在使用来源于已知区的趋异引物的PCR中用作模板。在一种备择方法中，可通过用连接序列的引物和对已知区域特异的引物扩增而重新得到与部分序列相邻的序列。通常用相同的接头引物和对已知区域特异的第二条引物，对扩增的序列进行第二轮扩增。WO96/38591中描述了该方法的一种变化，其使用以相反方向从已知序列开始延伸的两条引物。另一种这样的技术被称为“cDNA末端快速扩增”或RACE。该技术包括使用可与polyA区或载体序列杂交的内部引物和外部引物鉴定为已知序列5’和3’的序列。其他技术包括捕获PCR(Lagerstrom等人，PCR方法应用(PCR Methods Applic.)1111-19，1991)和步移PCR(Parker等人，核酸研究193055-60，1991)。也可使用利用扩增的其他方法获得全长cDNA序列。
在某些情况中，通过分析已表达序列标志(EST)数据库如GenBank数据库中提供的序列能获得全长cDNA序列。检索重叠EST一般可用众所周知的程序(例如，NCBI BLAST检索)进行，这些EST可用来产生连续的全长序列。全长cDNA序列也可通过基因组片段的分析获得。
编码乳腺肿瘤蛋白的cDNA分子的某些核酸序列在SEQ ID NO1-175、178、180和182-468中列出。这些序列的分离如下详述。
多核苷酸变体一般可用本领域所知的任何方法制备，包括化学合成，如固相亚磷酰胺化学合成。也可用标准诱变技术引入核苷酸序列的修饰，如寡核苷酸引导的位点专一诱变(参见Adelman等人，DNA 2183，1983)。此外，假如编码乳腺肿瘤蛋白的DNA掺入具有适当RNA聚合酶启动子(如T7或SP6)的载体中，也可通过体外或体内转录该DNA序列或其部分产生RNA分子。可用某些部分制备如此处所述的编码多肽。另外，也可对患者施用一种部分，使编码多肽在体内产生(例如，用编码乳腺肿瘤多肽的cDNA构建体转染抗原递呈细胞如树突细胞，并对患者施用转染的细胞)。
与编码序列互补的序列部分(即反义多核苷酸)也可用作探针，或用来调节基因表达。也可向组织细胞中导入能转录为反义RNA的cDNA构建体，以利于反义RNA的产生。如此所述，可使用反义多核苷酸，抑制肿瘤蛋白的表达。能用反义技术通过三股螺旋形成控制基因表达，这减弱了双螺旋为了结合聚合酶、转录因子或调节分子而充分打开的能力(参见Gee等人，Huber和Carr，《分子与免疫学方法》，FuturaPublishing Co.(Mt.Kisco，NY；1994))。此外，可设计一种反义分子与基因的控制区(例如，启动子、增强子或转录起始位点)杂交，并阻断基因转录；或通过抑制转录物与核糖体的结合阻断翻译。
也可设计一部分编码序列或一部分互补序列作为探针或引物检测基因表达。探针可用多种报道基团标记，如放射性核素和酶，长度优选地至少为10个核苷酸，更优选地至少20个核苷酸，更优选地至少30个核苷酸。如上所述，引物优选地为22-30个核苷酸长。
任何多核苷酸可被进一步修饰，以提高体内稳定性。可能的修饰包括但不限于在5’和/或3’末端添加侧翼序列；在主链中使用硫逐磷酸酯或2’O-甲基而不是磷酸二酯酶连接；和/或含有非传统碱基，如肌苷、queosine和wybutosine，以及乙酰-、甲基-、硫代-和其他修饰形式的腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶和尿嘧啶。
可用建立的重组DNA技术将此处所述的核苷酸序列与多种其他核苷酸序列连接。例如，一种多核苷酸可克隆到多种克隆载体的任一种中，包括质粒、噬菌粒、λ噬菌体衍生物和粘粒。特定用途的载体包括表达载体、复制载体、探针产生载体和测序载体。通常，一种载体含有一个至少在一种生物中起作用的复制起点、常规限制性核酸内切酶位点和一种或多种选择性标记。其他元件取决于希望的用途，对于本领域技术人员是显然的。
在某些实施方案中，可配制多核苷酸，以使其能进入哺乳动物细胞并在其中表达。这些制剂特别可用于如下所述的治疗用途。本领域技术人员应当理解，有许多方法能实现多核苷酸在靶细胞中的表达，并可使用任何合适的方法。例如，一种多核苷酸可掺入病毒载体中，例如但不限于腺病毒、腺伴随病毒、反转录病毒或痘苗病毒或其他痘病毒(例如，禽痘病毒)。多核苷酸也可作为“裸露的”质粒载体施用。向这些载体中掺入DNA的技术为本领域技术人员所周知。反转录病毒载体另外还可转移或掺入一种选择性标记基因(帮助鉴定或筛选转导的细胞)和/或导向部分，如编码特异靶细胞上受体的配体的基因，以使载体导向特异。也可通过本领域技术人员周知的方法用抗体实现导向。
用于治疗的其他制剂包括胶态分散系统，如大分子复合物、毫微囊剂、微球体、珠滴，和基于脂质的系统，包括水包油乳剂、胶囊、混合胶囊和脂质体。用作体外和体内输送载体的一种优选的胶态系统是脂质体(即，人工膜载体)。这些系统的制备和应用在本领域中众所周知。乳腺肿瘤多肽在本发明内容中，多肽至少可含有如此处所述的乳腺肿瘤蛋白的免疫原性部分或其变体。如上所述，“乳腺肿瘤蛋白”是一种由乳腺肿瘤细胞表达的蛋白质。是乳腺肿瘤蛋白的蛋白质也在免疫测定(例如ELISA)中与取自乳腺癌患者的抗血清可检测地反应。此处描述的多肽可为任何长度。也可能存在来自天然蛋白质的其他序列和/或异源序列，这些序列可以(但不必)具有其他免疫原性或抗原性。
在此使用，“免疫原性部分”是B细胞和/或T细胞表面抗原受体可识别(即，特异结合)的蛋白质的一部分。这些免疫原性部分一般含有乳腺肿瘤蛋白或其变体的至少约5个氨基酸残基，更优选地至少约10个，最优选地至少约20个氨基酸残基。某些优选的免疫原性部分包括N端前导序列和/或跨膜域已经缺失的肽。其他优选的免疫原性部分相对于成熟蛋白质可含有小N-和/或C-末端缺失(例如，1-30个氨基酸，优选地5-15个氨基酸)。
免疫原性部分一般可用众所周知的技术鉴定，如Paul，《基础免疫学》，第3版，Raven Press，1993，243-247和此处引用的参考文献所总结的。这些技术包括根据与抗原特异性抗体、抗血清和/或T细胞系或克隆反应的能力筛查多肽。在此使用时，如果抗血清和抗体能与抗原特异结合(即，它们在ELISA或其他免疫测定中能与该蛋白质反应，但与不相关的蛋白质无可检测到的反应)，则它们是“抗原特异的”。这些抗血清和抗体可如此处所述制备，和用众所周知的技术制备。天然乳腺肿瘤蛋白的免疫原性部分是可与这些抗血清和/或T细胞以大大低于全长多肽反应性的水平反应的部分(例如在ELISA和/或T细胞反应性测定中)。这些免疫原性部分可在这些测定中以类似于或高于全长多肽的水平反应。这些筛查一般可用本领域技术人员周知的方法进行，如Harlow和Lane，《抗体实验室手册》，冷泉港实验室，1988所述。例如，可将多肽固定于固体载体上，并与患者的血清接触，以使血清中的抗体与固定的多肽结合。然后可除去未结合的血清，并用例如125I-标记的蛋白A检测结合的抗体。
如上所述，组合物可含有天然乳腺肿瘤蛋白的变体。多肽“变体”是由于置换、缺失、添加和/或插入和/或修饰而不同于天然乳腺肿瘤蛋白的多肽，使得多肽的抗原性基本不减弱。换句话说，变体与抗原特异性抗血清反应的能力相对于天然蛋白质可增强或不变，或者相对于天然蛋白质可降低不到50％，优选地不到20％。这些变体的鉴别方法一般是，修饰上述多肽序列之一，并用此处所述的抗原特异性抗体或抗血清评估修饰多肽的反应性。优选的变体包括已去除一个或多个部分，如N端前导序列或跨膜域的变体。其他优选的变体包括已从成熟蛋白质的N端和/或C端除去一小部分(例如，1-30个氨基酸，优选地5-15个氨基酸)的变体。
多肽变体优选地显示与所鉴定的多肽有至少约70％，更优选地至少约90％，最优选地至少约95％的同一性(如下所述测定)。
优选地，一种变体含有保守置换。“保守置换”是将氨基酸置换为具有类似性质的另一种氨基酸的置换，这样，肽化学领域的技术人员能预料到多肽的二级结构和亲水性基本不变。氨基酸置换一般可根据残基极性、电荷、溶解度、疏水性、亲水性和/或两性性质的相似性进行。例如，带负电的氨基酸包括天冬氨酸和谷氨酸；带正电的氨基酸包括赖氨酸和精氨酸；含具有类似亲水性值的不带电极性头基团的氨基酸包括亮氨酸、异亮氨酸和缬氨酸；甘氨酸和丙氨酸；天冬酰胺和谷氨酰胺；丝氨酸、苏氨酸、苯丙氨酸和酪氨酸。可代表保守改变的其他组氨基酸包括(1)ala、pro、gly、glu、asp、gln、asn、ser、thr；(2)cys、ser、tyr、thr；(3)val、ile、leu、met、ala、phe；(4)lys、arg、his；和(5)phe、tyr、trp、his。一种变体也可含有非保守性改变。在一个优选实施方案中，变体多肽由于5个或更少氨基酸的置换、缺失或添加而不同于天然序列。也可(或另外)通过例如缺失或添加对多肽的免疫原性、二级结构和亲水性有最小影响的氨基酸修饰变体。
如上所述，多肽可在蛋白质的N端含有一种信号(或前导)序列，该序列在翻译时或翻译后引导该蛋白质的转移。多肽也可与接头或其他序列偶联，以便于多肽(例如聚-His)的合成、纯化或鉴定，或增强该多肽与固体载体的结合。例如，多肽可与免疫球蛋白Fc区偶联。
多肽可用多种众所周知的技术制备。如上所述的DNA序列编码的重组多肽可用本领域技术人员所知的多种表达载体由DNA序列制备。可在用含编码该重组多肽的多核苷酸分子的表达载体转化或转染的适当宿主细胞中实现表达。合适的宿主细胞包括原核、酵母、高等真核和植物细胞。优选地，使用的宿主细胞是大肠杆菌、酵母或哺乳动物细胞系，如COS或CHO。向培养基中分泌重组蛋白或多肽的合适宿主/载体系统的上清液首先可用可购得的滤器浓缩。浓缩后，将浓缩物加至合适的纯化基质如亲和基质或离子交换树脂上。最后，能利用一次或多次反相HPLC步骤进一步纯化重组多肽。
包含少于约100个氨基酸、一般少于约50个氨基酸的部分和其他变体也可利用本领域周知的技术用合成法产生。例如，这些多肽可用商品化的固相技术合成，如Merrifield固相合成法，其中向延长的氨基酸链中连续添加氨基酸。参见Merrifield，美国化学学会杂志(J.Am.Chem.Soc.)852149-2146，1963。多肽自动合成装置可购自供应商，如PerkinElmer/Applied BioSystems Division(Foster City，CA)，并可按照使用说明书操作。
在某些特殊实施方案中，多肽可以是一种融合蛋白，其含有此处所述的多种多肽，或含有至少一种此处所述的多肽和一种无关序列，如已知的肿瘤蛋白。例如，融合配偶体可参与提供T辅助表位(一种免疫融合配偶体)，优选地可被人识别的T辅助表位，或可参与以高于天然重组蛋白的产量表达蛋白质(表达增强子)。某些优选的融合配偶体既是免疫的又是增强表达的融合配偶体。可选择其他融合配偶体，以提高蛋白质的溶解度，或使蛋白质能导向希望的胞内区室。其他融合配偶体包括有利于蛋白质纯化的亲和标记。
融合蛋白一般可用包括化学偶联在内的标准技术制备。优选地，融合蛋白表达为一种重组蛋白，使得在表达系统中的生产水平相对于非融合蛋白提高。简言之，编码多肽成分的DNA序列可分开装配，并与合适的表达载体连接。编码一种多肽成分的DNA序列的3’端在有或无肽接头的情况下与编码第二种多肽成分的DNA序列的5’端连接，使序列的阅读框相符。这导致翻译为一种保留了两种多肽的生物活性的融合蛋白。
可使用一种肽接头序列将第一种和第二种多肽成分分开，以充分确保每种多肽折叠为其自身二级和三级结构的一段距离。用本领域周知的标准技术将这种肽接头序列引入融合蛋白中。可根据下列因素选择合适的肽接头序列(1)其采取灵活延伸构象的能力；(2)其不能采取与第一种和第二种多肽上的功能表位相互作用的二级结构的性质；和(3)可与多肽功能表位相互作用的疏水性或带电残基的缺乏。优选的肽接头序列含有Gly、Asn和Ser残基。在接头序列中也可使用其他接近中性的氨基酸，如Thr和Ala。可用作接头的氨基酸序列包括Maratea等人，基因4039-46，1985；Murphy等人，美国国家科学院院报838258-8562，1986；美国专利号4,935,233和美国专利号4,751,180中公开的序列。接头序列长度可为1个到约50个氨基酸。当第一种和第二种多肽含有能用来分开功能域并防止空间干扰的非必需N端氨基酸区时，不需要肽接头序列。
连接的DNA序列与合适的转录或翻译调节元件有效连接。负责DNA表达的调节元件只位于编码第一种多肽的DNA序列的5’。类似的，末端翻译所需的终止密码子和转录终止信号只存在于编码第二种多肽的DNA序列的3’。
也提供了包含本发明的多肽和一种非相关免疫原性蛋白质的融合蛋白。优选地，该免疫原性蛋白质能引发一种回忆反应。这些蛋白质的例子包括破伤风、结核和肝炎蛋白(参见，例如，Stoute等人，新英格兰医学杂志(New Engl.J.Med.)33686-91，1997)。
在优选的实施方案中，免疫原性融合配偶体来源于蛋白D——革兰氏阴性菌B型流感嗜血菌的一种表面蛋白(WO 91/18926)。优选地，蛋白D衍生物包含该蛋白质的约三分之一(例如，N端前100-110个氨基酸)，蛋白D衍生物可被脂质化。在某些优选实施方案中，在N端含有脂蛋白D融合配偶体的前109个残基，以产生含有其他外源T细胞表位的多肽，并提高在大肠杆菌中的表达水平(从而作为表达增强子)。脂质尾确保抗原向抗原递呈细胞的最佳递呈。其他融合蛋白包括来源于流感病毒的非结构蛋白NS1(血球凝集素)。一般使用N端81个氨基酸，但也可使用含有T辅助表位的不同片段。
在另一个实施方案中，免疫融合配偶体是被称作LYTA的蛋白质或其部分(优选地C端部分)。LYTA来源于肺炎链球菌(Streptococcuspneumoniae)，该菌合成一种N-乙酰-L-丙氨酸酰胺酶，被称作酰胺酶LYTA(由LytA基因编码；基因43265-292，1986)。LYTA是一种自溶素，可特异降解肽聚糖主链中的某些键。LYTA蛋白的C端区域负责与胆碱或某些胆碱类似物(如DEAE)的亲和力。该性质已用于发展用于融合蛋白表达的大肠杆菌C-LYTA表达质粒。在氨基端含C-LYTA片段的杂种蛋白的纯化已有描述(参见，生物技术(Biotechnology)10795-798，1992)。在一个优选实施方案中，LYTA的重复部分可掺入融合蛋白中。在开始于残基178的C端区中发现重复部分。一种特别优选的重复部分含有残基188-305。
如上所述通常分离多肽(包括融合蛋白)和多核苷酸。“分离的”多肽或多核苷酸是从其原始环境中分离出的。例如，如果从自然系统中某些或全部共存物质中分离，则分离天然存在的蛋白质。优选地，这些多肽纯度至少约90％、更优选地至少约95％、最优选地至少约99％。例如，如果多核苷酸被克隆到不是自然环境一部分的载体中，则认为它是分离的。结合剂本发明进一步提供试剂，如可特异结合乳腺肿瘤蛋白的抗体及其抗原结合片段。在此使用时，如果抗体或其抗原结合片段与乳腺肿瘤蛋白以可检测的水平反应(例如ELISA)，而在类似条件下不与无关蛋白可检测地反应，则认为其可与乳腺肿瘤蛋白“特异结合”。在此使用时，“结合”是指两种不同分子非共价结合而形成复合体。例如通过

查看更多专利详情

下载专利文献

下载专利

关于早鸽

早鸽（zaoge.com）是以虚拟资产交易、媒体运营、公司服务为核心的学习、交流、分享平台，集媒体、培训、社群为一体，全方位服务公司人和运营人，成立9年覆盖北上广深杭成都等15个城市，在行业有较高的影响力和知名度。平台聚集了众多鱼爪集团、易店无忧等知名互联网公司客服顾问和运营总监，他们在这里与你一起成长。

全国统一客服热线(7x24)

400-888-2016

客服邮箱：

kefu@zaoge.com

微信公众号

早鸽服务号

蜀ICP备2020030767号
国家企业信用信息公示系统(四川)
国家企业信用信息公示系统（四川）

Copyright © 2016-2021 早鸽网版权所有蜀ICP备2020030767号