在全基因组规模非侵入性确定亲本单倍型的胎儿遗传制作方法

专利名称

在全基因组规模非侵入性确定亲本单倍型的胎儿遗传制作方法
发明者
公开日
申请日期
优先权日
申请人
文档编号
关键字

基因组亲本侵入确定规模
技术领域

[0007]有核细胞从胎儿到母方循环的传递首先由Walknowska等人于1969年注意到,胎儿细胞用于产前检查的潜在应用和限制已经得到充分描述虽然源自这些细胞的遗传物质理论上提供一种用于产前检查的非侵入性手段，循环胎儿细胞是稀少的，因此从母方血液样本中分离是昂贵且耗时的(Simpson和Elias, 1994 ；Bianchi, 1995 ；Steele等人，1996)允许分离和富集有核胎儿细胞的通用细胞标记物还有待被发现，妨碍了这些方法来获得稳定、可重复结果的应用(Bischoff等人，2002)[0008]在1997年，发现了循环在母方血浆和血清中的片段的、无细胞胎儿DNA，为分离稀少的胎儿细胞用于非侵入性检测提供了一种潜在的替代(Lo等人，1997)起源于衬在胎盘绒毛间隙的滋养层细胞，滋养层退化后胎儿DNA片段释放至母方循环；母方血液中循环的胎儿细胞凋亡可提供无细胞胎儿DNA的少数来源(Alberry等人,2007 ;Sekizawa等人，2003b ;Wataganara等人,2005)这一发现后不久,还观察到母方血液中存在胎盘来源的mRNA作为母方循环中胎儿遗传物质的第三来源(Poon等人，2000)早在5周孕龄以及持续整个孕期，在母方循环中可检测到无细胞胎儿DNA (Birch等人，2005)在整个孕期可以检测到无细胞胎儿DNA向母方血液的转移(Lo等人，2000)由于其平均半衰期为16.3分钟，无细胞胎儿DNA在分娩后若干小时内从循环中被清除，因此之前的孕期不会混淆目前孕期的胎儿DNA鉴定和分析(Lo等人，1999C)正如预期的那样，母方循环中的无细胞DNA可以是母方或胎儿来源，无细胞胎儿DNA相对于总DNA的浓度范围从3.4%至6.2%、或每毫升母方血液25.4至292.2基因组当量(Lo等人，1998)可能是因为发育过程中的不稳定性或可变的转录，无细胞胎儿mRNA仅在22%的早期和中期妊娠孕期和63%的晚期妊娠孕期中得以鉴定(Poon等人，2000)[0009]尽管无细胞胎儿核酸，尤其是无细胞胎儿DNA的这些特性，将胎儿的遗传物质与母方遗传物质区分开的重大挑战阻碍了它们在非侵入性产前检查中的应用即，由于胎儿其遗传信息的二分之一继承自母亲，胎儿来源的DNA或RNA片段的分离需要针对将它们和其母方对应部分区分开的这些核酸的信息或特征[0010]正在探索与性别测定、血型和人类白细胞抗原(HLA)分型、以及单基因疾病或其它多态性遗传的检测或排除有关的母方血液中胎儿特异性序列的用处，包括父方遗传的等位基因或全新(de novo)突变为了检测非整倍体，可以利用杂合等位基因或特定染色体的特异性序列的浓度比例专门源自胎盘的胎儿或mRNA种类的表观遗传标志(epigeneticsignature),通过区分胎儿和母方的遗传物质，可以作为替代的诊断工具(Poon等人，2002 ；Lo 等人，2007b)[0011]对于医学上指征用于产前性别测试的妊娠，目前推荐的侵入性诊断方法包括10至12孕周之间的绒毛膜绒毛取样、或15周至20周之间的羊膜穿刺术，其各自随后进行核型分析，获得基本上100%准确性的性别确定(Nicolaides等人，1994)用于产前性别测试的医学指征包括性别连锁疾病的预防或管理(Hyett等人，2005)如果他的母亲是一个受影响的等位基因携带者，那么男性继承隐性X-连锁疾病如血友病或杜氏肌营养不良症的风险为50%目前，对这些疾病基因的妊娠携带者的建议包括侵入性测试X染色体上特异性遗传突变的存在(Sherman等人，2005)通过使用无细胞核酸进行早期非侵入性的性别测定，怀有女性胎儿的女性可以免受进一步侵入性测试的风险，并在妊娠不久就可以得知结果(Wald 等人，2003 ；Sherman 等人，2005 ；Santacroce 等人，2006)[0012]母方血浆中无细胞胎儿DNA的首次发现依赖于DSY14 (位于Y染色体上的基因)的聚合酶链式反应(PCR)扩增和电泳(Lo等人，1997)通过这种方法，胎儿DNA仅必然能在怀有男性胎儿的女性血液样本中检测到；然而，并不是所有这些女性具有可检测到的DSY14浓度，且在原始研究中的灵敏度在怀有男性的妊娠中仅限于80%的检测最近，产前性别确定依赖于对SRY (在Y染色体上的性别决定区)的检测，其比DYS14提供更可靠的诊断能力(Honda等人，2002)性别检测的实验室技术也得到了改善，从组合PCR电泳到定量实时PCR，增加了通量，并将妊娠头三个月的准确性提高至97%至100% (Lo等人，1998 ；Costa等人,2001 ;Hromanikova 等人，2003 ;Sekizawa 等人，2001 )[0013]胎儿性别确定表明，在母方血液中循环的胎儿专属的无细胞DNA序列能够提供重要的产前诊断信息这一发现的一年之内，可比较的技术被应用到RhD血型的基因分型中胎儿和孕妇之间的RhD血型不兼容性可能会导致同种免疫、溶血性疾病和流产，但是通过现代围产期保健包括施用预防性抗RhD免疫球蛋白，负面结果可被有效预防同胎儿性别检测相似，使用组合PCR-电泳操作或定量实时PCR技术，可以在RhD阴性孕妇的血液中检测到来自RhD阳性胎儿的无细胞RhD序列(Faas等人，1998 ;Bischoff等人，1999)Meta-分析表明胎儿RhD血型测试提供95%的总体准确性，并可以早在8周孕龄就进行(Geifman-Holtzman 等人，2006)[0014]也正在开发无细胞胎儿DNA测试来检测其它血型的母胎不兼容性，包括RhC、RhE和Kell (K)和RhD测试相似，使用实时PCR或PCR-MS，尤其是当通过锁核酸增强测试时，实现了血型分型的高度准确(Li等人，2008 Winning等人，2007)[0015]使用与胎儿性别和血型检测相似的原则，母亲血液中存在不属于母方基因组一部分的序列可能表明，胎儿继承了完全来自父亲的等位基因或发生了全新的突变检测到或缺乏这种等位基因突变可有助于诊断或排除单基因疾病和HLA单倍型的鉴定[0016]在2000年，科学家首次使用无细胞胎儿DNA，在处于强直性肌营养不良症风险的胎儿中检测显性单基因疾病的父方突变遗传(Amicucci等人，2000)只要其不存在于母方DNA中，采用PCR然后通过电泳就可以成功鉴定这种已知突变使用限制性片段长度多态性分析或降落式(touchdown)或巢式PCR的后续研究表明，已知突变的检测通过减少错配(mispriming)得以改善，比如用于软骨发育不全和血红蛋白病的那些(Li等人，2004 ；Fucharoen等人，2003 ； Saito等人，2000)不久之后，等位基因特异性PCR随后进行电泳被应用到Hb Lepore病和亨廷顿病的诊断与排除；表明对亨廷顿病状态的鉴定早在10周孕龄时就已高度准确了，尽管CAG三核苷酸重复程度越大(这对应着更高的疾病外显率(penetrance)和更早的发作期)测试的灵敏降低(Amicucci等人,2000 ；Gonzalez-Gonzalez 等人，2003a ；Gonzalez-Gonzalez 等人，2003b ;Bustamante_Aragones等人，2008 ;Lazaros等人，2006)同样，等位基因特异性实时PCR已证实被用于HLA分型，出于将造血干细胞移植到生病同胞中的目的，如果希望在胎儿中进行HLA匹配，则这可能是有用的(Reed等人，2002)除了检测致病的突变，用于父方遗传的短串联重复序列的实时PCR也被应用于非侵入性的亲子鉴定(Wagner等人，2009)[0017]由于无法区分母方和胎儿的序列，以及因此而导致的母方等位基因的胎儿遗传不确定性，隐性疾病对使用无细胞胎儿核酸进行产前诊断构成更大的挑战母方血液中不存在父方遗传的或全新突变允许明确排除隐性性状同时，突变检测表明胎儿是杂合携带者或受影响的复合杂合子或纯合子，这取决于母方突变是否和父方突变相同针对隐性疾病，如CAH和囊性纤维化，在11和17周孕龄之间，等位基因特异性PCR随后进行电泳允许检测或排除父方突变(Gonzalez-Gonzalez等人,2002 ;Chiu等人,2002a)同样地,等位基因特异性实时PCR可以应用到囊性纤维化和β-地中海贫血突变中，具有100%的灵敏度和近乎完美的特异性(Chiu等人，2002b ；Lun等人，2008)[0018]一个诊断隐性疾病的独特方法，在其中母亲和父亲携带相同突变的，需要检查来自母方血液的DNA中的相对突变剂量，或突变对野生型等位基因的比例(Lun等人，2008)鉴于来自杂合子母亲的野生型和突变等位基因的平等贡献，胎儿遗传的状态将由母方血液中野生型等位基因(胎儿不受影响)或突变(胎儿受影响)的过度出现(overrepresentation)、或野生型和突变等位基因呈现平衡(胎儿是杂合携带者)所决定同样，如果母亲携带显性突变，母方血液中的优势野生型等位基因将意味着疾病没有遗传，而平衡的野生型和突变等位基因将代表显性疾病的遗传具体来说，数字实时PCR，由于反应的单个分隔，这比常规PCR更精确(precise)，数字实时PCR已经以这种方式用于检测地中海贫血、血红蛋白病和血友病的母体突变的遗传(Lun等人，2008 ;Tsui等人，2011)从理论上讲，只要父方基因型是已知的，以及在独特父方突变的情况下，也在母方血液中检测父方突变，这样的分析就可以应用到具有多种致病等位基因的隐性疾病诊断中(而不是仅仅排除)[0019]与SRY和RHD检测一样，PCR随后进行MS提供了已知的、隐性和显性父方突变检测中的更高特异性，包括地中海贫血和软骨发育不全的那些(Ding，2008 ;Ding等人，2004；Li等人，2009 ；Li等人，2007)再次，为了临床实施单基因疾病的MS分析，有可能有显著的操作障碍，因为大多数实验室不具备昂贵的MS所需设备(Wright和Burton，2009)[0020]使单基因和其它类型非侵入性测试接近临床应用的一种机制是富集胎儿DNA或者RNA，尽管主要是母方的循环核酸由于无细胞胎儿和母方DNA片段长度之间的差异(分别小于300bp和超过lOOObp)，尺寸分级为提高胎儿-母方DNA比例提供了一个途径(Li等人，2004)使用电泳分离较短的片段以及因此胎儿DNA的浓缩，改善了父方遗传的单核苷酸多态性(SNP)、父方遗传的和全新的突变、和胎儿微卫星标记物的检测；使用数字PCR选择性扩增较短片段的方法也正在探索之中(Li等人，2004 ；Li等人，2007 ；Li等人，2009 ；Li等人，2005年；Chan等人，2004)全基因组扩增可能是解决胎儿DNA水平低的次要方法(Jorgez和Bischoff, 2009)或者,无论是在胎儿或母方DNA中抑制野生型等位基因，从而改善突变等位基因的富集，可以通过使用肽核酸介导的PCR阻断野生型序列的扩增来实现(Li 等人，2005 ；Galbiati 等人，2006)[0021]产前非整倍体测试是应用无细胞胎儿DNA技术的另一个潜在领域非整倍体，定义为任何染色体数目异常，影响到1/300的新生儿，是智力低下的最常见原因；非整倍体也和至少35%的流产有关(Hassold等人，1996)在活产婴儿中最常见的非整倍体包括21三体(唐氏综合征)、13三体、18三体、和性染色体的单倍体或三体，包括特纳氏综合征和Klinefelter综合征一些商业无细胞胎儿DNA和RNA技术正在开发中，以检测妊娠的非整倍体，大多专注于唐氏综合征测试这些包括，将有问题染色体的总浓度与基于未受影响染色体的浓度所预期的浓度直接比较，或通过在受影响的染色体上确定母方遗传的等位基因和父方遗传的等位基因的比例根据第一种方法，预期具有三体的胎儿具有32的受影响的染色体对未受影响的染色体的相对染色体剂量根据第二种方法，三体胎儿将具有21的倾向于母方或父方遗传的等位基因的等位基因失衡使用染色体剂量法相对于等位基因平衡法的优点是由于其多态性非依赖性的性质使用后者，继承自父亲(而非母亲)的等位基因的存在对于确定等位基因平衡是必要的，反之亦然，而鉴定这样的等位基因并不总是可行或方便的(Wright，2009)因此，这些确定等位基因比例的方法在胎儿纯合子的实例中是无效的此外，由于胎儿DNA相对于母方DNA而言以降低的浓度存在，使用特异性等位基因的分析利用仅小部分的DNA ;这个研究需要面对的一个重要问题是需要开发有效的分析方法，尽管胎儿DNA浓度低[0022]胎儿和母方DNA差异表观遗传标志的概念证据，在一些胎儿SNP的独特甲基化图式中得以证实，并导致了第一次使用等位基因比例用于非整倍体检测具体来说，相对于密集甲基化的母方启动子而言，18号染色体上胎盘maspin (无对应中译文)基因启动子是低甲基化的(Poon等人，2002)这些甲基化上的差异可以经探索被用来评估胎儿DNA浓度；这一发现后不久，研究人员表明使用甲基化特异性PCR通过maspin等位基因比例来诊断18三体的原则的证据(Chim等人,2005 ;tong等人,2006)由于不同的等位基因对于确定等位基因比例是必要的，这种方法不能被应用在胎儿纯合子的情况最近的研究继续基于表观遗传修饰搜索其它胎儿DNA标记物(Chan等人，2006 ；01d等人，2007 ；Nygren等人，2010)[0023]针对18号染色体基因，成功确定等位基因平衡的证据使得能够进行21号染色体SNP分析，包括对专门在胎盘中表达的PLAC4 mRNA的分析，来检测唐氏综合征(Lo等人，2007b ;0udejans等人，2003)对于特异性的PLAC4 SNP杂合子胎儿，采用逆转录PCR和MS通过等位基因失衡进行21三体的鉴定，实现了 90%的灵敏度和97%的特异性类似的技术被应用到PLAC4上的一组5个SNP基因座，实现了 92%的灵敏度和100%的特异性，且可能代表了更高的通量、更广泛的PLAC4 SNP分析的应用用途(Deng等人，2011)在这两种情况下，排除了胎儿纯合性的非整倍体检测然而，更一般的是，使用mRNA检测非整倍体的这种成功促进了研究胎盘来源mRNA的增长，以试图发现新的通用胎儿遗传标记物用于更广泛的产前诊断目的(Tsui等人，2004)[0024]后来使用数字PCR探索通过等位基因失衡的非整倍体检测，经选择来改善定量灵敏度，并根据使用羊水细胞样本的原则早期证据为基础(Zimmermann等人,2002 ；Lo等人，2007a)使用PLAC4上的SNP来确定21号染色体的等位基因平衡，虽然使用小的样本量，非整倍体和整倍体胎儿的分类达到100%的准确性这些样本之一需要在原始板之外进一步测试；由于实际样本中母方DNA占优势，计算表明约3%的情况将需要这种后续分析作出结论性诊断[0025]同一研究还表明了相对染色体剂量检测非整倍体的第一次使用(Zimmermann等人，2002 ；Lo等人，2007a)通过检验I号和21号染色体上非多态性基因座的浓度比例，这种多态性非依赖性方法提供了 100%的准确性然而，各结论性诊断需要I至7个之间的板，从而使得这种形式的数字PCR成为劳动密集型数字PCR在相对染色体剂量以及非整倍体检测上的精确性得以证实，考虑到胎儿DNA对母方DNA的比例较低，同时强调对广泛分析的需求(Fan 和 Quake, 2007a)[0026]引入大规模平行基因组测序以解决以前对母方DNA比胎儿DNA占优势的关注，同时实现数字PCR所需的精确性(Chiu等人，2008 ;Fan等人，2008)虽然PCR取决于选择仅出现在一些DNA片段上的基因座，可按照多态性非依赖性和基因座非依赖性的方式使用大规模平行测序，以利用样本中的所有DNA片段通过同时测序所有或甚至靶向的片段，将序列和其各自的染色体进行比对，并定量各染色体剂量可以解决围绕母方DNA占优势的问题，即使用明显更少的样本量(Liao等人，2011)原理研究的证据表明在13、18和21三体的情况中染色体过度出现的100%准确检测(Chiu等人，2008 ;Fan等人，2008)后续研究表明对非整倍体或嵌合体的灵敏度只受测序深度的限制；即样本读取数目越大，检测越多的任何完整或部分染色体异常的过度出现或过低(Fan和Quake，2010b)大规模平行基因组测序还可以为检测其它细胞遗传学异常引起的三体提供手段，如罗伯逊易位(Robertsoniantranslocation) (Lun 等人，2011)[0027]非整倍体检测的替代策略使用串联SNP来绕过对母方DNA占优势的关注，同时避免和测序方法相关的成本过高(Ghanta等人，2010)串联SNP是两个高度杂合的、邻近的多态性，其允许四种可能的单倍型排列如果母方出现2种不同的单倍型以及父亲携带至少I种额外的不同单倍型，母方血浆中各单倍型的剂量为胎儿单倍型提供信息在三体的情况下，胎儿将有3种单倍型或2种单倍型的失衡，这取决于不分离现象何时发生除了 100%的初步特异性和灵敏度，这种PCR技术或测序平台以及广泛染色体异常的适用性；然而，相当比例的情况对于给定串联SNP不会提供有用的信息(Ghanta等人，2010)[0028]直到最近，某些遗传疾病表现出难以适应现有分析方法的方法学复杂性(methodological complications)由于无细胞胎儿DNA的片段化状态,使用这些方法没有检测到任何超过300个碱基对的致病序列(Chan等人,2004 ；Norbury和Norbury, 2008)此外，由于在胎儿DNA中区分相同的母方和父方遗传的等位基因是困难的，在单突变引起的隐性疾病(如镰刀状细胞贫血)的产前检测中所做的努力微乎其微[0029]此前报道的混合母方胎儿DNA的MS分析，尽管母方和父方的致病突变相同，表明了避免此限制的一种手段；通过分析母方和父方的单倍型，以及寻求有提示性的突变相关的父方SNP、胎儿遗传的父方SNP以及单倍型允许推断胎儿β-地中海贫血状态(Ding等人，2004)[0030]无细胞胎儿核酸还可以在围产期保健起到重要的作用，因为循环DNA的浓度有妊娠并发症的预测能力最值得注意的是，蛋白尿和高血压的严重程度、先兆子痫的两个主要症状与无细胞胎儿DNA浓度的增加有关(Sekizawa等人，2004b ;Lo等人，1999b)无细胞胎儿DNA水平的这种提高一般先于先兆子痫的发作，提供潜在的高危妊娠鉴定(Zhong等人，2002 ;Farina等人，2004)在患有侵入胎盘、妊娠剧吐和早产的孕妇中也注意到提高的无细胞胎儿 DNA 水平(Sekizawa 等人，2002 ；Sekizawa 等人，2001 ；Leung 等人，1998)通常通过确定怀男性胎儿的女性血液中循环的Y特异性序列的浓度除以总无细胞DNA的标记物(如β -珠蛋白或GAPDH)浓度，计算特异性源自胎儿的DNA的量，实现这种类型的定量分析(Zhong等人,2001a ；Sekizawa等人,2003a)替代方法包括测量其它胎儿遗传标记物如PLACl、CRH及选择素-P mRNA的浓度,用于怀女性的妊娠(Maron等人,2007 ；Purwosunu等人，2007 ；Farina等人，2006 ；Ng等人，2003)随着研究人员继续搜寻妊娠并发症的胎儿DNA或RNA指示物(indicator),有可能在母方血液中发现胎儿特异性遗传序列的新型通用标记物，这在非侵入性产前检查的其它应用中将是有价值的[0031]产前基因组图谱的临床实施障碍包括测序平台成本高和通量低、要求复杂的统计方法、和目前的单倍型信息知识有限为了在高危人群中诊断疾病，通过有针对性的搜索已知的致病区域，来避免这些障碍[0032]发现在母方血流中循环的无细胞胎儿DNA和RNA为非侵入性全基因组产前检查打开了一扇大门，具有新的临床意义此外，可以使用这种技术鉴定的胎儿遗传性状的范围，似乎仅受到基因组学知识的限制随着无细`胞胎儿DNA和RNA技术的科学研发推进，这种测试可能会逐渐取代或补充现有的筛查和诊断程序由于其非侵入性、适应症广以及使用更及时，该技术已证实了显著改变产前遗传检测的潜力[0033]无细胞胎儿核酸检测的上述现有技术状态在Sayres和Cho，2011中有详尽的综述，其全部并入此处作为参考
背景技术

【发明内容】
专利摘要

本发明提供一种用于单细胞单倍型分型的方法、装置和计算机程序，从而取自妊娠女性的样本，而不用直接对胎儿进行采样，提供非侵入性地确定胎儿基因组的能力。该方法可通过确定亲本的和遗传的单倍型而进行、或仅仅在母方遗传信息的基础上进行，优选获自血液或血清样本中。该新型装置允许对来自单细胞的单个染色体进行序列分析，优选通过将来自中期细胞的单个染色体分到长、窄的通道中，在通道中可以进行序列分析。
专利说明

在全基因组规模非侵入性确定亲本单倍型的胎儿遗传

专利详情
全文pdf
权力要求
说明书
法律状态

在全基因组规模非侵入性确定亲本单倍型的胎儿遗传的制作方法[0001]政府资助的声明[0002]本发明根据国立卫生研究院所颁发的协议CA143907和0D000251得到美国政府的资助。政府在本发明中享有一定的权利。[0003]相关申请的交叉引用[0004]本申请要求2010年12月7日提交的US临时申请系列号61/420，768的优先权，其整个并入此处作为参考。[0005]参考序列表、计算机程序或光盘[0006] 申请人:主张序列表的文本副本和随附计算机文件中可见的计算机可读形式中的序列表是相同的。申请人:将序列表内容整个并入作为参考。 [0034]以下简要概述不意图包括本发明的所有特征和方面，也没有暗示本发明必须包括概述中所讨论的所有特征和方面。[0035]研究人类基因组的常规实验方法受限于无法单独研究染色体的每个同源拷贝。这些单倍型是基因组的重要特征，但一般不易确定。全基因组单倍型的确定将应用于个体基因组学、单细胞基因组学和统计遗传学。
[0036]在努力克服上述现有技术中非侵入性确定胎儿遗传亲本单倍型的方法，特别是在全基因组规模的不足时，本发明人惊奇地发现，通过将包含区域的多个同源拷贝的混合物稀释成单分子密度，并在单分子上进行遗传分析，可以测量单倍型。特别是，本发明人已开发整体扩增单细胞内的单个、完整染色体分子的方法，从而扩增材料的高通量遗传分析提供个体的全基因组单倍型。
[0037]本发明涉及非侵入性地确定胎儿所继承的亲本单倍型的装置和方法。由于胎儿遗传物质存在于母方血液中，来自怀有至少一个胎儿的妊娠女性的样本足以鉴定亲本单倍型以及胎儿的遗传信息，而不需要对胎儿侵入性采样，并因此避免在妊娠期间对胎儿可能存在的风险。
[0038]因此，在某些方面本发明包括非侵入性地确定胎儿所继承的亲本单倍型的方法，包括(a)从怀有至少一个胎儿的妊娠女性获得母方样本,其中所述的样本含有来自妊娠女性和胎儿的DNA ； (b)通过下列步骤确定父方遗传的单倍型:(i)在胎儿父亲的DNA中确定一组单核苷酸多态性(SNP) ; (ii)确定胎儿母亲DNA中的一组SNP ;(iii)确定父亲中杂合的以及母亲中纯合的所有SNP，来鉴定父亲中存在而在母亲中缺失的各种基因座的等位基因，从而确定父亲的各单倍型jP(iv)计数各父方单倍型上的代表性等位基因，来确定两个单倍型的出现(representation) ； (v)比较两个单倍型的出现来获得相对出现；(vi)确定两个单倍型之一的过度出现ε jP(vii)使过度出现ε与父方遗传的单倍型关联；以及(c)通过如下步骤确定母方遗传的单倍型:(i)确定胎儿母亲中所有杂合的SNP ; (ii)在各SNP基因座上鉴定在母亲中存在但在父方遗传的单倍型中缺失的等位基因，以确定母亲的单倍型；(iii)计数各母方单倍型上的代表性等位基因进行，来确定两个单倍型的出现；(iv)比较两个单倍型的出现来获得相对出现；(V)确定两个单倍型之一的过度出现ε ;和(vi)使过度出现ε与母方遗传的单倍型关联。
[0039]本发明还涉及非侵入性地确定由胎儿所继承的母方单倍型的方法，包括:(a)从怀有至少一个胎儿的妊娠女性获得母方样本，其中所述的样本含有来自妊娠女性和胎儿的DNA ； (b)计数样本中定义两个母方单倍型中的每一个的标记物，以确定两个单倍型的出现；(C)比较两个单倍型的出现来获得相对出现；(d)确定两个单倍型之一的过度出现ε ；和(e)使过度出现ε与遗传的(transmitted)母方单倍型关联。
[0040]本发明还包括确定一组适当标记物的方法，所述标记物定义母方单倍型，方法包括:确定在第一母方单倍型中的多态性基因座上存在，但在第二母方单倍型上的对应基因座却缺失的等位基因。
[0041]本发明的另一方面是提供确定数字取样的最小量来实现所需的关于哪种亲本单倍型过度出现的置信水平的方法，包括(a)估计样本中存在的胎儿DNA的分数；及6)估计可用标记物的密度。
[0042]然而，本发明的另一个方面是提供估计母方样本中胎儿DNA分数的方法，包括，通过检验母方单倍型之一的过度出现或存在父方遗传的单倍型，来测量亲本单倍型的相对出现。
[0043]本发明的另一个方面是提供用于进行本发明方法的微流体装置，其中装置包括Ca)染色体划分区；(b)扩增区；和((3)产物回收区，以及任选(d)细胞分选区jP(e)染色体释放区。
[0044]本发明还包括用于控制微流体装置和用于分析样本数据的计算机程序。
[0045]通过如下本发明优选实施方式的更具体描述，本发明的上述和其它目的、特征和优点将是显而易见的，正如附图所示的，其中相同参考符号表示所有不同视图中的相同部分。这些附图不一定按比例绘制，而是将重点放在说明本发明的原理上。

[0046]申请文件含有至少一副以颜色表示的图。含有彩色图的来自本申请的任何专利或专利申请公布的拷贝，依据请求以及缴纳必要费用后由局提供。
[0047]图1.非侵入性确定胎儿基因组的策略的概要。当来自父母双方的血液或其它遗传物质可获得的情况下，获得亲本的全基因组、染色体长度单倍型，例如在这项研究中使用直接的确定性分相(phasing)。通过它们各自特异性的等位基因区分四种亲本单倍型。通过母方血浆的鸟枪测序实现亲本单倍型的分子计数。通过在每个母方单倍型上对等位基因进行计数并确定两个母方单倍型的相对出现来揭示母方单倍型的遗传。通过对特异于各父方单倍型的等位基因数目进行计数确定父方单倍型的遗传。当血液仅可从妊娠母方获得的情况时，以同样方式确定母方单倍型的遗传，但是基于母方血浆中检测到的父方特异性等位基因，通过归算(imputation)重建父方遗传的单倍型。
[0048]图2.微流体装置，其设计用于扩增来自单细胞的中期染色体，以实现直接的确定性分相(DDP)。显微镜下识别单个中期细胞并捕获于区域A中。引入蛋白酶(胃蛋白酶，低pH)以在区域B中产生染色体悬液。染色体悬液被划分为48个单元(区域C)。在每个分区中的内容物单独进行扩增(区域D)。具体而言，在低pH条件下的染色体首先进行中和，并用胰蛋白酶处理来消化染色体蛋白质。用碱使染色体变性，随后经中和用于进行多链置换扩增。随着试剂相继被引入到每一个充气室，装置材料的透气性使得能够将染色体推入一个室接着进入下一个，并最终到达扩增室。在收集口(区域E)回收经扩增的材料。在装置的概览图中，控制通道充满绿色染料。细胞分选区和扩增区中的流通道分别充满红色和蓝色染料。
[0049]图3.用于全基因组单倍型分型的微流体装置概述。
[0050]图4.在微流体装置中，使用46基因座PCR确定扩增产物的染色体来源身份。此表代表了使用PO培养的全血的单个中期细胞的实验结果。行代表微流体装置上室中内容物，列代表基因座，具有指定的染色体和坐标(NCBI Build36.1)。在两个室中发现各基因座，除17和20号染色体上的那些以外。SNP的两个等位基因以红色和绿色突出显示。杂合基因座用蓝色标记。室编号标记为黄色的汇集在一起，并在一个全基因组基因分型阵列上进行基因分型，而室编号标记为橙色的汇集在一起`，并在另一个阵列上进行基因分型。从培养的全血中提取基因组DNA也用相同的46个基因座PCR进行测试。
[0051]图5.全基因组单倍型分型的统计。A.显示针对每个个体的各染色体分相的阵列上存在的SNP分数(fraction)的棒状图(GM12891、GM12892、GM12878和欧洲个体PO)，显示为彩色条。B.棒状图针对每个个体显示每SNP分相的复制数。
[0052]图6.GM12878约160，000个杂合SNP (三人组(trio)的孩子)实验确定的分相和通过HapMap计划III期确定的那些进行比较。确定的SNP是指对于至少一个亲本是纯合的那些，并且使用HapMap中的家庭数据进行确定性分相。这一比较显示DDP的准确性。不确定的SNP是指对于三人组的所有成员都是杂合的那些，在HapMap中使用统计分相。这一比较表明，即便家庭数据可以获得，实验分相也是重要的。
[0053]图7.表显示父方(GM12891)和母方(GM12892)染色体中的交叉区域，产生CM12878
的基因组。
[0054]图8A.在CEU家庭的三人组中，使用SNP阵列的数据进行杂合缺失的分相。在图8中，“同源物I”绘制在右边，而“同源物2”绘制在左边。携带区域拷贝的同源物粗体显示。B.在CEU家庭的三人组中，使用实时PCR进行杂合缺失的分相。携带区域拷贝的同源物粗体显示。a经分型的标记物数目/区域内至少一个同源物中经分型的标记物数目；b至少一个同源物不包含任何经分型的标记物Z提供阳性PCR扩增的同源物数目/测试的同源物数目^两个同源物均提供阳性PCR扩增，尽管对于两个个体而言，这种CNV的拷贝数为I。
[0055]图9.家庭的三人组中，重组事件的直接观察以及杂合缺失的确定性分相。每个等位基因以彩色水平线表示，可获得孩子和亲本的DDP数据。从父方遗传给孩子的等位基因用蓝色标记。从母方遗传给孩子的等位基因用红色标记。未遗传的等位基因被标记为黑色。着丝粒和异染色质区域没有通过基因分型阵列进行分析，因此为白色。沿着各同源染色体，亲本中的杂合缺失表示为三角。实三角代表一个拷贝，而空三角表示一个无效(null)拷贝。针对各亲本独立确定缺失的分相。根据遗传状态用颜色对三角进行编码，其中遗传状态由相对于重组的位置通过缺失定位进行确定。独立于亲本，确定孩子中的缺失分相，并显示在亲本染色体的顶部。左边的整数是HapMap III期给出的各区ID。右边的数字是通过HapMap确定的孩子中的区域拷贝数。以相同的长度绘制染色体。 [0056]图10.分相SNP的分数作为所分析的同源染色体对数量的函数。这基于四次PO的单细胞实验的结果。每一个点代表常染色体的覆盖。误差棒代表平均值的标准误差。
[0057]图11.通过基因分型阵列较难获得区域中具有相对较高GC含量的SNP，可能是因为在较高GC含量的区域phi29的扩增效率降低。这里绘制的是，通过基因分型阵列分相的SNP分数(基于阵列划分扩增材料中等位基因类型的能力)作为SNP所处区域的GC含量的函数。这里显示的是，使用Illumina的OmnilS阵列进行的PO全基因组单倍型分型数据。测量每500kb的bin (无对应译文)内成功分相的SNP的分数，并对应着bin的GC含量进行绘制。22个常染色体分为3组，给予三色标记，这取决于所分析的同源拷贝对数量是多少(四个试验单细胞之中)。
[0058]图12.通过测序的分相与通过基因分型阵列的分相的一致性(concordance)作为测序覆盖率的函数。对PO的6号染色体上三个不同拷贝进行测序。只比较用基因分型阵列进行两次以上分相的SNP。
[0059]图13.表显示PO的6号染色体的两个同源拷贝的高通量测序的统计。将读取对应到 NCBI Build36 上。
[0060]图14.对于经测序的6号染色体的三个不同同源拷贝，32bp读取在整个6号染色体上的分布，标记为文库1、2和3，并以蓝色、红色和黑色的棒表示。顶部:相对于样本中位数，每500kb的读取数。每个图显示成对比较。着丝粒和多态性MHC区域内的序列无法正确比对。中部:同上，除冗余读取被删除以外，该冗余读取可能是由于对文库制备物测序过程中的PCR造成的。底部:每个bin的读取数累积分布，bin的大小范围从50kb到500kb。
[0061]图15.PO的实验确定的分相和通过PHASE确定的那些的比较。随机选择常染色体上七十六个区域并进行三次统计学分相。每个区域携带100个杂合SNP并横跨平均~2MB。切换误差率(Switch error rate)计算为不同分相的杂合SNP相对于紧挨着的上游SNP的比例。单位点误差率计算为错误分相的杂合SNP的比例。如果它有占主导的分相，则认为SNP被正确分相。对于每个区域，报道三次运行的平均值。通过DDP测量的确定性分相作为实际基础(ground truth)。
[0062]图16.PO的杂合缺失的分相。携带祀区域的同源物以粗体显示。i^PPushkarev等人2009中的补充表4相同的标记；b被选择用于定义PO的6号染色体的两个同源物拷贝的杂合SNP ；c每个同源物拷贝上所选SNP的等位基因；d经分型的标记物数目/区域内至少一个同源物中经分型的标记物数目Z阳性或阴性PCR信号；f在获自3个单细胞的分离的染色体同源物的扩增材料上进行PCR实验(“C”是指来自3个单细胞中相同同源物的组合基因分型结果)^对于这种特定单细胞实验未分离同源拷贝。
[0063]图17.使用DDP确定的PO的HLA单倍型。在各6个经典HLA基因座上，将PO的实验分相的SNP单倍型和HapMap III期可获得的CEU三人组的176分相的SNP单倍型放置在邻接树上(neighbor-joining tree)。PO的两个单倍型以红色和蓝色标记。对于带有HLA分型数据的CEU组(panel)中的单倍型，四个数字等位基因出现在样本标记的旁边。树的大部分被压缩。如果HLA等位基因信息可获得的话，每个压缩的子树用和子树内的成员相关的HLA等位基因进行标记。单倍型I上HLA-B和HLA-C的等位基因身份不用DDP进行确定，因为具有和POSNP单倍型相似的SNP单倍型的CEU个体在这些基因座上不具有HLA分型数据，但是可以从基因组DNA的直接HLA分型结果推导出来(表中的第一行)。HLA-DQAI不能直接分型。
[0064]图18.用于全基因组单倍型分型的46个基因分型分析的列表。
[0065]图19.用于家庭三人组中杂合缺失的分相的引物序列和Taqman探针。
[0066]图20.母方血浆中胎儿DNA分数和推导母方单倍型遗传所需的取样深度之间的关系。取样深度的测量是遗传的母方单倍型上出现标记物/bin的中位数。在不同的置信水平，给定胎儿DNA分数的预测取样需求绘制为实线。
[0067]图21.确定含有母方和孩子基因组DNA的混合物中亲本单倍型的孩子遗传。A.母方单倍型。每个黑圈对应着两个母方单倍型的相对出现，使用在圆圈中心IOMb区域内的标记物评估相对出现。每个黑圈随附有对应着针对各测量的95%置信区间的误差棒，通过模拟读取分布，假设各母方单倍型的计数是泊松随机变量的平均值，通过模拟读取的分布来评估。用IOOkb的滑动窗计算相对出现。如之前三人组的全基因组单倍型分型实验所确定的，母方单倍型的真实遗传作为背景显示(红色:从母亲遗传给女儿；灰色:未遗传；白色:异染色质/着丝粒)。所有染色体以相同的长度绘制。B.父方单倍型。白色交叉代表测序数据中观察到的两个父方单倍型中每一个上的父方等位基因。各黑圈对应着两个父方单倍型的相对出现，使用在圆圈中心IOMb区域内的标记物评估相对出现。用IOOkb的滑动窗计算相对出现。如之前三人组的全基因组单倍型分型实验所确定的，父方单倍型的真实遗传作为背景显示(蓝色:从父亲遗传给女儿；灰色:未遗传；白色:异染色质/着丝粒)。所有染色体以相同的长度绘制。C.测量交叉事件的分辨率。对于母方染色体上的交叉事件，绘制各测量的交叉和对应的真实交叉之间的距离。对父方染色体上的交叉事件，绘制各测量的交叉事件宽度。通过分辨率分选交叉事件。
[0068]图22.确定母方血浆DNA中胎儿的母方单倍型遗传。A.患者1，早期孕期(头三个月)的血浆。常染色体和X染色体bin的大小分别是15Mb和20Mb。B.患者1，中期孕期的血浆。常染色体和X染色体bin的大小分别是7.5Mb和10Mb。C.患者2。常染色体和X染色体bin的大小分别是3.5Mb和5Mb。22号染色体着丝粒附近的蓝色区域表示母方单倍型之一上和DiGeorge综合征相关的缺失区域。D.母方染色体上各测量的交叉和各自的真实交叉之间的距离。通过距离分选交叉事件。Pl的早期孕期文库中丢失两个事件。
[0069]图23.基于母方血浆中检测到的父方特异性等位基因，重建父方遗传的染色体。A.在母亲是纯合的位置上每碱基覆盖的分布。蓝:父方特异性等位基因，红色:父方特异性等位基因+母方等位基因。B.在不同测序深度检测的父方特异性等位基因分数。
[0070]图24.母方基因组的直接确定性分相(DDP)。对于患者I (Pl)和患者2 (P2)，分别使用3和4个单细胞实现全基因组单倍型分型。

[0071]如【背景技术】部分中所讨论的，单倍型是难以测量的，因为它需要单独分析基因组中区域的两个同源拷贝的每一个。尽管将携带几乎相同的同源区的两条DNA链物理上分离是具有挑战性的，单分子分析非常适于本申请。通过将含有区域的多个同源拷贝的混合物稀释成单分子密度，并在单分子上进行遗传分析，可以测量单倍型。这是多个发表的分子单倍型技术背后的概念(Zhang等人，2006 ;Mitra等人，2003 ;Ding & Cantor, 2003 ；Michalatos Beloin 等人，1996 ；Ruano 等人，1990 ；Xiao 等人，2009),但是，由于分析是在DNA提取过程中被片段化的DNA上进行的，他们无法提供全基因组单倍型，和/或他们只能测量一个分子上的几个基因座。这里提出的策略，通过全面扩增来自单细胞的单个完整染色体分子，解决了这些问题，从而扩增材料的高通量遗传分析提供个体的全基因组单倍型。
[0072]非侵入性测量在胎儿中是杂合的在母方中是纯合的胎儿基因型并不重要，因为只需要检测到母方中不存在的等位基因的存在。非侵入性测量在母方中是杂合的胎儿基因型更具挑战性，但具有重要的应用，尤其是用于诊断常染色体隐性疾病。在父母双方都是疾病相关基因座携带者的这种情况下，确定胎儿是否遗传了隐性等位基因的两个拷贝是有趣的。像非整倍体的检测，在这种情况下确定胎儿的基因型历来是困难的，由于母方血浆中的母方背景 DNA (Wheeler 等人，2008 ；Bentley 等人，2008 ；Ahn 等人，2009 ;Kim 等人，2009 ；Wang 等人，2008 ；Pushkarev 等人，2009 ；Schuster 等人，2010)。
[0073]非侵入性检测胎儿非整倍体的单分子计数的相同方法可以用于开发用于检测胎儿中常染色体隐性疾病的分析。对兴趣双等位基因SNP中每个等位基因的数目进行简单计数，并确定两个等位基因的计数是否平衡。如果一个等位基因相对于另一个过度出现，那么对于过度出现的等位基因而言胎儿是纯合的。如果两个等位基因的计数是相似的，胎儿是杂合的。这种方法的一个缺点是每基因组当量只有一个拷贝的目标等位基因，可信的测量需要等位基因的大量计数，并且每体积血浆的DNA量有限。然而，由于各个体人类从他/她父母双方继承了大的单倍型块(block)，各亲本单倍型定义为特异性等位基因的大的集合，本发明人认识到对单倍型特异性标记物进行数字计数使得能够确定在基因座上胎儿遗传了哪一个等位基因，而不会遇到样本限制的问题。
[0074]此处使用如下定义:
[0075]通过“等位基因”是指基因两个或两个以上的形式之一。二倍体生物体如人类包含每个染色体的两个拷贝，从而在每个上携带一个等位基因。
[0076]通过“纯合”是指生物体在某一特定基因座上包含两个相同的等位基因。
[0077]通过“杂合”是指生物体在某一特定基因座上包含两个不同的等位基因。
[0078]通过“单倍型”是指沿着单条染色体在多个基因座上等位基因的组合。单倍型可以基于单条染色体上的一组单核苷酸多态性(SNP)。
[0079]通过“单倍型块”是指被一起遗传的一组等位基因。[0080]单倍型是指沿着单条染色体在多个基因座上等位基因的组合。它们之所以出现是因为我们基因组的二倍体性质。在个体化医学中知晓个体完整的单倍型是重要的，因为一些研究已经证实特定的单倍型与疾病抗性或易感性之间的关联。一个众所周知的例子是人类白细胞抗原(HLA)单倍型与自身免疫性疾病(de Bakker等人，2006 ;Stewart等人，2004)以及移植的临床结果(Petersdorf等人,2007)相关。载脂蛋白基因簇内的单倍型可能影响血衆甘油三酯浓度和动脉粥样硬化的风险(Groenendi jk等人，2001 )。一些研究表明，特定的3-珠蛋白基因座单倍型与较好的镰刀状细胞病预后有关(Nagel等人，1991)，而其它研究已将基质金属蛋白酶基因簇的单倍型与癌症发展关联起来(Sun等人，2006)。单倍型在药物基因组学中也是重要的，一个实例是β_2肾上腺素受体与对哮喘的药物治疗的反应相关(Drysdale等人，2000)。确定性单倍型分型大大提高了全基因组关联研究在寻找与常见但复杂性状相关的候选基因中的能力。它还有助于了解人口遗传学和历史人类迁徙以及基因出现中顺式作用调节的研究。
[0081]通过“归算”是指，根据统计学上关联单倍型块中特定SNP的共同表型(appearance)的事实，明确鉴定染色体区域中所有多态性位点的能力。
[0082]除非另有指明，此处所用的所有技术和科学术语具有与本发明所属领域普通技术人员通常所理解的相同的含义。虽然任何和此处所述的那些类似或等同的方法和材料可用于本发明的实施或测试，对优选的方法和材料进行了描述。一般来说，与细胞和分子生物学和化学的技术有关的所用系统命名是众所周知的，并且在本领域中是常用的。没有特别指明，某些实验技术通常是根据本领域中公知的以及贯穿本说明书中引用和讨论的各种常规和更具体的参考文献中所描述的常规方法进行。为了清楚起见，如下术语定义如下。
[0083]本发明认识到只要对亲本(染色体同源拷贝的每个的序列)的二倍体基因组进行测序，通过确定遗传了哪个亲本单倍型就可以计算出胎儿基因组。来自亲本的单倍型信息的可用性大大降低了对输入血浆DNA的要求。不是计数特定SNP基因座上的等位基因，单倍型块内所有SNP的等位基因计数可有助于确定遗传了哪个亲本单倍型。由于减数分裂中交叉事件的数目是有限的，在原亲本染色体中的断裂数是小的，且对于每个亲本单倍型存在大量可以测量的有提示性的SNP。这种方法也提供了拷贝数变体遗传的有关信息。
[0084]简单地说，本发明涉及非侵入性确定胎儿所继承的亲本单倍型的方法和装置，并可能用来非侵入性确定胎儿基因组、或其部分。使用父方和母方的信息组合可进行该方法，或者可以仅利用母方的单倍型信息。为了进行该方法，获得含有母方和胎儿遗传物质的母方组织。优选地，母方组织是母方外周血或血浆。术语“血浆”可包括血浆或血清。为了区分来自胎儿结果的随机变化，运行大量的反应，并对结果应用统计方法。
[0085]离散样本在反应样本中，其中可以分析靶序列。反应样本可以是，例如，微量滴定板中的孔、乳液中的水相、阵列表面的区域、或微流体装置中的反应室。反应样本可用于离散样本的PCR分析。离散样本与多个PCR引物接触，包括至少一个(或一个正向和一个反向)特异于母方对照序列的引物，对照序列预计在母方和胎儿中是相同的。PCR引物也特异于胎儿序列，即母方和胎儿中可能都存在，但是在胎儿中扩增或改变。PCR扩增将允许检测这两个不同的序列。PCR方法可以是(但不一定是)定量的。可使用定量实时PCR，其包括用具有荧光标记的核酸与靶序列杂交。也可以使用与靶序列杂交的荧光探针。已知用于此目的的一些“数字PCR”规程，以及基于珠的或乳液PCR。尽管荧光探针易于获得并可用于提供灵敏的结果，如在FRET组合中，也可以使用其它标记技术。
[0086]根据所需的结果选择离散样本数目。在一个方面，优选得到高度的统计学显著性，并且可以使用数字计数的任何方法，包括但不限于PCR、测序和杂交。要获得的结果，对于所进行的分析的目的(例如初步筛选、初步诊断等)，应当是统计学上显著的。当需要高度显著的结果时，统计学显著性的常用测量是P〈0.01，即根据卡方或t检验99%置信区间。在一些实施方式中，可以使用其它统计方法。例如，可使用SPRT确定截止值。Fan和Quake(2010b)表明只通过计数统计，胎儿异常的检测灵敏度是有限的。
[0087]根据本发明的方法可检测任何通过遗传可传播的疾病，包括一个或多个基因中已知的改变:CFTR、VIII因子(F8基因)、β-珠蛋白、血色素沉着症、G6PD、神经纤维瘤、GAPDH、β淀粉样蛋白、和丙酮酸激酶。这些基因的序列和常见突变(如，单核苷酸多态性或SNP)是已知的。可检测其它遗传异常，如参与人染色体中缺失的、易位或倒位中移动的、或在染色体复制中复制的序列的那些，其中所述序列的特征在于在胎儿遗传物质中的已知遗传病不存在于母方遗传物质中。例如染色体三体可包括部分的、嵌合的、环的18、14、13、8、6、4等。已知异常的列表可见于 OMIM Mobid 图 http://www.ncb1.nlm.nih.gov/Omim/getmorbid.cgi。
[0088]本发明包括一种用于分析母方样本，如来自外周血的方法。不像羊膜穿刺术或绒毛膜绒毛取样，其不侵入到胎儿空间。在优选方法中，使用母方血浆中存在的胎儿DNA。
[0089]在某些方面中，本发明可包括计算机，其经编程用来分析获自母方和胎儿染色体DNA混合物的序列数据。每个常染色体(染色体1-22)被计算机分割成连续的、非重叠窗口(也可使用滑动窗)。每个窗有足够的长度以包含定义各亲本单倍型的等位基因的大量计数(且计数依赖于测序深度和窗内的标记物数目)，但每条染色体上不仍具有多个窗。通常情况下，窗在几百kb和几个Mb之间。
[0090]更详细地，通过如下代表了其优选实施方式的项目描述本发明。
[0091]1、一种非侵入性确定由胎儿所遗传`的亲本单倍型的方法，包括:
[0092]a.从怀有至少一个胎儿的妊娠女性获得母方样本，其中所述样本含有来自妊娠女性和胎儿的DNA ；
[0093]b.通过如下步骤确定父方遗传的单倍型:
[0094]1.在胎儿父亲的DNA中确定一组单核苷酸多态性(SNP)；
[0095]i1.确定胎儿母亲DNA中的一组SNP;
[0096]ii1.确定父亲中杂合的以及母亲中纯合的所有SNP，来鉴定父亲中存在而在母亲中缺失的各种基因座等位基因，从而确定父未的各单倍型；和
[0097]iv.在各父方单倍型上对代表性等位基因进行计数，来确定两个单倍型的出现；
[0098]V.比较两个单倍型的出现来获得相对出现；
[0099]v1.确定两个单倍型之一的过度出现ε ;和
[0100]vi1.关联所述过度出现ε与父方遗传的单倍型；以及
[0101]c.通过如下步骤确定母方遗传的单倍型:
[0102]1.确定胎儿母亲中所有杂合的SNP ;和
[0103]i1.在各SNP基因座上鉴定在母亲中存在但在父方遗传的单倍型中缺失的等位基因，以确定母亲的单倍型；[0104]ii1.在各母方单倍型上对代表性等位基因进行计数，来确定两个单倍型的出现；
[0105]iv.比较两个单倍型的出现来获得相对出现；
[0106]v.确定两个单倍型之一的过度出现ε ;和
[0107]v1.关联过度出现ε与母方遗传的单倍型；
[0108]2、根据项目I所述的方法，其中通过对标记物进行数字计数测量单倍型的相对出现，其中所述标记物是定义各亲本单倍型的等位基因。
[0109]3、根据项目I所述的方法，其中比较特异于每个固定距离上两个母方单倍型每一个的标记物计数总和，确定哪个母方单倍型过度出现。
[0110]4、根据项目I所述的方法，其中比较特异于每个固定距离上两个父方单倍型每一个的标记物计数总和，确定哪个父方单倍型过度出现。
[0111]5、根据项目2所述的方法，其中通过测量单个DNA分子计数的数量进行数字计数。
[0112]6、根据项目5所述的方法，其中通过测序、数字聚合酶链式反应(PCR)或杂交(或能够读取单个DNA分子上特定基因座上等位基因身份的任何方法)进行测量。
[0113]7、根据项目I所述的方法，其中确定胎儿基因组的一部分。
[0114]8、根据项目7所述的方法，其中确定整个胎儿基因组。
[0115]9、一种通过测量项目I的亲本单倍型的相对出现来估计胎儿DNA分数的方法。
[0116]10、一种非侵入性确定由胎儿所遗传的母方单倍型的方法，包括:
[0117]a.从怀有至少一个胎儿的妊娠女性获得母方样本，其中所述样本含有来自妊娠女性和胎儿的DNA ；
[0118]b.计数所述样本中定义两个母方单倍型中每一个的标记物，以确定两个单倍型的出现；
[0119]c.比较两个单倍型的出现来获得相对出现；
[0120]d.确定两个单倍型之一的过度出现ε ;和
[0121]e.关联所述过度出现ε与遗传的母方单倍型。
[0122]11、根据项目10所述的方法，其中通过对标记物进行数字计数测量单倍型的相对出现，其中所述标记物是定义各母方单倍型的等位基因。
[0123]12、根据项目11所述的方法，其中比较特异于每个固定距离上两个母方单倍型每一个的标记物计数总和，确定哪个母方单倍型过度出现。
[0124]13、根据项目11所述的方法，其中通过测量携带特异性标记物的单个DNA分子计数的数量进行数字计数。
[0125]14、根据项目13所述的方法，其中通过测序、数字聚合酶链式反应(PCR)或杂交(或能够读取单个DNA分子上特定基因座上等位基因身份的任何方法)进行测量。
[0126]15、根据项目10所述的方法，其中确定胎儿基因组的一部分。
[0127]16、根据项目15所述的方法，其中确定整个胎儿基因组。
[0128]17、根据项目10所述的方法，还包括非侵入性重建父方遗传的单倍型。
[0129]18、根据项目17所述的方法，其中使用样本中检测到的父方特异性等位基因，通过单倍型归算实现父方遗传的单倍型的重建。
[0130]19、一种确定一组适当标记物的方法，所述标记物定义母方单倍型，包括确定在第一母方单倍型中的多态性基因座上存在，但在第二母方单倍型上的对应基因座却缺失的等位基因。
[0131]20、根据项目19所述的方法，其中在第一母方单倍型中的多态性基因座上存在但在第二母方单倍型上的对应基因座却缺失的等位基因也不在两个父方单倍型的对应基因座上。
[0132]21、一种确定一组适当标记物的方法，所述标记物定义父方单倍型，包括确定在第一父方单倍型中的多态性基因座上存在，但在第二父方单倍型上的对应基因座却缺失的等位基因。
[0133]22、根据项目21所述的方法，其中在第一父方单倍型中的多态性基因座上存在但在第二父方单倍型上的对应基因座却缺失的等位基因也不在两个母方单倍型的对应基因座上。
[0134]23、根据项目21所述的方法，其中组中的标记物数目可以通过单倍型归算而增加。
[0135]24、根据项目18或23所述的方法，其中单倍型归算包括:
[0136]通过将待归算的单倍型上所观察到的等位基因与之前归档的单倍型数据库进行比较，在任何未测量的基因座上统计推导等位基因身份，其中之前归档的单倍型数据库的单倍型的等位基因身份在测量和未测量的基因座上均是已知的。
[0137]25、根据项目23所述的方法，其中所述数据库来自正常群体。
[0138]26、根据项目23所述的方法，其中所述数据库来自携带可通过遗传传播的特定疾病的群体。
[0139]27、一种确定数字取样的最小量来实现所需的关于哪种亲本单倍型过度出现的置信水平的方法，包括:
[0140]a.估计样本中存在的胎儿DNA的分数；和
[0141]b.估计可用标记物的密度。
[0142]28、一种估计胎儿DNA分数的方法，包括测量胎儿单倍型的相对出现。
[0143]29、根据项目19或21所述的方法，其中可以通过如下实现确定一组定义个体单倍型的标记物:
[0144]a.在相关家庭成员当中比较多态性基因座上的等位基因；或
[0145]b.分析单个DNA分子或单个染色体分子上多态性基因座上的等位基因。
[0146]30、一种用于进行项目27所述方法的微流体装置，包括:
[0147]a.染色体划分区；
[0148]b.扩增区；和
[0149]c.产物回收区。
[0150]31、根据项目30所述的微流体装置，还包括:
[0151]a.细胞分选区；
[0152]b.染色体释放区；
[0153]32、根据项目31所述的装置，其中在所述细胞分选区中，从细胞悬液中鉴定并捕获单个中期细胞，并进行裂解而形成染色体悬液。
[0154]33、根据项目31所述的装置，其中在所述染色体划分区中，染色体悬液被随机分到多个通道划分中。[0155]34、根据项目30所述的装置，其中在所述扩增区中，分离的染色体通过多链置换扩增单独进行扩增。
[0156]35、一种用于控制项目30的微流体装置的计算机程序。
[0157]提供如下实施例以帮助理解本发明，真正的范围如所附权利要求书中所述。应当了解，在不脱离本发明精神的情况下，所述程序可以进行修改。
[0158]实施例:
[0159]结合如下实施例将更好的理解本发明的组合物和方法，其仅意图作为一个说明，而非限制本发明的范围。所公开的实施方式的各种变化和修改，对于本领域技术人员而言是显而易见的，并且这种变化和修改包括但不限于，在不脱离本发明精神和所附权利要求书范围的情况下，做出涉及本发明的过程、制剂和/或方法的那些。
[0160]实施例1
[0161]为了解决现有技术中的缺点，本发明人已经开发出一种被称为“直接确定性分相”(DDP)的方法，其中来自单细胞的完整染色体在微流体装置上被分散和扩增(图2、3)。图2和图3代表用于分离和扩增单细胞内染色体的微流体装置的概况。三个罩以40，OOOdpi分辨率被印在透明胶片上(Fineline Imaging), —个带有5m流层的图式,一个带有40pm流层的图式，以及一个带有25pm控制层的图式。两个带有流层的罩规模扩大1.5%以适应当它从模具中剥离时厚PDMS层的收缩。用正性光刻胶(photoresist)产生流模具，而用负性光刻胶产生控制模具。本节中的操作由斯坦福微流体铸造厂(Stanford MicrofluidicsFoundry)提供。
[0162]微流体装置具有5个区域(图2)。其由如下组成:细胞分选区，其中显微镜下鉴定并从细胞悬液中捕获单个中期细胞；染色体释放区，其中通过细胞质蛋白酶消化释放中期染色体；染色体划分区，其中染色体悬液随机分到48个狭长通道的分区；扩增区，其中分离的染色体通过多链置换扩增单独进行扩增；以及产物回收区，其中单独收集扩增的产物。
[0163]微流体装置由聚二甲基硅氧烷(PDMS)制成，并采用多层软光刻技术铸造(Unger等人，2000 ;Thorsen等人，2002 ;Melin & Quake, 20070。两层装置在底部具有矩形25pm高控制通道(tall control channel),并在顶部环绕流通道。装置连接包被有薄PDMS层的玻片。在装置的细胞分选区，流通道为40μπι高且200μπι宽。在装置的扩增区中，流通道为5 μ m和100 μ m宽，且反应室为40 μ m高。在控制通道和流通道交叉的位置形成“上推”(push-up)膜阀，且当控制通道加压至20-25psi时膜阀被启动，并向上推挤流通道。对于40 μ m的流通道而言，每个阀的面积为200 μ mX200 μ m,对于5 μ m流通道为100 UmXlOOym0通过外部气动电磁阀控制膜阀，气动电磁阀由连接至计算机USB 口的自定义电子设备驱动。编写Matlab程序与阀交接(interface)。由芯片上的一组螺动泵控制细胞分选区内的流体流。在扩增区中，由于PDMS的透气性，有可能通过终端(dead-end)填充依次引入试剂。根据每个反应室的体积确定引入试剂的量。该装置制造的详细操作如下。
[0164]装置的制备
[0165]流模具包含两个高度的圆形特征(feature)。用SPR220-7光刻胶制造具有5 μ m特征的第一层。用AZ50光刻胶制造具有40 μ m特征的第二层:
[0166]1.用HDMS (六甲基二硅氮烷)处理晶片(wafer ) 5分钟。[0167]2.旋涂 5PR220-7:500rpm 持续 5s，3200rpm 持续 30s。
[0168]3.软烤:115°C持续 90s。
[0169]4.暴露于UV持续65s。
[0170]5.通过在MF-319中浸泡3-5分钟形成罩(develop mask)。用水冲洗。
[0171]6.硬烤:以每小时10°C的升温速率，经15小时使温度从25°C提高到190°C。
[0172]7.用HDMS处理晶片5分钟。
[0173]8.旋涂 AZ50:500rpm 持续 10s, IlOOrpm 持续 30s。
[0174]9.115°C软烤4分钟，65°C持续I分钟。热板设置到自动关闭并冷却至室温。
[0175]10.在2个30s周期中将晶片暴露于UV0 [0176]11.在AZ形成剂中形成罩。用水冲洗。
[0177]12.硬烤:以每小时10°C的升温速率，经15小时使温度从25°C提高到190°C。
[0178]控制模具包含25 μ m的矩形特征，用SU2025光刻胶进行制造:
[0179]1.旋涂 SU2025 光刻胶:500rpm 持续 5s，2700rpm 持续 60s。
[0180]2.软烤:65 °C持续2分钟，95 °C持续5分钟，65 °C持续2分钟。
[0181]3.暴露于UV持续20s。
[0182]4.后烘:65 °C持续2分钟，95 °C持续5分钟，65 °C持续2分钟。
[0183]5.在SU8形成剂中形成罩1-2分钟，用异丙醇冲洗。
[0184]6.硬烤:以120°C的升温速率，使温度从65°C提高到150°C。烤2小时。
[0185]用PDMS (聚二甲基硅氧烷)制造微流体装置:
[0186]1.厚层:通过将A部分和B部分以5:1的比例在一个混合搅拌机(hybrid mixer)中混合I分钟随后脱气2分钟，来制备50g RTV PDMS0将混合物倒入流模具，并在真空室中脱气30分钟，或直至气泡消失。在80°C烘烤I小时。
[0187]2.薄层:通过将A部分和B部分以20:1的比例在一个混合搅拌机中混合I分钟随后脱气2分钟，来制备21g RTV PDMS0以1500rpm的转速旋转60s，具有15s的升高时间(ramp time)，将混合物旋涂在控制模具上。在80°C烘烤40分钟。
[0188]3.从流模具上切割并剥离厚层。在厚层上打孔并对齐到涂有PDMS的控制模具。一起烘烤1.5h。
[0189]4.通过以2000rpm将RTV PDMS (20:1的A部分:B部分)直接旋涂在玻片上并在80 V烘烤40分钟，来涂覆空白玻片。
[0190]5.从控制模具上剥离厚层和薄层。打孔并置于玻片上。80°C烘烤过夜。
[0191]细胞培养
[0192]在装置上对两个类型的细胞进行了测试:国际HapMap计划中所用的类淋巴母细胞系(Iymphoblastoid)以及来自捐赠者全血细胞的淋巴细胞。
[0193]EBV-转化的类淋巴母细胞系(Coriell细胞存储库)培养于补充有15%胎牛血清的RPMI1640ο为了富集有丝分裂细胞群，各培养物用2mM胸苷(Sigma)在37°C处理24小时。随后是在PBS中多次洗涤，细胞在正常培养基中培养3小时，用200ng/ml诺考达唑(Sigma)在37°C处理2小时使细胞停滞在中期。
[0194]从指尖采集的全血(~250微升)用肝素钠处理,并在PB-Max介质(Invitrogen)中培养4天。培养物用50ng/ml秋水仙酰胺(Invitrogen)处理6小时。将培养物成层状置于Accuspin系统-Histopaque-1077 (Sigma)上，以2500rpm离心8分钟。除去界面上的有核细胞，用Hank氏缓冲盐溶液(HBSS)洗涤一次。
[0195] 停滞在中期的细胞与75mM KCl在室温下孵育10_15分钟。以2%的最终浓度在细胞悬液中加入乙酸，以固定细胞。在冰上固定30分钟后，用PBS-l%BSA-lmM EDTA将细胞洗涤两次，并用PBS-l%BSA-lmM EDTA-l%Triton洗涤一次，最后悬浮在75mM KCl-1mMEDTA-l%Triton X-100中。加载至微流体装置前,用0.2mg/mlRNaseA (Qiagen)处理细胞。
[0196]从无细胞血浆的DNA提取规程
[0197]血液处理
[0198]1.在EDTA真空采血管中收集20ml外周血。
[0199]2.以1600g管在4°C离心10分钟。
[0200]3.血浆的850ul分装至1.5ml聚丙烯管中，注意不要扰乱血沉棕黄色层。
[0201]4.以16000g将管在4°C离心10分钟以去除残留的细胞。
[0202]5.小心取出上清液(~800 μ I)并置于新1.5ml聚丙烯管中。
[0203]6.采集血液尽快进行离心。无细胞血浆的等份可以保存于-80°C，直到进一步的处理。
[0204]7.在这项研究中，使用两种商品化试剂盒，根据制造商的规程稍作修改后，从血浆中提取DNA。
[0205]使用QIAamp DNA微试剂盒(Qiagen)提取无细胞DNA
[0206]以下规程包含对制造商手册中“小体积血液规程”的修改。
[020

查看更多专利详情

下载专利文献

下载专利