在全基因组规模非侵入性确定亲本单倍型的胎儿遗传的制作方法[0001]政府资助的声明[0002]本发明根据国立卫生研究院所颁发的协议CA143907和0D000251得到美国政府的资助。政府在本发明中享有一定的权利。[0003]相关申请的交叉引用[0004]本申请要求2010年12月7日提交的US临时申请系列号61/420,768的优先权,其整个并入此处作为参考。[0005]参考序列表、计算机程序或光盘[0006] 申请人:主张序列表的文本副本和随附计算机文件中可见的计算机可读形式中的序列表是相同的。 申请人:将序列表内容整个并入作为参考。 [0034]以下简要概述不意图包括本发明的所有特征和方面,也没有暗示本发明必须包括概述中所讨论的所有特征和方面。[0035]研究人类基因组的常规实验方法受限于无法单独研究染色体的每个同源拷贝。这些单倍型是基因组的重要特征,但一般不易确定。全基因组单倍型的确定将应用于个体基因组学、单细胞基因组学和统计遗传学。
[0036]在努力克服上述现有技术中非侵入性确定胎儿遗传亲本单倍型的方法,特别是在全基因组规模的不足时,本发明人惊奇地发现,通过将包含区域的多个同源拷贝的混合物稀释成单分子密度,并在单分子上进行遗传分析,可以测量单倍型。特别是,本发明人已开发整体扩增单细胞内的单个、完整染色体分子的方法,从而扩增材料的高通量遗传分析提供个体的全基因组单倍型。
[0037]本发明涉及非侵入性地确定胎儿所继承的亲本单倍型的装置和方法。由于胎儿遗传物质存在于母方血液中,来自怀有至少一个胎儿的妊娠女性的样本足以鉴定亲本单倍型以及胎儿的遗传信息,而不需要对胎儿侵入性采样,并因此避免在妊娠期间对胎儿可能存在的风险。
[0038]因此,在某些方面本发明包括非侵入性地确定胎儿所继承的亲本单倍型的方法,包括(a)从怀有至少一个胎儿的妊娠女性获得母方样本,其中所述的样本含有来自妊娠女性和胎儿的DNA ; (b)通过下列步骤确定父方遗传的单倍型:(i)在胎儿父亲的DNA中确定一组单核苷酸多态性(SNP) ; (ii)确定胎儿母亲DNA中的一组SNP ;(iii)确定父亲中杂合的以及母亲中纯合的所有SNP,来鉴定父亲中存在而在母亲中缺失的各种基因座的等位基因,从而确定父亲的各单倍型jP(iv)计数各父方单倍型上的代表性等位基因,来确定两个单倍型的出现(representation) ; (v)比较两个单倍型的出现来获得相对出现;(vi)确定两个单倍型之一的过度出现ε jP(vii)使过度出现ε与父方遗传的单倍型关联;以及(c)通过如下步骤确定母方遗传的单倍型:(i)确定胎儿母亲中所有杂合的SNP ; (ii)在各SNP基因座上鉴定在母亲中存在但在父方遗传的单倍型中缺失的等位基因,以确定母亲的单倍型;(iii)计数各母方单倍型上的代表性等位基因进行,来确定两个单倍型的出现;(iv)比较两个单倍型的出现来获得相对出现;(V)确定两个单倍型之一的过度出现ε ;和(vi)使过度出现ε与母方遗传的单倍型关联。
[0039]本发明还涉及非侵入性地确定由胎儿所继承的母方单倍型的方法,包括:(a)从怀有至少一个胎儿的妊娠女性获得母方样本,其中所述的样本含有来自妊娠女性和胎儿的DNA ; (b)计数样本中定义两个母方单倍型中的每一个的标记物,以确定两个单倍型的出现;(C)比较两个单倍型的出现来获得相对出现;(d)确定两个单倍型之一的过度出现ε ;和(e)使过度出现ε与遗传的(transmitted)母方单倍型关联。
[0040]本发明还包括确定一组适当标记物的方法,所述标记物定义母方单倍型,方法包括:确定在第一母方单倍型中的多态性基因座上存在,但在第二母方单倍型上的对应基因座却缺失的等位基因。
[0041]本发明的另一方面是提供确定数字取样的最小量来实现所需的关于哪种亲本单倍型过度出现的置信水平的方法,包括(a)估计样本中存在的胎儿DNA的分数;及6)估计可用标记物的密度。
[0042]然而,本发明的另一个方面是提供估计母方样本中胎儿DNA分数的方法,包括,通过检验母方单倍型之一的过度出现或存在父方遗传的单倍型,来测量亲本单倍型的相对出现。
[0043]本发明的另一个方面是提供用于进行本发明方法的微流体装置,其中装置包括Ca)染色体划分区;(b)扩增区;和((3)产物回收区,以及任选(d)细胞分选区jP(e)染色体释放区。
[0044]本发明还包括用于控制微流体装置和用于分析样本数据的计算机程序。
[0045]通过如下本发明优选实施方式的更具体描述,本发明的上述和其它目的、特征和优点将是显而易见的,正如附图所示的,其中相同参考符号表示所有不同视图中的相同部分。这些附图不一定按比例绘制,而是将重点放在说明本发明的原理上。
[0046]申请文件含有至少一副以颜色表示的图。含有彩色图的来自本申请的任何专利或专利申请公布的拷贝,依据请求以及缴纳必要费用后由局提供。
[0047]图1.非侵入性确定胎儿基因组的策略的概要。当来自父母双方的血液或其它遗传物质可获得的情况下,获得亲本的全基因组、染色体长度单倍型,例如在这项研究中使用直接的确定性分相(phasing)。通过它们各自特异性的等位基因区分四种亲本单倍型。通过母方血浆的鸟枪测序实现亲本单倍型的分子计数。通过在每个母方单倍型上对等位基因进行计数并确定两个母方单倍型的相对出现来揭示母方单倍型的遗传。通过对特异于各父方单倍型的等位基因数目进行计数确定父方单倍型的遗传。当血液仅可从妊娠母方获得的情况时,以同样方式确定母方单倍型的遗传,但是基于母方血浆中检测到的父方特异性等位基因,通过归算(imputation)重建父方遗传的单倍型。
[0048]图2.微流体装置,其设计用于扩增来自单细胞的中期染色体,以实现直接的确定性分相(DDP)。显微镜下识别单个中期细胞并捕获于区域A中。引入蛋白酶(胃蛋白酶,低pH)以在区域B中产生染色体悬液。染色体悬液被划分为48个单元(区域C)。在每个分区中的内容物单独进行扩增(区域D)。具体而言,在低pH条件下的染色体首先进行中和,并用胰蛋白酶处理来消化染色体蛋白质。用碱使染色体变性,随后经中和用于进行多链置换扩增。随着试剂相继被引入到每一个充气室,装置材料的透气性使得能够将染色体推入一个室接着进入下一个,并最终到达扩增室。在收集口(区域E)回收经扩增的材料。在装置的概览图中,控制通道充满绿色染料。细胞分选区和扩增区中的流通道分别充满红色和蓝色染料。
[0049]图3.用于全基因组单倍型分型的微流体装置概述。
[0050]图4.在微流体装置中,使用46基因座PCR确定扩增产物的染色体来源身份。此表代表了使用PO培养的全血的单个中期细胞的实验结果。行代表微流体装置上室中内容物,列代表基因座,具有指定的染色体和坐标(NCBI Build36.1)。在两个室中发现各基因座,除17和20号染色体上的那些以外。SNP的两个等位基因以红色和绿色突出显示。杂合基因座用蓝色标记。室编号标记为黄色的汇集在一起,并在一个全基因组基因分型阵列上进行基因分型,而室编号标记为橙色的汇集在一起`,并在另一个阵列上进行基因分型。从培养的全血中提取基因组DNA也用相同的46个基因座PCR进行测试。
[0051]图5.全基因组单倍型分型的统计。A.显示针对每个个体的各染色体分相的阵列上存在的SNP分数(fraction)的棒状图(GM12891、GM12892、GM12878和欧洲个体PO),显示为彩色条。B.棒状图针对每个个体显示每SNP分相的复制数。
[0052]图6.GM12878约160,000个杂合SNP (三人组(trio)的孩子)实验确定的分相和通过HapMap计划III期确定的那些进行比较。确定的SNP是指对于至少一个亲本是纯合的那些,并且使用HapMap中的家庭数据进行确定性分相。这一比较显示DDP的准确性。不确定的SNP是指对于三人组的所有成员都是杂合的那些,在HapMap中使用统计分相。这一比较表明,即便家庭数据可以获得,实验分相也是重要的。
[0053]图7.表显示父方(GM12891)和母方(GM12892)染色体中的交叉区域,产生CM12878
的基因组。
[0054]图8A.在CEU家庭的三人组中,使用SNP阵列的数据进行杂合缺失的分相。在图8中,“同源物I”绘制在右边,而“同源物2”绘制在左边。携带区域拷贝的同源物粗体显示。B.在CEU家庭的三人组中,使用实时PCR进行杂合缺失的分相。携带区域拷贝的同源物粗体显示。a经分型的标记物数目/区域内至少一个同源物中经分型的标记物数目;b至少一个同源物不包含任何经分型的标记物Z提供阳性PCR扩增的同源物数目/测试的同源物数目^两个同源物均提供阳性PCR扩增,尽管对于两个个体而言,这种CNV的拷贝数为I。
[0055]图9.家庭的三人组中,重组事件的直接观察以及杂合缺失的确定性分相。每个等位基因以彩色水平线表示,可获得孩子和亲本的DDP数据。从父方遗传给孩子的等位基因用蓝色标记。从母方遗传给孩子的等位基因用红色标记。未遗传的等位基因被标记为黑色。着丝粒和异染色质区域没有通过基因分型阵列进行分析,因此为白色。沿着各同源染色体,亲本中的杂合缺失表示为三角。实三角代表一个拷贝,而空三角表示一个无效(null)拷贝。针对各亲本独立确定缺失的分相。根据遗传状态用颜色对三角进行编码,其中遗传状态由相对于重组的位置通过缺失定位进行确定。独立于亲本,确定孩子中的缺失分相,并显示在亲本染色体的顶部。左边的整数是HapMap III期给出的各区ID。右边的数字是通过HapMap确定的孩子中的区域拷贝数。以相同的长度绘制染色体。 [0056]图10.分相SNP的分数作为所分析的同源染色体对数量的函数。这基于四次PO的单细胞实验的结果。每一个点代表常染色体的覆盖。误差棒代表平均值的标准误差。
[0057]图11.通过基因分型阵列较难获得区域中具有相对较高GC含量的SNP,可能是因为在较高GC含量的区域phi29的扩增效率降低。这里绘制的是,通过基因分型阵列分相的SNP分数(基于阵列划分扩增材料中等位基因类型的能力)作为SNP所处区域的GC含量的函数。这里显示的是,使用Illumina的OmnilS阵列进行的PO全基因组单倍型分型数据。测量每500kb的bin (无对应译文)内成功分相的SNP的分数,并对应着bin的GC含量进行绘制。22个常染色体分为3组,给予三色标记,这取决于所分析的同源拷贝对数量是多少(四个试验单细胞之中)。
[0058]图12.通过测序的分相与通过基因分型阵列的分相的一致性(concordance)作为测序覆盖率的函数。对PO的6号染色体上三个不同拷贝进行测序。只比较用基因分型阵列进行两次以上分相的SNP。
[0059]图13.表显示PO的6号染色体的两个同源拷贝的高通量测序的统计。将读取对应到 NCBI Build36 上。
[0060]图14.对于经测序的6号染色体的三个不同同源拷贝,32bp读取在整个6号染色体上的分布,标记为文库1、2和3,并以蓝色、红色和黑色的棒表示。顶部:相对于样本中位数,每500kb的读取数。每个图显示成对比较。着丝粒和多态性MHC区域内的序列无法正确比对。中部:同上,除冗余读取被删除以外,该冗余读取可能是由于对文库制备物测序过程中的PCR造成的。底部:每个bin的读取数累积分布,bin的大小范围从50kb到500kb。
[0061]图15.PO的实验确定的分相和通过PHASE确定的那些的比较。随机选择常染色体上七十六个区域并进行三次统计学分相。每个区域携带100个杂合SNP并横跨平均~2MB。切换误差率(Switch error rate)计算为不同分相的杂合SNP相对于紧挨着的上游SNP的比例。单位点误差率计算为错误分相的杂合SNP的比例。如果它有占主导的分相,则认为SNP被正确分相。对于每个区域,报道三次运行的平均值。通过DDP测量的确定性分相作为实际基础(ground truth)。
[0062]图16.PO的杂合缺失的分相。携带祀区域的同源物以粗体显示。i^PPushkarev等人2009中的补充表4相同的标记;b被选择用于定义PO的6号染色体的两个同源物拷贝的杂合SNP ;c每个同源物拷贝上所选SNP的等位基因;d经分型的标记物数目/区域内至少一个同源物中经分型的标记物数目Z阳性或阴性PCR信号;f在获自3个单细胞的分离的染色体同源物的扩增材料上进行PCR实验(“C”是指来自3个单细胞中相同同源物的组合基因分型结果)^对于这种特定单细胞实验未分离同源拷贝。
[0063]图17.使用DDP确定的PO的HLA单倍型。在各6个经典HLA基因座上,将PO的实验分相的SNP单倍型和HapMap III期可获得的CEU三人组的176分相的SNP单倍型放置在邻接树上(neighbor-joining tree)。PO的两个单倍型以红色和蓝色标记。对于带有HLA分型数据的CEU组(panel)中的单倍型,四个数字等位基因出现在样本标记的旁边。树的大部分被压缩。如果HLA等位基因信息可获得的话,每个压缩的子树用和子树内的成员相关的HLA等位基因进行标记。单倍型I上HLA-B和HLA-C的等位基因身份不用DDP进行确定,因为具有和POSNP单倍型相似的SNP单倍型的CEU个体在这些基因座上不具有HLA分型数据,但是可以从基因组DNA的直接HLA分型结果推导出来(表中的第一行)。HLA-DQAI不能直接分型。
[0064]图18.用于全基因组单倍型分型的46个基因分型分析的列表。
[0065]图19.用于家庭三人组中杂合缺失的分相的引物序列和Taqman探针。
[0066]图20.母方血浆中胎儿DNA分数和推导母方单倍型遗传所需的取样深度之间的关系。取样深度的测量是遗传的母方单倍型上出现标记物/bin的中位数。在不同的置信水平,给定胎儿DNA分数的预测取样需求绘制为实线。
[0067]图21.确定 含有母方和孩子基因组DNA的混合物中亲本单倍型的孩子遗传。A.母方单倍型。每个黑圈对应着两个母方单倍型的相对出现,使用在圆圈中心IOMb区域内的标记物评估相对出现。每个黑圈随附有对应着针对各测量的95%置信区间的误差棒,通过模拟读取分布,假设各母方单倍型的计数是泊松随机变量的平均值,通过模拟读取的分布来评估。用IOOkb的滑动窗计算相对出现。如之前三人组的全基因组单倍型分型实验所确定的,母方单倍型的真实遗传作为背景显示(红色:从母亲遗传给女儿;灰色:未遗传;白色:异染色质/着丝粒)。所有染色体以相同的长度绘制。B.父方单倍型。白色交叉代表测序数据中观察到的两个父方单倍型中每一个上的父方等位基因。各黑圈对应着两个父方单倍型的相对出现,使用在圆圈中心IOMb区域内的标记物评估相对出现。用IOOkb的滑动窗计算相对出现。如之前三人组的全基因组单倍型分型实验所确定的,父方单倍型的真实遗传作为背景显示(蓝色:从父亲遗传给女儿;灰色:未遗传;白色:异染色质/着丝粒)。所有染色体以相同的长度绘制。C.测量交叉事件的分辨率。对于母方染色体上的交叉事件,绘制各测量的交叉和对应的真实交叉之间的距离。对父方染色体上的交叉事件,绘制各测量的交叉事件宽度。通过分辨率分选交叉事件。
[0068]图22.确定母方血浆DNA中胎儿的母方单倍型遗传。A.患者1,早期孕期(头三个月)的血浆。常染色体和X染色体bin的大小分别是15Mb和20Mb。B.患者1,中期孕期的血浆。常染色体和X染色体bin的大小分别是7.5Mb和10Mb。C.患者2。常染色体和X染色体bin的大小分别是3.5Mb和5Mb。22号染色体着丝粒附近的蓝色区域表示母方单倍型之一上和DiGeorge综合征相关的缺失区域。D.母方染色体上各测量的交叉和各自的真实交叉之间的距离。通过距离分选交叉事件。Pl的早期孕期文库中丢失两个事件。
[0069]图23.基于母方血浆中检测到的父方特异性等位基因,重建父方遗传的染色体。A.在母亲是纯合的位置上每碱基覆盖的分布。蓝:父方特异性等位基因,红色:父方特异性等位基因+母方等位基因。B.在不同测序深度检测的父方特异性等位基因分数。
[0070]图24.母方基因组的直接确定性分相(DDP)。对于患者I (Pl)和患者2 (P2),分别使用3和4个单细胞实现全基因组单倍型分型。
[0071]如【背景技术】部分中所讨论的,单倍型是难以测量的,因为它需要单独分析基因组中区域的两个同源拷贝的每一个。尽管将携带几乎相同的同源区的两条DNA链物理上分离是具有挑战性的,单分子分析非常适于本申请。通过将含有区域的多个同源拷贝的混合物稀释成单分子密度,并在单分子上进行遗传分析,可以测量单倍型。这是多个发表的分子单倍型技术背后的概念(Zhang等人,2006 ;Mitra等人,2003 ;Ding & Cantor, 2003 ;Michalatos Beloin 等人,1996 ;Ruano 等人,1990 ;Xiao 等人,2009),但是,由于分析是在DNA提取过程中被片段化的DNA上进行的,他们无法提供全基因组单倍型,和/或他们只能测量一个分子上的几个基因座。这里提出的策略,通过全面扩增来自单细胞的单个完整染色体分子,解决了这些问题,从而扩增材料的高通量遗传分析提供个体的全基因组单倍型。
[0072]非侵入性测量在胎儿中是杂合的在母方中是纯合的胎儿基因型并不重要,因为只需要检测到母方中不存在的等位基因的存在。非侵入性测量在母方中是杂合的胎儿基因型更具挑战性,但具有重要的应用,尤其是用于诊断常染色体隐性疾病。在父母双方都是疾病相关基因座携带者的这种情况下,确定胎儿是否遗传了隐性等位基因的两个拷贝是有趣的。像非整倍体的检测,在这种情况下确定胎儿的基因型历来是困难的,由于母方血浆中的母方背景 DNA (Wheeler 等人,2008 ;Bentley 等人,2008 ;Ahn 等人,2009 ;Kim 等人,2009 ;Wang 等人,2008 ;Pushkarev 等人,2009 ;Schuster 等人,2010)。
[0073]非侵入性检测胎儿非整倍体的单分子计数的相同方法可以用于开发用于检测胎儿中常染色体隐性疾病的分析。对兴趣双等位基因SNP中每个等位基因的数目进行简单计数,并确定两个等位基因的计数是否平衡。如果一个等位基因相对于另一个过度出现,那么对于过度出现的等位基因而言胎儿是纯合的。如果两个等位基因的计数是相似的,胎儿是杂合的。这种方法的一个缺点是每基因组当量只有一个拷贝的目标等位基因,可信的测量需要等位基因的大量计数,并且每体积血浆的DNA量有限。然而,由于各个体人类从他/她父母双方继承了大的单倍型块(block),各亲本单倍型定义为特异性等位基因的大的集合,本发明人认识到对单倍型特异性标记物进行数字计数使得能够确定在基因座上胎儿遗传了哪一个等位基因,而不会遇到样本限制的问题。
[0074]此处使用如下定义:
[0075]通过“等位基因”是指基因两个或两个以上的形式之一。二倍体生物体如人类包含每个染色体的两个拷贝,从而在每个上携带一个等位基因。
[0076]通过“纯合”是指生物体在某一特定基因座上包含两个相同的等位基因。
[0077]通过“杂合”是指生物体在某一特定基因座上包含两个不同的等位基因。
[0078]通过“单倍型”是指沿着单条染色体在多个基因座上等位基因的组合。单倍型可以基于单条染色体上的一组单核苷酸多态性(SNP)。
[0079]通过“单倍型块”是指被一起遗传的一组等位基因。[0080]单倍型是指沿着单条染色体在多个基因座上等位基因的组合。它们之所以出现是因为我们基因组的二倍体性质。在个体化医学中知晓个体完整的单倍型是重要的,因为一些研究已经证实特定的单倍型与疾病抗性或易感性之间的关联。一个众所周知的例子是人类白细胞抗原(HLA)单倍型与自身免疫性疾病(de Bakker等人,2006 ;Stewart等人,2004)以及移植的临床结果(Petersdorf等人,2007)相关。载脂蛋白基因簇内的单倍型可能影响血衆甘油三酯浓度和动脉粥样硬化的风险(Groenendi jk等人,2001 )。一些研究表明,特定的3-珠蛋白基因座单倍型与较好的镰刀状细胞病预后有关(Nagel等人,1991),而其它研究已将基质金属蛋白酶基因簇的单倍型与癌症发展关联起来(Sun等人,2006)。单倍型在药物基因组学中也是重要的,一个实例是β_2肾上腺素受体与对哮喘的药物治疗的反应相关(Drysdale等人,2000)。确定性单倍型分型大大提高了全基因组关联研究在寻找与常见但复杂性状相关的候选基因中的能力。它还有助于了解人口遗传学和历史人类迁徙以及基因出现中顺式作用调节的研究。
[0081]通过“归算”是指,根据统计学上关联单倍型块中特定SNP的共同表型(appearance)的事实,明确鉴定染色体区域中所有多态性位点的能力。
[0082]除非另有指明,此处所用的所有技术和科学术语具有与本发明所属领域普通技术人员通常所理解的相同的含义。虽然任何和此处所述的那些类似或等同的方法和材料可用于本发明的实施或测试,对优选的方法和材料进行了描述。一般来说,与细胞和分子生物学和化学的技术有关的所用系统命名是众所周知的,并且在本领域中是常用的。没有特别指明,某些实验技术通常是根据本领域中公知的以及贯穿本说明书中引用和讨论的各种常规和更具体的参考文献中所描述的常规方法进行。为了清楚起见,如下术语定义如下。
[0083]本发明认识到只要对亲本(染色体同源拷贝的每个的序列)的二倍体基因组进行测序,通过确定遗传了哪个亲本单倍型就可以计算出胎儿基因组。来自亲本的单倍型信息的可用性大大降低了对输入血浆DNA的要求。不是计数特定SNP基因座上的等位基因,单倍型块内所有SNP的等位基因计数可有助于确定遗传了哪个亲本单倍型。由于减数分裂中交叉事件的数目是有限的, 在原亲本染色体中的断裂数是小的,且对于每个亲本单倍型存在大量可以测量的有提示性的SNP。这种方法也提供了拷贝数变体遗传的有关信息。
[0084]简单地说,本发明涉及非侵入性确定胎儿所继承的亲本单倍型的方法和装置,并可能用来非侵入性确定胎儿基因组、或其部分。使用父方和母方的信息组合可进行该方法,或者可以仅利用母方的单倍型信息。为了进行该方法,获得含有母方和胎儿遗传物质的母方组织。优选地,母方组织是母方外周血或血浆。术语“血浆”可包括血浆或血清。为了区分来自胎儿结果的随机变化,运行大量的反应,并对结果应用统计方法。
[0085]离散样本在反应样本中,其中可以分析靶序列。反应样本可以是,例如,微量滴定板中的孔、乳液中的水相、阵列表面的区域、或微流体装置中的反应室。反应样本可用于离散样本的PCR分析。离散样本与多个PCR引物接触,包括至少一个(或一个正向和一个反向)特异于母方对照序列的引物,对照序列预计在母方和胎儿中是相同的。PCR引物也特异于胎儿序列,即母方和胎儿中可能都存在,但是在胎儿中扩增或改变。PCR扩增将允许检测这两个不同的序列。PCR方法可以是(但不一定是)定量的。可使用定量实时PCR,其包括用具有荧光标记的核酸与靶序列杂交。也可以使用与靶序列杂交的荧光探针。已知用于此目的的一些“数字PCR”规程,以及基于珠的或乳液PCR。尽管荧光探针易于获得并可用于提供灵敏的结果,如在FRET组合中,也可以使用其它标记技术。
[0086]根据所需的结果选择离散样本数目。在一个方面,优选得到高度的统计学显著性,并且可以使用数字计数的任何方法,包括但不限于PCR、测序和杂交。要获得的结果,对于所进行的分析的目的(例如初步筛选、初步诊断等),应当是统计学上显著的。当需要高度显著的结果时,统计学显著性的常用测量是P〈0.01,即根据卡方或t检验99%置信区间。在一些实施方式中,可以使用其它统计方法。例如,可使用SPRT确定截止值。Fan和Quake(2010b)表明只通过计数统计,胎儿异常的检测灵敏度是有限的。
[0087]根据本发明的方法可检测任何通过遗传可传播的疾病,包括一个或多个基因中已知的改变:CFTR、VIII因子(F8基因)、β-珠蛋白、血色素沉着症、G6PD、神经纤维瘤、GAPDH、β淀粉样蛋白、和丙酮酸激酶。这些基因的序列和常见突变(如,单核苷酸多态性或SNP)是已知的。可检测其它遗传异常,如参与人染色体中缺失的、易位或倒位中移动的、或在染色体复制中复制的序列的那些,其中所述序列的特征在于在胎儿遗传物质中的已知遗传病不存在于母方遗传物质中。例如染色体三体可包括部分的、嵌合的、环的18、14、13、8、6、4等。已知异常的列表可见于 OMIM Mobid 图 http://www.ncb1.nlm.nih.gov/Omim/getmorbid.cgi。
[0088]本发明包括一种用于分析母方样本,如来自外周血的方法。不像羊膜穿刺术或绒毛膜绒毛取样,其不侵入到胎儿空间。在优选方法中,使用母方血浆中存在的胎儿DNA。
[0089]在某些方面中,本发明可包括计算机,其经编程用来分析获自母方和胎儿染色体DNA混合物的序列数据。每个常染色体(染色体1-22)被计算机分割成连续的、非重叠窗口(也可使用滑动窗)。每个窗有足够的长度以包含定义各亲本单倍型的等位基因的大量计数(且计数依赖于测序深度和窗内的标记物数目),但每条染色体上不仍具有多个窗。通常情况下,窗在几百kb和几个Mb之间。
[0090]更详细地,通过如下代表了其优选实施方式的项目描述本发明。
[0091]1、一种非侵入性确定由胎儿所遗传`的亲本单倍型的方法,包括:
[0092]a.从怀有至少一个胎儿的妊娠女性获得母方样本,其中所述样本含有来自妊娠女性和胎儿的DNA ;
[0093]b.通过如下步骤确定父方遗传的单倍型:
[0094]1.在胎儿父亲的DNA中确定一组单核苷酸多态性(SNP);
[0095]i1.确定胎儿母亲DNA中的一组SNP;
[0096]ii1.确定父亲中杂合的以及母亲中纯合的所有SNP,来鉴定父亲中存在而在母亲中缺失的各种基因座等位基因,从而确定父未的各单倍型;和
[0097]iv.在各父方单倍型上对代表性等位基因进行计数,来确定两个单倍型的出现;
[0098]V.比较两个单倍型的出现来获得相对出现;
[0099]v1.确定两个单倍型之一的过度出现ε ;和
[0100]vi1.关联所述过度出现ε与父方遗传的单倍型;以及
[0101]c.通过如下步骤确定母方遗传的单倍型:
[0102]1.确定胎儿母亲中所有杂合的SNP ;和
[0103]i1.在各SNP基因座上鉴定在母亲中存在但在父方遗传的单倍型中缺失的等位基因,以确定母亲的单倍型;[0104]ii1.在各母方单倍型上对代表性等位基因进行计数,来确定两个单倍型的出现;
[0105]iv.比较两个单倍型的出现来获得相对出现;
[0106]v.确定两个单倍型之一的过度出现ε ;和
[0107]v1.关联过度出现ε与母方遗传的单倍型;
[0108]2、根据项目I所述的方法,其中通过对标记物进行数字计数测量单倍型的相对出现,其中所述标记物是定义各亲本单倍型的等位基因。
[0109]3、根据项目I所述的方法,其中比较特异于每个固定距离上两个母方单倍型每一个的标记物计数总和,确定哪个母方单倍型过度出现。
[0110]4、根据项目I所述的方法,其中比较特异于每个固定距离上两个父方单倍型每一个的标记物计数总和,确定哪个父方单倍型过度出现。
[0111]5、根据项目2所述的方法,其中通过测量单个DNA分子计数的数量进行数字计数。
[0112]6、根据项目5所述的方法,其中通过测序、数字聚合酶链式反应(PCR)或杂交(或能够读取单个DNA分子上特定基因座上等位基因身份的任何方法)进行测量。
[0113]7、根据项目I所述的方法,其中确定胎儿基因组的一部分。
[0114]8、根据项目7所述的方法,其中确定整个胎儿基因组。
[0115]9、一种通过测量项目I的亲本单倍型的相对出现来估计胎儿DNA分数的方法。
[0116]10、一种非侵入性确定由胎儿所遗传的母方单倍型的方法,包括:
[0117]a.从怀有至少一个胎儿的妊娠女性获得母方样本,其中所述样本含有来自妊娠女性和胎儿的DNA ;
[0118]b.计数所述样本中定义两个母方单倍型中每一个的标记物,以确定两个单倍型的出现;
[0119]c.比较两个单倍型的出现来获得相对出现;
[0120]d.确定两个单倍型之一的过度出现ε ;和
[0121]e.关联所述过度出现ε与遗传的母方单倍型。
[0122]11、根据项目10所述的方法,其中通过对标记物进行数字计数测量单倍型的相对出现,其中所述标记物是定义各母方单倍型的等位基因。
[0123]12、根据项目11所述的方法,其中比较特异于每个固定距离上两个母方单倍型每一个的标记物计数总和,确定哪个母方单倍型过度出现。
[0124]13、根据项目11所述的方法,其中通过测量携带特异性标记物的单个DNA分子计数的数量进行数字计数。
[0125]14、根据项目13所述的方法,其中通过测序、数字聚合酶链式反应(PCR)或杂交(或能够读取单个DNA分子上特定基因座上等位基因身份的任何方法)进行测量。
[0126]15、根据项目10所述的方法,其中确定胎儿基因组的一部分。
[0127]16、根据项目15所述的方法,其中确定整个胎儿基因组。
[0128]17、根据项目10所述的方法,还包括非侵入性重建父方遗传的单倍型。
[0129]18、根据项目17所述的方法,其中使用样本中检测到的父方特异性等位基因,通过单倍型归算实现父方遗传的单倍型的重建。
[0130]19、一种确定一组适当标记物的方法,所述标记物定义母方单倍型,包括确定在第一母方单倍型中的多态性基因座上存在,但在第二母方单倍型上的对应基因座却缺失的等位基因。
[0131]20、根据项目19所述的方法,其中在第一母方单倍型中的多态性基因座上存在但在第二母方单倍型上的对应基因座却缺失的等位基因也不在两个父方单倍型的对应基因座上。
[0132]21、一种确定一组适当标记物的方法,所述标记物定义父方单倍型,包括确定在第一父方单倍型中的多态性基因座上存在,但在第二父方单倍型上的对应基因座却缺失的等位基因。
[0133]22、根据项目21所述的方法,其中在第一父方单倍型中的多态性基因座上存在但在第二父方单倍型上的对应基因座却缺失的等位基因也不在两个母方单倍型的对应基因座上。
[0134]23、根据项目21所述的方法,其中组中的标记物数目可以通过单倍型归算而增加。
[0135]24、根据项目18或23所述的方法,其中单倍型归算包括:
[0136]通过将待归算的单倍型上所观察到的等位基因与之前归档的单倍型数据库进行比较,在任何未测量的基因座上统计推导等位基因身份,其中之前归档的单倍型数据库的单倍型的等位基因身份在测量和未测量的基因座上均是已知的。
[0137]25、根据项目23所述的方法,其中所述数据库来自正常群体。
[0138]26、根据项目23所述的方法,其中所述数据库来自携带可通过遗传传播的特定疾病的群体。
[0139]27、一种确定数字取样的最小量来实现所需的关于哪种亲本单倍型过度出现的置信水平的方法,包括:
[0140]a.估计样本中存在的胎儿DNA的分数;和
[0141]b.估计可用标记物的密度。
[0142]28、一种估计胎儿DNA分数的方法,包括测量胎儿单倍型的相对出现。
[0143]29、根据项目19或21所述的方法,其中可以通过如下实现确定一组定义个体单倍型的标记物:
[0144]a.在相关家庭成员当中比较多态性基因座上的等位基因;或
[0145]b.分析单个DNA分子或单个染色体分子上多态性基因座上的等位基因。
[0146]30、一种用于进行项目27所述方法的微流体装置,包括:
[0147]a.染色体划分区;
[0148]b.扩增区;和
[0149]c.产物回收区。
[0150]31、根据项目30所述的微流体装置,还包括:
[0151]a.细胞分选区;
[0152]b.染色体释放区;
[0153]32、根据项目31所述的装置,其中在所述细胞分选区中,从细胞悬液中鉴定并捕获单个中期细胞,并进行裂解而形成染色体悬液。
[0154]33、根据项目31所述的装置,其中在所述染色体划分区中,染色体悬液被随机分到多个通道划分中。[0155]34、根据项目30所述的装置,其中在所述扩增区中,分离的染色体通过多链置换扩增单独进行扩增。
[0156]35、一种用于控制项目30的微流体装置的计算机程序。
[0157]提供如下实施例以帮助理解本发明,真正的范围如所附权利要求书中所述。应当了解,在不脱离本发明精神的情况下,所述程序可以进行修改。
[0158]实施例:
[0159]结合如下实施例将更好的理解本发明的组合物和方法,其仅意图作为一个说明,而非限制本发明的范围。所公开的实施方式的各种变化和修改,对于本领域技术人员而言是显而易见的,并且这种变化和修改包括但不限于,在不脱离本发明精神和所附权利要求书范围的情况下,做出涉及本发明的过程、制剂和/或方法的那些。
[0160]实施例1
[0161]为了解决现有技术中的缺点,本发明人已经开发出一种被称为“直接确定性分相”(DDP)的方法,其中来自单细胞的完整染色体在微流体装置上被分散和扩增(图2、3)。图2和图3代表用于分离和扩增单细胞内染色体的微流体装置的概况。三个罩以40,OOOdpi分辨率被印在透明胶片上(Fineline Imaging), —个带有5m流层的图式,一个带有40pm流层的图式,以及一个带有25pm控制层的图式。两个带有流层的罩规模扩大1.5%以适应当它从模具中剥离时厚PDMS层的收缩。用正性光刻胶(photoresist)产生流模具,而用负性光刻胶产生控制模具。本节中的操作由斯坦福微流体铸造厂(Stanford MicrofluidicsFoundry)提供。
[0162]微流体装置具有5个区域(图2)。其由如下组成:细胞分选区,其中显微镜下鉴定并从细胞悬液中捕获单个中期细胞;染色体释放区,其中通过细胞质蛋白酶消化释放中期染色体;染色体划分区,其中染色体悬液随机分到48个狭长通道的分区;扩增区,其中分离的染色体通过多链置换扩增单独进行扩增;以及产物回收区,其中单独收集扩增的产物。
[0163]微流体装置由聚二甲基硅氧烷(PDMS)制成,并采用多层软光刻技术铸造(Unger等人,2000 ;Thorsen等人,2002 ;Melin & Quake, 20070。两层装置在底部具有矩形25pm高控制通道(tall control channel),并在顶部环绕流通道。装置连接包被有薄PDMS层的玻片。在装置的细胞分选区,流通道为40μπι高且200μπι宽。在装置的扩增区中,流通道为5 μ m和100 μ m宽,且反应室为40 μ m高。在控制通道和流通道交叉的位置形成“上推”(push-up)膜阀,且当控制通道加压至20-25psi时膜阀被启动,并向上推挤流通道。对于40 μ m的流通道而言,每个阀的面积为200 μ mX200 μ m,对于5 μ m流通道为100 UmXlOOym0通过外部气动电磁阀控制膜阀,气动电磁阀由连接至计算机USB 口的自定义电子设备驱动。编写Matlab程序与阀交接(interface)。由芯片上的一组螺动泵控制细胞分选区内的流体流。在扩增区中,由于PDMS的透气性,有可能通过终端(dead-end)填充依次引入试剂。根据每个反应室的体积确定引入试剂的量。该装置制造的详细操作如下。
[0164]装置的制备
[0165]流模具包含两个高度的圆形特征(feature)。用SPR220-7光刻胶制造具有5 μ m特征的第一层。用AZ50光刻胶制造具有40 μ m特征的第二层:
[0166]1.用HDMS (六甲基二硅氮烷)处理晶片(wafer ) 5分钟。[0167]2.旋涂 5PR220-7:500rpm 持续 5s,3200rpm 持续 30s。
[0168]3.软烤:115°C持续 90s。
[0169]4.暴露于UV持续65s。
[0170]5.通过在MF-319中浸泡3-5分钟形成罩(develop mask)。用水冲洗。
[0171]6.硬烤:以每小时10°C的升温速率,经15小时使温度从25°C提高到190°C。
[0172]7.用HDMS处理晶片5分钟。
[0173]8.旋涂 AZ50:500rpm 持续 10s, IlOOrpm 持续 30s。
[0174]9.115°C软烤4分钟,65°C持续I分钟。热板设置到自动关闭并冷却至室温。
[0175]10.在2个30s周期中将晶片暴露于UV0 [0176]11.在AZ形成剂中形成罩。用水冲洗。
[0177]12.硬烤:以每小时10°C的升温速率,经15小时使温度从25°C提高到190°C。
[0178]控制模具包含25 μ m的矩形特征,用SU2025光刻胶进行制造:
[0179]1.旋涂 SU2025 光刻胶:500rpm 持续 5s,2700rpm 持续 60s。
[0180]2.软烤:65 °C持续2分钟,95 °C持续5分钟,65 °C持续2分钟。
[0181]3.暴露于UV持续20s。
[0182]4.后烘:65 °C持续2分钟,95 °C持续5分钟,65 °C持续2分钟。
[0183]5.在SU8形成剂中形成罩1-2分钟,用异丙醇冲洗。
[0184]6.硬烤:以120°C的升温速率,使温度从65°C提高到150°C。烤2小时。
[0185]用PDMS (聚二甲基硅氧烷)制造微流体装置:
[0186]1.厚层:通过将A部分和B部分以5:1的比例在一个混合搅拌机(hybrid mixer)中混合I分钟随后脱气2分钟,来制备50g RTV PDMS0将混合物倒入流模具,并在真空室中脱气30分钟,或直至气泡消失。在80°C烘烤I小时。
[0187]2.薄层:通过将A部分和B部分以20:1的比例在一个混合搅拌机中混合I分钟随后脱气2分钟,来制备21g RTV PDMS0以1500rpm的转速旋转60s,具有15s的升高时间(ramp time),将混合物旋涂在控制模具上。在80°C烘烤40分钟。
[0188]3.从流模具上切割并剥离厚层。在厚层上打孔并对齐到涂有PDMS的控制模具。一起烘烤1.5h。
[0189]4.通过以2000rpm将RTV PDMS (20:1的A部分:B部分)直接旋涂在玻片上并在80 V烘烤40分钟,来涂覆空白玻片。
[0190]5.从控制模具上剥离厚层和薄层。打孔并置于玻片上。80°C烘烤过夜。
[0191]细胞培养
[0192]在装置上对两个类型的细胞进行了测试:国际HapMap计划中所用的类淋巴母细胞系(Iymphoblastoid)以及来自捐赠者全血细胞的淋巴细胞。
[0193]EBV-转化的类淋巴母细胞系(Coriell细胞存储库)培养于补充有15%胎牛血清的RPMI1640ο为了富集有丝分裂细胞群,各培养物用2mM胸苷(Sigma)在37°C处理24小时。随后是在PBS中多次洗涤,细胞在正常培养基中培养3小时,用200ng/ml诺考达唑(Sigma)在37°C处理2小时使细胞停滞在中期。
[0194]从指尖采集的全血(~250微升)用肝素钠处理,并在PB-Max介质(Invitrogen)中培养4天。培养物用50ng/ml秋水仙酰胺(Invitrogen)处理6小时。将培养物成层状置于Accuspin系统-Histopaque-1077 (Sigma)上,以2500rpm离心8分钟。除去界面上的有核细胞,用Hank氏缓冲盐溶液(HBSS)洗涤一次。
[0195] 停滞在中期的细胞与75mM KCl在室温下孵育10_15分钟。以2%的最终浓度在细胞悬液中加入乙酸,以固定细胞。在冰上固定30分钟后,用PBS-l%BSA-lmM EDTA将细胞洗涤两次,并用PBS-l%BSA-lmM EDTA-l%Triton洗涤一次,最后悬浮在75mM KCl-1mMEDTA-l%Triton X-100中。加载至微流体装置前,用0.2mg/mlRNaseA (Qiagen)处理细胞。
[0196]从无细胞血浆的DNA提取规程
[0197]血液处理
[0198]1.在EDTA真空采血管中收集20ml外周血。
[0199]2.以1600g管在4°C离心10分钟。
[0200]3.血浆的850ul分装至1.5ml聚丙烯管中,注意不要扰乱血沉棕黄色层。
[0201]4.以16000g将管在4°C离心10分钟以去除残留的细胞。
[0202]5.小心取出上清液(~800 μ I)并置于新1.5ml聚丙烯管中。
[0203]6.采集血液尽快进行离心。无细胞血浆的等份可以保存于-80°C,直到进一步的处理。
[0204]7.在这项研究中,使用两种商品化试剂盒,根据制造商的规程稍作修改后,从血浆中提取DNA。
[0205]使用QIAamp DNA微试剂盒(Qiagen)提取无细胞DNA
[0206]以下规程包含对制造商手册中“小体积血液规程”的修改。
[020
在全基因组规模非侵入性确定亲本单倍型的胎儿遗传制作方法
- 专利详情
- 全文pdf
- 权力要求
- 说明书
- 法律状态
查看更多专利详情
下载专利文献
下载专利
同类推荐
-
F·马希亚迪吴乃虎
您可能感兴趣的专利
专利相关信息