早鸽—汇聚行业精英
  • 联系客服
  • 帮助中心
  • 投诉举报
  • 关注微信
400-006-1351
您的问题早鸽都有答案
3000+专业顾问
搜索
咨询

一种用于新一代测序分析的多重目的dna片段富集方法

  • 专利名称
    一种用于新一代测序分析的多重目的dna片段富集方法
  • 发明者
    漆小泉, 池旭, 张英春
  • 公开日
    2014年2月12日
  • 申请日期
    2012年7月20日
  • 优先权日
    2012年7月20日
  • 申请人
    中国科学院植物研究所
  • 文档编号
    C12Q1/68GK103571822SQ201210253791
  • 关键字
  • 权利要求
    1.DNA测序模板的制备方法,包括如下步骤 (1)将具有待测序位点的DNA样品依次进行片段化、末端修复和补齐,3’端加A,以及连接接头,得到用于第一次PCR反应的模板; 所述待测序位点的上游核苷酸序列已知,且存在PCR特异引物对应的特异区域; 所述接头为由长链和短链组成的一端是平末端另一端是5’粘性末端的双链DNA,所述长链的5’端突出; (2)用特异性引物Iros和通用引物I对步骤(1)得到的用于第一次PCR反应的模板进行第一次PCR扩增,得到包含所述待测序位点的DNA片段; 所述特异性引物Iros与所述特异区域互补;所述通用引物I的序列含有选自步骤(1)所述接头中所述长链的5’端突出部分的序列; (3)用特异性引物2ros和通用引物2对步骤(2)得到的所述DNA片段进行第二次PCR扩增,得到包含所述待测序位点的DNA片段; 所述特异性引物2ros自5’端至3’端分为片段I和片段2,所述片段2与所述特异区域互补,且所述特异性引物2ros自3’端起第一个核苷酸与所述待测序位点之间的距离比所述特异性引物Iros自3’端起第一个核苷酸与所述待测序位点之间的距离更近;所述片段I与所述待测序位点的上游不互补;所述通用引物2的序列选自步骤(1)所述接头中所述长链的5’端突出部分的序列; (4)用通用引物3和通用引物4对步骤(3)得到的所述DNA片段进行第三次PCR扩增,得到DNA测序模板;· 所述通用引物3的自5’端至3’端分为片段3和片段4,所述片段4选自步骤(3)所述片段1,所述片段3为如下a)a)AATGATACGGCGACCACCGAGATCTACACTCTTTCCC ; 所述通用引物4自5’端至3’端分为片段5和片段6,所述片段6选自步骤(1)所述接头中所述长链的5’端突出部分的序列,所述片段5为如下b)b)CAAGCAGAAGACGGCATA2.根据权利要求1所述的方法,其特征在于权利要求1步骤(2)-(4)的三次所述PCR反应所用的DNA聚合酶均为Phusion高保真DNA聚合酶3.根据权利要求1或2所述的方法,其特征在于所述接头中所述长链的序列如序列表中序列1-10所示,所述接头中所述短链的序列为如下中的任一种 A)序列表中序列I的自3’端起倒数第9位-倒数第2位的反向互补序列; B)序列表中序列2-序列10中任一个的自3’端起倒数第10位-倒数第2位的反向互补序列4.根据权利要求1-3中任一所述的方法,其特征在于用于所述第一次PCR反应的所述通用引物I序列为序列表中序列U5.根据权利要求1-4中任一所述的方法,其特征在于用于所述第二次PCR反应的所述通用引物2序列为序列表中序列126.根据权利要求1-5中任一所述的方法,其特征在于用于所述第三次PCR反应的所述通用引物3和所述通用引物4的序列分别为序列表中序列13和14
  • 技术领域
    [0001]本发明属于基因工程领域,涉及一种DNA测序模板的制备方法,特别涉及一种用于新一代测序分析的目的DNA片段的富集方法
  • 专利摘要
    本发明公开了一种DNA测序模板的制备方法。该方法包括如下步骤(1)将待测序的DNA分子依次进行片段化、末端修复和补齐,3’端加A,以及连接接头;(2)通过三轮半巢式PCR扩增富集目的DNA片段;前两次PCR所用引物均为一条特异性引物和一条通用引物;第三次PCR所用引物由两条通用引物组成;前两次PCR可为多重PCR反应。与Illumina?GA样品前处理过程相比,本发明所提供的方法减少了样品处理的步骤,节约了时间和经济成本,同时降低了起始DNA样品的需求量;最重要的是,循环数的降低和Phusion高保真DNA聚合酶的使用降低了由于PCR而引入的突变,使得对所得数据的处理变得相对简单清晰,同时本方法在应用到各种重测序的实验中时对测序深度的要求也降低。
  • 发明内容
  • 专利说明
    —种用于新一代测序分析的多重目的DNA片段富集方法
  • 专利详情
  • 全文pdf
  • 权力要求
  • 说明书
  • 法律状态
一种用于新一代测序分析的多重目的dna片段富集方法[0002]新一代测序技术(Next Generation Sequencing, NGS)是近年来新兴的一系列测序技术的总称,他们都是基于边合成边测序(Sequencing by Synthesis)的原理,具有高通量、时间短、数据量庞大的特点,已经被广泛应用于基因组(重)测序、转录组测序、单核苷酸多态性(Single Nucleotide Polymorphism, SNP)开发等等方面,成为人们研究分子生物学、分子遗传学等等的有力工具。[0003]在多种新一代测序技术中,Illumina公司开发的基因组分析仪(GenomeAnalyzer, GA)由于具有成本相对较低、通量大、前处理较为简单等等优势,成为目前应用的最为广泛的技术之一。[0004]Illumina GA的DNA样品前处理过程主要包括:(I) DNA样品的片段化;(2)修复并补齐末端,以及3’端加A (腺嘌呤脱氧核苷酸);(3)连接接头;(4)切胶纯化;(5)使用Illumina公司提供的引物进行18个循环的PCR扩增;(6)切胶纯化;(7)样品质量监控(纯度、浓度等)。随后即可上机进样开始测序。[0005]Illumina GA的DNA样品前处理方法不具有选择性,因此,若只关注基因组(或转录组)中某一特定区域的序列,则需要在进行Illumina GA样品前处理之前完成选择性富集的过程。目前通用的选择性富集 方法有:[0006]聚合酶链式反应(PCR):通过使用特异性引物对目的片段进行选择性扩增。[0007]水相杂交:如MIP (molecular inversion probe),通过带有特异序列的探针与基因组样品杂交后,连接成环并扩增,获得目的片段;或使用生物素标记的RNA探针与基因组碎片杂交,而后通过磁珠吸附生物素进而将特异序列与基因组碎片分离,而后进行富集。[0008]固相杂交:使用类似于DNA微阵列(Microarray)处理的方法,在固相支持物上固定特异的探针序列来捕获目的片段
[0009]上述二种方法都是在进行Illumina GA样品如处理之如完成的,其中水相杂交和固相杂交涉及的技术相对复杂,成本不菲(尤其是DNA微阵列的固相支持物的获得需要大量合成的特异序列),需要的起始基因组DNA用量很大,且在处理后仍需要对获得的目的片段进行富集(通常也是靠PCR)。而PCR虽然是一种具有良好选择性并且技术要求较低的方法,但是其扩增中会发生碱基的突变,虽然使用高保真的聚合酶能够改善突变发生的频率,但是随着扩增循环数的增加,碱基突变的概率会愈加提高。由于Illmunia GA样品前处理中有18个循环的PCR扩增,在Illumina GA样品前处理之前的PCR反应过程中引入的碱基突变会在随后的Illumina GA的样品前处理中被放大,并且测序得到的突变碱基的测序质量与未突变碱基的测序质量没有显著差异,无法分辨,这在检测点突变(point mutation)或单核苷酸多态性(single nucleotide polymorphism, SNP)的时候会对结果产生很大干扰,造成过多的假阳性结果。


[0010]本发明的目的是提供一种DNA测序模板的制备方法,所述DNA测序模板适宜采用Illumina公司的GA测序仪进行测序。 [0011]本发明所提供的DNA测序模板的制备方法,具体包括如下步骤:
[0012](I)将具有待测序位点的DNA样品依次进行片段化、末端修复和补齐,3’端加A,以及连接接头,得到用于第一次PCR反应的模板;
[0013]所述待测序位点的上游核苷酸序列为已知,且存在PCR特异引物对应的特异区域;所述待测序位点可以为一个也可为多个。
[0014]所述接头为由长链和短链组成的一端是平末端另一端是5’粘性末端的双链DNA,所述长链的5’端突出;在实际应用中,可通过化学合成得到组成所述接头的所述长链和所述短链,再自行变性退火后得到所述接头。
[0015](2)用特异性引物Iros和通用引物I对步骤(1)得到的用于第一次PCR反应的模板进行第一次PCR扩增,得到包含所述待测序位点的DNA片段;
[0016]所述特异性引物Iros与所述特异区域互补;所述通用引物I的序列含有选自步骤
(I)所述接头中所述长链的5’端突出部分的序列。当对多个位点或区域进行同时检测时,应保持各引物的退火温度一致,这将有利于多重PCR反应的进行。
[0017](3)用特异性引物2ros和通用引物2对步骤(2)得到的所述DNA片段进行第二次PCR扩增,得到包含所述待测序位点的DNA片段;
[0018]所述特异性引物2ros自5’端至3’端分为片段I和片段2,所述片段2与所述特异区域互补,且所述特异性引物2ros自3’端起第一个核苷酸与所述待测序位点之间的距离比所述特异性引物Iros自3’端起第一个核苷酸与所述待测序位点之间的距离更近;所述片段I与所述待测序位点的上游不互补;所述通用引物2的序列为选自步骤(1)所述接头中所述长链的5’端突出部分的序列。当对多个位点或区域进行同时检测时,应保持各引物的退火温度一致,这将有利于多重PCR反应的进行。
[0019](4)用通用引物3和通用引物4对步骤(3)得到的所述DNA片段进行第三次PCR扩增,得到DNA测序模板;
[0020]所述通用引物3的自5’端至3’端分为片段3和片段4,所述片段4为选自步骤
(3)所述片段1,所述片段3为如下a):
[0021]a) AATGATACGGCGACCACCGAGATCTACACTCTTTCCC (固相支持物结合区域)
[0022]所述通用引物4自5’端至3’端分为片段5和片段6,所述片段6选自步骤(1)所述接头中所述长链的5’端突出部分的序列,所述片段5为如下b):
[0023]b) CAAGCAGAAGACGGCATA (固相支持物结合区域)。
[0024]经过上述步骤的处理后,所得DNA测序模板还需经过标准样品纯化处理、纯度、浓度鉴定等步骤后可用于Illumina GA测序。
[0025]为了增加测序的准确性,减少扩增中随机错配的出现,上述步骤中的三次PCR反应均使用Phusion高保真聚合酶。
[0026]在本发明的一个实施例中,所述接头中所述长链的序列具体如序列表中序列1-10所示,所述接头中所述短链的序列为如下中的任一种:
[0027]A)序列表中序列I的自3’端起倒数第9位-倒数第2位的反向互补序列;
[0028]B)序列表中序列2-序列10中任一个的自3’端起倒数第10位-倒数第2位的反向互补序列。[0029]在本发明的一个实施例中,用于所述第一次PCR反应的所述通用引物I序列具体为序列表中序列11。
[0030]在本发明的一个实施例中,用于所述第二次PCR反应的所述通用引物2序列具体为序列表中序列12。
[0031 ] 在本发明的一个实施例中,用于所述第三次PCR反应的所述通用引物3和所述通用引物4的序列具体分别为序列表中序列13和序列14。
[0032]通常情况下,上述步骤中所述第一次PCR反应进行10-15个循环的扩增;所述第二次PCR反应进行10-15个循环的扩增;所述第三次PCR反应进行15-18个循环的扩增。在本发明的实施例中,所述第一次PCR反应具体进行了 15个循环的扩增;所述第二次PCR反应进行了 15个循环的扩增;所述第三次PCR反应进行了 18个循环的扩增。
[0033]本发明针对Illumina GA样品前处理的过程进行改进,得到了新的用于IlluminaGA测序的DNA测序模板的制备方法,该方法减少了样品处理的步骤,节约了时间和经济成本,同时降低了对起始DNA样品的需求量。最为重要的是,循环数的降低(相对于PCR扩增与样品制备过程分离的方法,本申请可降低10个以上的循环数)和Phusion高保真DNA聚合酶的使用可以大大降低在样品富集过程中由于PCR而引入的突变,使得对所得数据的处理变得相对简单清晰,使得本方法在应用到各种重测序的实验中时对测序深度的要求大大降低。在此基础上,我们引入了多重PCR (Multiplex Polymerase Chain Reaction)的方法,大大增加了样品处理的效率。



[0034]图1为三次PCR反应过程示意图。其中,A为第一次PCR反应过程示意图;B为第二次PCR反应过程示意图;C为第三次PCR反应过程示意图。
[0035]图2为在琼脂糖胶上检测到的第三轮PCR产物。其中,泳道M代表1OObp ladder,泳道I和泳道2代表第三轮PCR的产物。
[0036]图3为在琼脂糖胶上检测胶纯化后的第三轮PCR产物。其中,泳道M代表lOObpladder,泳道I代表胶纯化后的第三轮PCR的产物。
[0037]图4为两种聚合酶获得的可用产物数量的比较图。其中,PMP为使用Phusion高保真聚合酶;PMM为使用Multiplex多重聚合酶。
[0038]图5为两种聚合酶不同引物个数所得平均深度分析图。其中,PMP为使用Phusion高保真聚合酶;PMM为使用Multiplex多重聚合酶;PM后的数值表示引物个数。
[0039]图6为两种聚合酶不同引物个数所得数据的利用率比较图。其中,PM后的数值表示引物个数。纵坐标表示数据的利用率。其中,I表示Multiplex多重聚合酶(PMM),2表示Phusion高保真聚合酶(PMP)。
[0040]图7为index03的碱基C变化为碱基T的频率图。其中,横坐标为各个碱基在0SC8基因上的位置坐标,纵坐标为发生C到T的变化的碱基个数与该位置碱基测序深度的比值(即碱基变化频率)。图中圆圈圈出的点为经过其它实验及sanger法测序所验证的已知阳性点。
[0041]图8为所有数据中某位置上C到T碱基变化的个数和该位置的测序深度的关系图。

[0042]下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
[0043]下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0044]实施例1、用于Illumina公司GA测序的测序模板的制备及其测序
[0045]一、用于Illumina公司GA测序的测序模板的制备方法
[0046]在本实施例中,用于Illumina公司GA测序的测序模板的制备方法具体包括如下步骤:
[0047](I)将具有待测序位点的DNA样品依次进行片段化、末端修复和补齐,3’端加A,以及连接接头,得到用于第一次PCR反应的模板;
[0048]所述待测序位点的上游核苷酸序列已知,且存在PCR特异引物对应的特异区域;
[0049]所述接头为由长链和短链组成的一端是平末端另一端是5’粘性末端的双链DNA,所述长链的5’端突出;
[0050](2)用特异性引物·Iros和通用引物I对步骤(1)得到的用于第一次PCR反应的模板进行第一次PCR扩增,得到包含所述待测序位点的DNA片段;
[0051]所述特异性引物Iros与所述特异区域互补;所述通用引物I的序列含有选自步骤
(I)所述接头中所述长链的5’端突出部分的序列;
[0052](3)用特异性引物2ros和通用引物2对步骤(2)得到的所述DNA片段进行第二次PCR扩增,得到包含所述待测序位点的DNA片段;
[0053]所述特异性引物2ros自5’端至3’端分为片段I和片段2,所述片段2与所述特异区域互补,且所述特异性引物2ros自3’端起第一个核苷酸与所述待测序位点之间的距离比所述特异性引物2ros自3’端起第一个核苷酸与所述待测序位点之间的距离更近;所述片段I与所述待测序位点的上游不互补;所述通用引物2的序列选自步骤(1)所述接头中所述长链的5’端突出部分的序列;
[0054](4)用通用引物3和通用引物4对步骤(3)得到的所述DNA片段进行第三次PCR扩增,得到DNA测序模板;
[0055]所述通用引物3的自5’端至3’端分为片段3和片段4,所述片段4为步骤(3)所述片段1,所述片段3为如下a):
[0056]a) AATGATACGGCGACCACCGAGATCTACACTCTTTCCC (固相支持物结合区域);
[0057]所述通用引物4自5’端至3’端分为片段5和片段6,所述片段6为步骤(1)所述接头中所述长链的5’端突出部分的序列,所述片段5为如下b):
[0058]b) CAAGCAGAAGACGGCATACGAGATCGTGAT (固相支持物结合区域)。
[0059]二、步骤一所述的方法的实际应用
[0060]本试验将利用步骤一所述方法,以水稻品种中花11的基因组为待测序DNA样品,针对其上的14个SNP位点(14个所述待测序位点)设计水稻基因组特异引物(14个所述特异性引物Iros和14个所述特异性引物2ros),制备用于Illumina公司GA测序的测序模板。
[0061]1、引物设计
[0062]( I)第一轮PCR引物序列的设计
[0063]用primer5.0软件设计用于检测位于水稻目的基因OsOSCs基因和CYP51基因上的上述14个待测序位点的第一轮PCR特异引物序列(特异性引物lros),设计引物序列原则为:GC%为40%-60%,长度为25个碱基,TM值为65°C左右。引物序列具体如表1所示,引物序列由上海生工合成。
[0064]表1第一轮PCR基因组特异性引物序列
[0065]

查看更多专利详情

下载专利文献

下载专利