专利名称:一种对6磷酸葡萄糖脱氢酶基因进行测序的方法及试剂盒的制作方法6 憐酸葡萄糖脱氧酶(Glucose-6-phosphate dehydrogenase, G6PD)基因位于染色体Xq28区域,由13个外显子及12个内含子组成,全长20Kb,是典型的看家基因。目前, 全世界已经发现的突变类型超过140种,我国已发现至少30种。G6H)基因突变具有以下特点多为单个碱基置换的错义突变;大多数基因突变属于转化型突变,常发生在cpg 二核苷酸内的c-t的转换;具有种族和地区异质性;尚未发现整个基因或大片段基因的缺失,也未见无义突变及移码突变;除外显子I外,基因突变遍及其余外显子;具有复合突变。Gero是细胞内单磷酸己糖分解代谢过程中所必需,它能催化单磷酸己糖脱氢产生烟酰胺腺嘌呤二核苷酸(Nicotinamide adenine dinucleotide, NADPH),后者在 NADPH 氧化酶的作用下产生H202,从而在细胞内发挥杀菌作用。因此,对G6H)基因进行测序,确定该样本中的G6H) 基因的序列,具有重要的意义。目前,对G6H)基因进行测序的常见方法为Sanger测序法,通过Sanger测序法能够对目标区域进行区域检测,但是Sanger测序法每次只能对一个样品的G6H)基因的某一段区域(不大于900bp)进行测序,检测效率低,测序成本高,且由于sanger测序原理的限制,在检测带有杂合子的样品的信号时会出现双峰乃至多峰,导致测序所得的测序峰图紊乱,甚至无法分析得到的序列信息,测序失败。大量的研究已经证实,PCR产物直接测序法仅能于混合模板中检测出比例> 20%的模板,且无法得出发生突变位点的精确变异比例。而现有技术中基于Sanger测序法的试剂盒存在同样的缺陷。因此,需要一种检测6磷酸葡萄糖脱氢酶基因的新方法和新试剂盒,能够同时对 G6PD基因的多个区域进行区域检测,提高了检测效率,同时还能提高检测的准确性和灵敏度,并能进一步同时对大量样品进行检测。
本发明的目的在于提供一种对6磷酸葡萄糖脱氢酶基因进行测序的方法及试剂盒,能同时对Gero基因的多个目标区域进行区域检测,提高了检测效率,同时还能提高检测的准确性和灵敏度,并还能进一步同时对大量样品进行检测。本发明是这样实现的,一种对6磷酸葡萄糖脱氢酶基因进行测序的方法,包括以下步骤A.利用Gero基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。其中,所述步骤A包括以下步骤toon] Al.利用Gero基因特异性引物,对待测样品中的多个目标区域进行扩增,得到与所述多个目标区域对应的扩增产物;A2.利用接头元件,与所述多个目标区域对应的扩增产物进行连接,得到测序文库;所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。其中,步骤A2包括以下步骤A21.对与所述多个目标区域对应的扩增产物进行片段化,得到片段化产物;A22.利用接头元件,与片段化产物进行连接,构建测序文库。步骤A所述的目标区域测序文库的长度无特殊限制,优选为25bp 500bp。更优选为50bp 200bp,更优选为70bp 130bp。其中,所述步骤A22包括以下步骤A221.利用第一接头与片段化产物的两端连接,得第一连接产物;A222.环化第一连接产物,得环化产物;A223. II s型限制性内切酶酶切环化产物,得酶切产物; A224.在酶切产物两端接上第二接头和第三接头,得测序文库。其中,所述步骤A22包括以下步骤Α22Γ .利用第四接头与片段化产物连接,得第二连接产物;A222’ . II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片段;A223’ .带有第四接头的酶切片段与第五接头连接,形成测序文库。其中,步骤A2所述接头元件中的至少一个接头包含有第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。该第一标签序列,优选为带有特定碱基序列的核酸分子,其碱基数不限。进一步的,该第一标签序列碱基数为3 20,更优选为4 10。其中,步骤A所述的特异性引物与目标区域完全互补或部分互补。进一步的,每个目标区域对应的特异性引物中,至少一条引物与该目标区域部分互补,该部分互补的引物的5’端包含有第二标签序列。该第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行标记。该第二标签序列,优选为带有特定碱基序列的核酸分子,其碱基数不限。进一步的,该第二标签序列碱基数为3 20,更优选为4 10。其中,所述步骤A中同一样品的G6ro基因的各目标区域的扩增,同时进行或部分同时进行或分别独立进行。其中,所述步骤A中的G6H)基因特异性引物包括SEQ ID NO :1和SEQ ID NO :24, 以及 SEQ ID NO :2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO : 10、SEQ ID NO 12、SEQ ID NO: 14、SEQ ID NO: 16、SEQ ID NO: 18、SEQ ID NO :20 和 SEQ ID NO :22 中的至少一条,SEQ ID NO :3、SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9、SEQ ID NO :11、SEQ ID NO 13, SEQ ID NO :15、SEQ ID NO :17、SEQ ID NO :19、SEQ ID NO :21 和 SEQ ID NO :23 中的至少一条。其中,步骤B所述的单分子扩增的方法为乳液PCR、桥式PCR中的至少一种。其中,步骤C所述的高通量测序技术为基于聚合酶的合成测序法或基于连接酶的连接测序法。本发明的还提供了一种能够用于本发明的任一种测序方法的试剂盒,本发明是这样实现的,一种对6磷酸葡萄糖脱氢酶基因进行测序的试剂盒,包括Loose] Gero基因特异性引物,用于对待测样品中的多个目标区域进行扩增;接头元件,用于与扩增产物结合构建测序文库。其中,所述接头元件采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。其中,所述接头元件中的至少一个接头包含有第一标签序列,该第一标签序列,用于在文库构建过程中,对不同待测样品的测序文库进行标记。该第一标签序列优选为带有特定碱基序列的核酸分子,其碱基数不限,该第一标签序列的碱基数优选为3 20。其中,所述Gero基因特异性引物与目标区域完全互补或部分互补。进一步的,每个目标区域对应的Gero基因特异性引物中,至少一条引物与该目标区域部分互补,该部分互补的引物的5’端包含有第二标签序列,用于在扩增目标区域过程中,对不同待测样品的目标区域扩增产物进行标记。该第二标签序列优选为带有特定碱基序列的核酸分子,其碱基数不限,该第二标签的碱基数优选为3 20,更优选为4 10。其中,所述G6PD基因特异性引物包括SEQ ID NO :1和SEQ ID NO :24,以及SEQ ID N0:2、SEQ ID NO :4、SEQ ID NO :6、SEQ ID NO :8、SEQ ID NO 10,SEQ ID NO :12、SEQ ID NO: 14、SEQ ID NO: 16、SEQ ID NO: 18、SEQ ID NO :20 和 SEQ ID NO :22 中的至少一条,SEQ ID NO 3,SEQ ID NO :5、SEQ ID NO :7、SEQ ID NO :9、SEQ ID NO 1USEQ ID NO :13、SEQ ID NO: 15、SEQ ID NO: 17、SEQ ID NO: 19、SEQ ID NO :21 和 SEQ ID NO :23 中的至少一条。与现有技术相比,本发明的方法及试剂盒通过高通量测序技术对G6H)基因的多个目标区域同时进行深度测序,提高了检测效率,同时还能提高检测的准确性和灵敏度,并能进一步对大量样品同时进行多区域测序。
图
图
图
图
图
图
图
图
图程图
图10是本发明另一个实施例中利用片段化产物和接头元件构建测序文库的方法流程图;图11是本发明另一个实施例中利用片段化产物和接头元件构建测序文库的方法流程图。
步骤S121中,所述片段化目标区域扩增产物的方法有多种,包括但不限于超声法、喷雾法、化学剪切法和酶切法。可根据实际情况,采用相适应的方法进行实验。所述片段化处理之后还可包括片段化产物的分离纯化以及末端修饰的步骤。根据测序的片段长度需要,对于片段化得到的核酸片段,进行目的核酸片段的分离纯化,分离方法可以采用常用方法,如凝胶电泳、蔗糖梯度或氯化铯梯度沉降、柱层析分离等。根据所使用的片段化方法,对所得的目的核酸片段进一步的末端修饰,包括但不限于磷酸化或去磷酸化、末端补平和末端加A,以便于后续的接头元件连接。上述目的核酸片段长短不限,优选为25bp 500bp,更优选为30bp 200bp,更优选为40bp lOObp。步骤S121所述片段化产物的长度不限,优选为25bp 500bp,更优选为30bp 200bp,更优选为40bp IOObp间。在实现对目标区域的测序的前提下,随着目标区域测序文库分子中含有的目标区域片段长度的减短,高通量测序技术的对目标区域的测序深度加深;而测序深度越深,即对目标区域的每一个碱基位置的测序次数越多,测序结果越准确, 对样品中的少量突变的检测就越灵敏;这样就能够有效防止因为样品中带有突变的目标区域的比例偏低,而导致该突变的测序信号的绝对值偏低,发生测序结果不准确的现象。为了实现对目标区域测序文库大小的限制,可在步骤S121或S122之后,对片段化产物或目标区域测序文库进行分离纯化。分离纯化的方法有多种,包括但不限于凝胶方法、蔗糖梯度或氯化铯梯度沉降和柱层析分离。可根据实际情况,采用相适应的方法进行实验。根据上述接头元件,针对步骤S122,下面将通过多个实施例和附图对本步骤进行进一步的说明。在本发明的一个实施例中,直接在片段化产物的两端接上接头形成测序文库。所述接头可采用上述的平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的至少一种。在本发明的另一个实施例中,如图10所示,步骤S122具体可由以下步骤实现S1221.利用第一接头与片段化产物的两端连接,得第一连接产物;S1222.环化第一连接产物,得环化产物;S1223. II s型限制性内切酶酶切环化产物,得酶切产物;S1224.在酶切产物两端接上第二接头和第三接头,得测序文库。在步骤S1221中,所述第一接头可采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种,所述第一接头包含有II S型限制性内切酶酶切识别位点;所述的II s型限制性内切酶为切割位点在识别序列之外的限制性内切酶,包括但不限于Acu
I、AlwI、Bbs I、BbV I、Bcc I、BceA I、BciV I、BfuA I、Bmr I、Bpm I、BpuE I、Bsa I、BseM
II、BseRI、Bsg I、BsmA I、BsmB I、BsmF I、BspCN I、BspM I、BspQ I、BtgZ I、Ear I、Eci I、EcoP15 I、Fau I、Fok I、Hga I、Hph I、HpyAV、Mbo II、Mly I、Mme I、Mnl I、NmeAIII、 Ple I、Sap I、SfaN I 和 TspDT I,优选为 Acu I、Bsg I、EcoP15 I 或 Mme I。当所述第一接头为分叉接头时,该II s型限制性内切酶酶切识别位点位于互补区;当所述第一接头为带茎环结构的接头时,限制性内切酶识别位点与茎环结构之间的距离,较II S型限制性内切酶酶切识别位点与茎环结构之间的距离近。若片段化产物经过末端修复酶修复,以及末端加A反应,所述第一接头优选为带T
11末端的分叉接头。若片段化产物只是经过末端修复酶修复,将片段化产物的末端补平,则所述第一接头优选双脱氧接头。在步骤S1222中,环化第一连接产物有多种实现方式。在本发明的一实施例中,步骤S1222包括以下步骤S12221.利用酶切引物对第一连接产物进行扩增,得扩增产物;S12222.对扩增产物进行酶切,使得扩增产物形成粘性末端,并自身环化成环化产物。所述酶切引物的3’端分别与第一连接产物的两个末端部分互补,5’端均含有限制性内切酶识别位点。经过步骤S12221的扩增形成的扩增产物,其两个末端均含有限制性内切酶识别位点,然后在相应的酶的作用下,使扩增产物的两端形成粘性末端,且这两个粘性末端互补,能够进行自身环化。在本发明的另一个实施例中,所述第一接头包含有2个酶切识别位点,其中一个为限制性内切酶识别位点,用于使步骤S1222形成的第一连接产物的两端在相应的酶的作用下,形成粘性末端,且它们之间互补,能够进行自身环化。另一个为II s型限制性内切酶酶切识别位点,用于在步骤S1223中,利用识别该酶切位点的酶识别环化产物,进行酶切, 进而得到酶切产物。应当说明,以上两个实施例仅为本发明中的两种实现环化第一连接产物的实施方案,对于本发明的保护范围不做任何具体的限制。在步骤S1223中,利用能够识别第一接头上的酶切识别位点,并切割环化产物 (DNA)但不切割第一接头的酶进行酶切。所述第一接头上的酶切识别位点包括但不限于 Mme I酶切识别位点、Acu I酶切识别位点、Bsg I酶切识别位点。步骤S1224中,所述弟_■接头可为平末〗而接头、关出末〗而接头、带环结构的接头和分叉接头中的一种,可带有生物素标记。所述第三接头可为平末端接头、突出末端接头、 带茎环结构的接头和分叉接头中的一种。第二接头与第三接头可相同或不同。优选的,所述第二接头和第三接头相同,均为分叉接头。更优选的,所述分叉接头为T末端分叉接头或双脱氧分叉接头。需要特别说明的是,步骤S1222与S1223之间还可包括步骤S1222A :滚环扩增环化产物,得滚环扩增产物。通过步骤S1222A,能够保证后续的酶切步骤S1223有足够的原材料。又或者,在步骤S1221与S1222之间还可包括步骤S1221A :利用扩增引物对第一连接产物进行扩增,得扩增产物。所述扩增引物分别与第一连接产物两端的接头序列互补。 通过步骤S1221A,能够保证后续的环化步骤有足够的原材料。本方案可避免在步骤S1222之后进行滚环扩增,而用步骤S1222之前的步骤 S1221A进行普通的PCR扩增代替,可有效减少后续酶切步骤中,II s型限制性内切酶的用量。其中,所述第一接头优选为分叉接头。其中,所述分叉接头的互补区可包含至少一个酶切识别位点。所述酶切识别位点可为普通的限制性内切酶识别位点,也可为II S型限制性内切酶酶切识别位点。其中,步骤S122IA所述扩增弓I物优选为生物素化引物,有利于扩增产物的回收纯化。其中,步骤S1221A所述扩增引物带有至少一个特异性酶切识别位点。若扩增引物上所带的特异性酶切识别位点是尿嘧啶碱基,则步骤S1222中利用尿嘧啶特异性切除试剂进行酶切,然后再进行连接环化。若扩增引物所带特异性酶切识别位点为限制性内切酶识别位点,则步骤S1222中利用相应的限制性内切酶进行酶切,然后再进行连接环化。在本发明的另一个实施例中,如图11所示,步骤S122具体可由以下步骤实现S1221’ .利用第四接头与片段化产物连接,得第二连接产物;S1222’ . II s型限制性内切酶酶切第二连接产物,得带有第四接头的酶切片段;S1223’ .带有第四接头的酶切片段与第五接头连接,形成测序文库。需要说明的是在步骤S1221’中,所述第四接头可采用平末端接头、突出末端接头、带茎环结构的接头和分叉接头中的一种,所述第四接头包含有II S型限制性内切酶酶切识别位点;当所述第四接头为分叉接头时,该II s型限制性内切酶酶切识别位点位于互补区;当所述第四接头为带茎环结构的接头时,限制性内切酶识别位点与茎环结构之间的距离,较II s型限制性内切酶酶切识别位点与茎环结构之间的距离近。在步骤S1222’中,利用能够识别第四接头上的酶切识别位点,并切割环化产物 (DNA)但不切割第四接头的酶进行酶切。所述第四接头上的酶切识别位点包括但不限于 Mme I酶切识别位点、Acu I酶切识别位点、Bsg I酶切识别位点。若片段化产物经过末端修复酶修复,以及末端加A反应,所述第四接头优选为带T末端的分叉接头。若片段化产物只是经过末端修复酶修复,则所述第四接头优选双脱氧接头。在步骤S1223’中,所述弟五接头可为平末纟而接头、关出末纟而接头、带环结构的接头和分叉接头中的一种,可带有生物素标记。在本发明的另一个实施例中,步骤SI22具体包括以下步骤S1221”.直接在片段化产物的两端接上带茎环结构的接头,形成带茎环结构的片段化产物;S1222”.利用限制性内切酶,将带茎环结构的片段化产物的茎环区切开或切除,从而形成测序文库。本技术方案利用带茎环结构的接头,防止了多个接头自连现象的发生。当通过上述几个方案形成的测序文库的数量过少,不利于后续的单分子扩增步骤时,还可以进行以下步骤利用与目标区域测序文库两端的接头部分互补的引物,以所得的测序文库为模板进行扩增,得扩增后的测序文库。该步骤可满足后续实验对目标测序文库的量的要求。其中,步骤S2所述的单分子扩增是指对目标区域测序文库中的分子,以极微量 (甚至单分子)的形式在空间上隔离(但这些文库分子整体上还是属于同一个反应体系), 并且在各自的空间内实现扩增,以提升各种分子在后续测序反应中的信号。所述单分子扩增的方法包括但不限于乳液PCR(Emulsion PCR, EPCR)、桥式PCR。所述EPCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板(目标区域测序文库分子)和一个磁珠,磁珠上含有与目标区域测序文库分子的共有序列(由接头元件引入)互补的引物,在PCR反应后,磁珠表面就固定有拷贝数目巨大的同来源的DNA模板扩增产物。EPCR的具体步骤可参考PCR amplification from single DNA molecules on magnetic beads in emulsion application for high-throughput screening of transcription factor targets, Takaaki Kojima, Yoshiaki Takei, Miharu Ohtsuka et al, Nucleic Acids Research, 2005, Vol. 33, No. 17 ;Dual primer emulsion PCR for nextgeneration DNA sequencing, Ming Yan Xu, Anthony D. Aragon, Monica R. Mascarenas et al, BioTechniques48 409-412 (May 2010) ;BEAMing single-molecule PCR on microparticles in water-in-oil emulsions,Frank Diehl, Meng Li,Yiping He,nature methods,Vol. 3, No. 7,July 2006 等。所述桥式PCR的基本原理是,桥式PCR的引物被固定在固相载体上,PCR过程中 PCR扩增产物会被固定在固相载体上,且PCR扩增产物能够与固相载体上的引物互补配对,成桥状,然后互补配对的引物以与其成桥的扩增产物为模板进行扩增。通过控制初始模板加入的量,桥式PCR反应完成后,扩增产物在固相载体上以一簇簇的形式存在,且每一簇的扩增产物为同来源的DNA模板扩增产物。其具体的原理和实施方案可参考以下文献 CN20061009879. X、US6227604。如前所述,现有技术中,Sanger测序技术由于自身的技术限制,每次只能对一个样品的某一段区域进行测序。为了一次性实现对样品中多个区域的同时检测,本发明在测序方法上采取高通量基因测序方法。高通量基因测序相对Sanger测序法检测序列信息更为方便灵敏,测序文库中的各个分子经过单分子扩增后,每个测序文库分子均形成单分子拷贝阵列,各单分子拷贝阵列在进行高通量基因测序时处于不同的位置,使得测序引物与单分子拷贝阵列之间的杂交,以及在酶作用下的延伸反应可同时进行,相互之间互不干扰。 因此,可以同时对大量的(成百万上千万,甚至数亿、数十亿的)单分子拷贝阵列同时进行测序反应,然后通过采集相应的信号,进而准确的获得所需的序列信息,且测序的灵敏度较 Sanger更高。尤其是对多个目标区域的扩增产物进行了片段化处理,相当于对相同序列的目标区域分子的每个碱基的测序次数增加了,能够进一步提高测序的灵敏度。其中,步骤S3所述的高通量测序技术包括但不限于基于聚合酶的合成测序法、 基于连接酶的连接测序法。基于聚合酶的合成测序法是基于带可去除标记的核苷酸进行的。在每次合成反应中,每个模板链至多只能延伸一次,基于聚合酶的合成测序法的大致流程如下a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该单分子扩增产物固定在引物-固相载体复合物上),在DNA聚合酶的作用下,以带可去除标记的核苷酸进行单碱基延伸合成反应,收集该次加入核苷酸的标记信号,即可得到与测序引物3’ 最末端碱基互补的单分子扩增产物(固定在引物-固相载体复合物上)的下一位的碱基序列信息。b.切除可去除标记,然后在DNA聚合酶的作用下,以带可去除标记的核苷酸继续进行单碱基延伸合成反应,收集加入核苷酸的标记信号,即可得到与测序引物3’末端碱基互补的单分子扩增产物的下两位的碱基序列信息。重复b步骤,直至不能继续进行合成反应为止,从而获得单分子扩增产物的全部序列信息。基于连接酶的连接测序法是均是基于带荧光标记的寡核苷酸探针进行的。其中一种连接酶的连接测序法是基于在特定位置带有荧光标记的寡核苷酸探针进行的,该寡核苷酸探针带有η个碱基,从其5’端数起的第a位带有荧光标记,其中不同的碱基对应特定的荧光标记,因为该寡核苷酸探针的3’端或5’端进行了特定的修饰,寡核苷酸探针之间不能直接相互连接,每次连接反应,每个单分子扩增产物只能连接一个寡核苷酸探针。该连接测序法的大致流程如下A.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该单分子扩增产物固定在引物-固相载体复合物上)上,利用上述的寡核苷酸探针,在连接酶的作用下,将核酸探针与上述寡核苷酸链连接,然后采集荧光信号,即可得与单分子扩增产物共有的已知序列的3’末端后或5’末端前第a位碱基序列信息。B.切除寡核苷酸上的荧光标记,在连接酶的作用下,以上述的寡核苷酸探针为原料,继续进行连接反应,然后采集荧光信号,从而得单分子扩增产物共有的已知序列的3’末端后或5’末端前第2a位的碱基序列信息。重复B步骤,直至不能继续进行连接反应为止,从而获得单分子扩增产物共有的已知序列的3’末端后或5’末端前第a、2a、3a、4a......位的碱基序列信息。然后将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来, 换用与之前的测序引物相比3’末端或5’末端少一个碱基的引物重复上述反应,从而获得
单分子扩增产物共有的已知序列的3 ’末端后或5 ’末端前第a-1、2a-l、3a_l、4a_l......位
的碱基序列信息。重复此步骤,最后获得单分子扩增产物共有的已知序列的3’末端后或5’
末端如第a_ (a~l)、2a_ (a-1)、3a_ (a-1)、4a_ (a-1)......位的喊基序列/[目息,从而获得单
链扩增产物的全部序列信息。另一种连接酶的连接测序法同样也是基于带有荧光标记的寡核苷酸探针进行的, 该寡核苷酸探针带有η个碱基,分为h(h ( η)组,同一组寡核苷酸探针的不同荧光标记对应同一特定位置的不同碱基序列,不同组之间的区别在于不同荧光标记对应的特定位置不同,因为该寡核苷酸探针的3’端或5’端进行了特定的修饰,寡核苷酸探针之间不能直接相互连接,每次连接反应,每个单分子扩增产物只能连接一个寡核苷酸探针。该连接测序法的大致流程如下a.测序引物通过互补配对结合在单分子扩增产物共有的已知序列上(该单分子扩增产物固定在引物-固相载体复合物上)上,利用上述寡核苷酸探针中的一组(荧光标记对应的碱基位置为x,x < h),在连接酶的作用下,将核酸探针与上述寡核苷酸链连接,然后采集荧光信号,即可得与单链扩增产物共有的已知序列的3’末端后或5’末端前第X位碱基序列信息,将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来。b.然后重新将测序引物结合在单分子扩增产物上,换用与a步骤不同的寡核苷酸探针组(荧光标记对应的碱基位置为1,I ( h),在连接酶的作用下,将核酸探针与上述寡核苷酸链连接,然后采集荧光信号,即可得与单链扩增产物共有的已知序列的3’末端后或 5’末端前第I位碱基序列信息,将测序引物及其所连接的寡核苷酸探针从单分子扩增产物上变性洗脱下来。c.重复步骤b,直至h组寡核苷酸探针均分别进行过一次连接反应,从而获得单分子扩增产物共有的已知序列的3’末端后或5’末端前第1、2.......h位的碱基序列信息。换用与之前的测序引物相比3’末端或5’末端多一个或多个通用碱基的引物按上述原理进行反应,能够延长获得的单分子扩增产物共有的已知序列的3’末端后或5’末端前的碱基序列的读长。这种基于连接酶的连接测序法的原理和具体实施方案可参考CN200710170507. I。基于聚合酶的合成测序法与焦磷酸测序法有一定的相似之处,因此,理论上来说, 焦磷酸测序法同样能够适用于本发明的检测方法。但是现有的焦磷酸测序法在测序过程中采用的是天然dNTP,使得其在测序过程中,对待测序文库上可能存在的连续单碱基重复序列的测定存在困难;而基于聚合酶的合成测序法中的核苷酸带有的可去除标记,能够保证每次只延伸一个碱基;基于连接酶的连接测序发中的带荧光标记的探针的3’端或5’端进行了修饰,保证每个单分子扩增产物的片段上只连接一个荧光探针;因此本发明的基于聚合酶的合成测序法和基于连接酶的连接测序法的准确性较焦磷酸测序高。此外,因为现有的焦磷酸测序仪器中的蚀刻光纤玻片(PTP板)上的小孔较大 (55 UmX 44 μ m),用于容纳测序之前的乳液PCR所得的扩增产物(乳液PCR的扩增产物被固定在10 μ m的珠上),这大大限制了焦磷酸测序法的测序通量,使得其测序反应的试剂成本较高。此外,焦磷酸测序法在测序过程中还需往蚀刻光纤玻片(PTP板)的小孔内加入含有多种蛋白的复合物以保证测序反应的顺利进行,而这将大大提高测序反应的试剂成本。相对的,基于聚合酶的合成测序法和基于连接酶的连接测序法可通过Iym的磁珠或者玻片来固定单分子扩增的产物,使得其通量更高,且除了需要带有可去除标记的核苷酸或在3’端或5’端进行了修饰的荧光标记的探针外,所需的其他试剂无特殊要求,这就大大降低了测序反应的试剂成本。在获得相同数据量的情况下,基于聚合酶的合成测序法和基于连接酶的连接测序法的测序成本为焦磷酸测序法的二千分之一或更少。因此本发明方案中采用的是基于聚合酶的合成测序法或基于连接酶的连接测序法对单分子扩增产物进行测序。在本发明的一具体实施例中,同时检测G6H)基因的I至13外显子。设计分别用于扩增这些外显子的特异性引物E1F(SEQ ID NO 1) EIR(SEQ ID NO :2)、E2F(SEQ ID NO 3)和 E2R(SEQ ID NO 4)、E3F(SEQ ID NO 5)和 E3R(SEQ ID NO 6)、E4F(SEQ ID NO 7)和 E4R(SEQ ID NO :8)、E5F (SEQ ID NO 9)和 E5R(SEQ ID NO :10)、E6F(SEQ ID NO :11) 和 E6R(SEQ ID NO : 12)、E7F (SEQ ID NO :13)和 E7R(SEQ ID NO : 14)、E8F (SEQ ID NO :15) 和 E8R(SEQ ID NO :16)、E9F(SEQ ID NO :17)和 E9R(SEQ ID NO : 18)、E10F(SEQ ID NO :19)
ElOR (SEQ ID NO :20)、El IF (SEQ ID NO :21) El IR (SEQ ID NO :22)、E12-13F (SEQ ID NO 23)和 E12-13R(SEQ ID NO :24)。—、待测样品DNA的提取利用市场上常见的核酸提取试剂盒分别提取全血样品(I至10)、石蜡组织样品 (11至20)的DNA,并分别做上相应的标记,上述20个样本中,I至5和11至15为女性样本;6至10和16至20为男性样本;以突变型质粒I (含有突变型序列SEQ ID NO 27)、野生型质粒I (含有野生型序列SEQ ID NO 28)、突变型质粒2 (含有突变型序列SEQ ID NO
1629)、野生型质粒2 (含有野生型序列SEQ ID NO 30)、突变型质粒3 (含有突变型序列SEQ ID NO :31、野生型质粒3 (含有野生型序列SEQ ID NO 32)为对照,上述对照样品编号分别为 21、22、23、24、25、26。二、Gero基因目标区域的扩增利用上述的G6ro基因特异性引物,对G6ro基因的目标区域进行扩增,得扩增产物。各Gero基因的目标区域的扩增是分别进行的。反应体系如下
0184]上游引物(10 μ M)2 μ L ;0185]下游引物(10 μ Μ)2 μ L ;0186]dNTP (各 2. 5mM)4μ L ;0187]待测样品DNA20ng ;0188]Ex Taq(5U/μ L)0. 25 μ L ;0189]IOXEx Taq Buffer5 μ L ;0190]ddH20 加至 50 μ L。0191]PCR反应条件如下0192]95 °C 3min ;0193]94°C 30s, 58°C 30s, 72°C30s ;重复0194]72 °C 7min。利用PCR清洁试剂盒,分别对各样品的扩增产物进行清洁,除去未扩增的引物和 dNTP,回收扩增产物。三、构建测序文库此步骤可有多种实施方案,本发明的一个实施例中,包括以下两个步骤I.扩增产物的片段化利用超声法进行片段化处理。具体操作为测定回收后的扩增产物浓度,并按等摩尔数将同一样品的G6ro基因的不同目标区域的回收后的扩增产物进行混合,得混合液,并做上相应的标记。 将每个样品的混合液(约50 μ L)加入至400 μ L的TE buffer中,在430W功率条件下超声4s,间隔20s,反复5次,得片段化产物。利用1%琼脂糖凝胶对各样品的片段化产物进行分离纯化,切胶回收大小在40bp至IOObp之间的片段化产物。2.构建测序文库在构建目标区域测序文库之前,需对切胶回收的片段化产物分别进行末端修饰, 以便于接头元件的连接。在本实施例中,对切胶回收的片段化产物的末端修饰包括磷酸化、 末端补平和末端加A反应。
0204]具体实现如下0205]I)磷酸化以及末端补平反应0206]体系为0207]切胶回收的片段化产物20 μ L (约 2000ng)0208]IOmM dNTPI. 5μ L ;0209]T4 DNA 聚合酶(5U/ μ L)I μ L ;0210]Klenow DNA聚合酶O. I μ L ;
T4 多核苷酸激酶(10U/yL) O. 5uL;IOm MATPI. 5μ L ;10XΤ4连接酶缓冲液IOyL;加ddH20 至 100 μ L。反应条件为20°C孵育20min。反应结束后利用回收试剂盒进行纯化回收。2)末端加A尾反应体系为磷酸化以及末端补平后的回收产物 60 μ L(约IOOOng);Klenow 缓冲液(NEB Buffer2)10 μ L ;IOmM dATP2 μ L ;Klenow 酶(3,to 5,exo minus, IOU/ μ L) I μ L ;加ddH20 至 100μ L。反应条件为37°C孵育30min。反应结束后利用纯化试剂盒纯化回收。3)连接接头I本实施例中,采用如图6所示的T末端分叉接头作为接头1,同一样品的所使用的 T末端分叉接头相同,不同样品的T末端分叉接头不同,区别在于标签序列不同,不同样品对应的标签序列如下表I所示。表I各样品建库过程中的第一接头上的标签序列
样本编号标签序列 (5,—3,)样本编号标签序列 (5,—3,)样本编号标签序列 (5,~>3,)IAGCT11GACT21CGAT2AGTC12GATC22CGTA3ATGC13GTCA23CTGA4ATCG14GTAC24CTAG5ACTG15GCAT25CAGT6ACGT16GCTA26CATG7AAGG17ACAC8AACC18AGAG9TTGG19TCTC10TTCC20TGTG在T4连接酶的作用下,上述T末端分叉接头分别与加A尾后纯化回收的产物进行连接,形成带接头I的片段。连接体系为加A尾后纯化回收的产物接头IIOmM ATPT4DNA 连接酶(10U/ μ L)10 X Τ4连接酶缓冲液
50 μ L (约 500ng); 2 μ L (约 3000ng); 5 μ L ;
I μ L ;
10μ L ;
加 ddH20 至 100 μ L。
反应条件为16°C孵育4h以上。反应结束后利用纯化试剂盒纯化回收。
4) PCR扩增带接头I的片段
扩增体系为
带接头I的片段约 300ng ;
IOXEx Taq Buffer100μ L ;
Primer F(100 μ M, SEQIDNO 33) 10μ L ;
Primer R(100 μ M, SEQIDNO 34) 10μ L ;
Ex Taq (5U/μ L)7. 5μ L ;
dNTP (各 2· 5mM)80 μ L ;
ddH20 up to 1000 μ L。
PCR反应条件如下
95 °C 3min ;
94°C 30s, 58°C 30s, 72°C30s ;重复25个循环;
72 °C 7min。
利用PCR清洁试剂盒,分别对各样品的扩增产物进行清洁,除去未扩增的引物和
dNTP,回收带接头I的片段的扩增产物。5)11 s型限制性内切酶酶切利用Acu I酶切回收后的带接头I的片段的扩增产物,反应体系如下回收后的带接头I的片段的扩增产物 60 μ L (3 5 μ g);10XNEB Buffer 48μ L ;Acu I (NEB)2 μ L(IOU);SAM (3. 2mM)I μ L (终浓度 50 μ Μ);ddH20 up to 80 μ L。反应条件37°C孵育lh。反应结束后利用纯化试剂盒纯化回收酶切产物。6)连接接头2利用如图7所示的突出末端分叉接头作为接头2,与回收的酶切产物进行连接,得
测序文库,连接体系如下回收的酶切产物2yg;接头2 (IOpM)luL;10 T4DNA 连接酶(3U/ μ L)I μ L ;10 X Τ4连接酶缓冲液2 μ L ;加ddH20 至 100μ L。连接条件,14°C孵育2h。反应结束后利用纯化试剂盒纯化回收,然后变性形成单链,得测序文库。四、对测序文库进行单分子扩增测定步骤三所获得的26个测序文库各自的浓度,然后按同等浓度混合,然后进行单分子扩增,得单分子扩增产物,所述单分子扩增的方法可采用EPCR或桥式PCR。优选为EPCR扩增,单分子扩增引物优选为SEQ ID NO 25和SEQ ID NO :26。
五、对单分子扩增产物进行高通量测序所述测序方法可采用基于合成酶的合成测序法,也可采用基于连接酶的连接测序法。对测序结果进行生物信息学分析,即可得到上述26个样品的Gero基因序列信息如下样本2为G1376T杂合子;样本3为G1388A杂合子;样本6为C1024T半合子;样本11为G1388A突变纯合子;样本14为A95G杂合子;样本19为G1376T半合子;上述样本只存在上述突变;其它样本均为野生型。对照样品的检测结果均与对照样品本身含有的基因序列相符。应当说明,本实施例只是本发明的一个具体实施例,对本发明无任何限定作用,例如G6H)基因特异性引物的具体序列以及组合均可进行相应的替换,除此之外,本实施例中的多个步骤均可参照前述的方法进行替换,在此不再赘述。针对本发明的对G6ro基因进行测序的方法的灵敏度,本发明采用下述实施例进行验证。通过常规设计,构建分别含有G6H)基因外显子2野生型序列(SEQ ID NO 28)和突变型序列(SEQ ID NO 27)的质粒,含有G6H)基因外显子9野生型序列(SEQ ID NO 30) 和突变型序列(SEQ ID NO 29)的质粒。然后配置突变率分别为20%、10%、5%、3%、1%、0%的质粒混合液。以含有1000 个拷贝质粒的上述质粒混合液为模板,然后按参照上一实施例的方法进行检测。检测结果见表2。表2 G6H)基因灵敏度实验检测结果
本发明涉及基因工程领域,提供了一种对6磷酸葡萄糖脱氢酶基因进行测序的方法及试剂盒,该方法包括以下步骤A.利用G6PD基因特异性引物,对待测样品中的多个目标区域进行扩增,并基于扩增产物构建测序文库;B.对测序文库进行单分子扩增,得到与所述多个目标区域对应的多个单分子扩增产物;C.同时对所述多个单分子扩增产物进行高通量基因测序,得到所述多个目标区域的序列信息。该方法及其相应的试剂盒利用高通量测序技术对多个目标区域同时进行区域测序,提高了检测效率,同时还能提高检测的准确性和灵敏度,并能进一步同时对大量样品进行多区域检测。
一种对6磷酸葡萄糖脱氢酶基因进行测序的方法及试剂盒制作方法
- 专利详情
- 全文pdf
- 权力要求
- 说明书
- 法律状态
查看更多专利详情
下载专利文献
下载专利
同类推荐
-
Y·贝雷兹尼特斯基宁聪琴, 鲁文豪
您可能感兴趣的专利
-
乔治·哈尔西·比尔黄健, 肖华胜
专利相关信息
-
李来庚, 赵运军A·温奎斯特