您的当前位置：首页一种单细胞转录组文库建立方法及其应用[发明专利]

一种单细胞转录组文库建立方法及其应用[发明专利]

来源：九壹网

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 108193283 A(43)申请公布日 2018.06.22

(21)申请号 201711391465.4(22)申请日 2017.12.21

(71)申请人上海美吉生物医药科技有限公司

地址 200120 上海市浦东新区中国（上海）

自由贸易试验区高科中路2810弄8号1204室单元D(72)发明人王芳　陈昌岳　李静　郑冠涛　

路远　闫丽　胡秋萍　张祥林　(51)Int.Cl.

C40B 50/06(2006.01)C12Q 1/6869(2018.01)

权利要求书2页说明书16页

序列表1页附图3页

CN 108193283 A(54)发明名称

一种单细胞转录组文库建立方法及其应用(57)摘要

本发明提供一种优化的单细胞转录组文库

(1)通过细胞裂解或抽建立方法，包括如下步骤：

提获得样本RNA；(2)对样本进行反转录操作，使RNA反转录成为cDNA；(3)以分离后cDNA构建转录组文库；其中，步骤(3)中以分离后cDNA构建转录组文库包括以下步骤：(3-1)进行加尾反应或采用单链连接方式加入接头；(3-2)cDNA进行二链合成以及扩增反应；(3-3)指数扩增；(3-4)对经步骤(3-3)处理后cDNA扩增产物进行转录组文库构建后，除去“无用DNA”；或除去经步骤(3-3)处理后的cDNA扩增产物中的“无用DNA”后，构建转录组文库。相对于现有技术，该方法更高效、简单、实用、精准、污染小、损失少、成本低、方法重复性好，拓展了样本应用范围，同时提高了检测的精密度。

CN 108193283 A

权　利　要　求　书

1/2页

1.一种单细胞转录组文库建立方法，其特征在于，所述方法包括如下步骤：(1)通过细胞裂解或抽提获得样本RNA；(2)对样本进行反转录操作，使RNA反转录成为cDNA；(3)以分离后的cDNA构建转录组文库；其中，步骤(3)中以分离后的cDNA构建转录组文库包括以下步骤：(3-1)对cDNA的3’端进行加尾反应或采用单链连接方式加入接头；(3-2)对经步骤(3-1)处理后的cDNA进行二链合成以及扩增反应；(3-3)对经步骤(3-2)处理后的cDNA二链扩增产物进行指数扩增；

(3-4)对经步骤(3-3)处理后的cDNA扩增产物进行转录组文库构建后，除去“无用DNA”；或除去经步骤(3-3)处理后的cDNA扩增产物中的“无用DNA”后，构建转录组文库。

2.如权利要求1所述的一种单细胞转录组文库建立方法，其特征在于，所述细胞裂解的裂解液包括混合引物，所述混合引物为特制引物。

3.如权利要求2所述的一种单细胞转录组文库建立方法，其特征在于，所述混合引物包括第一引物、第二引物和第三引物；

所述第一引物的序列如SEQ ID NO：1所示，具体为：5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNN TTTTTTTTTTTTTTTTT3’，其中，NNNN为随机序列，TTTTTTTTTTTTTTTTT为polyT序列；

所述第二引物的序列如SEQ ID NO：2所示，具体为：5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNNGGG3’，其中，NNNN为随机序列, GGG为斜体部分序列；

所述第三引物的序列如SEQ ID NO：3所示，具体为：5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNNTTT3’，其中，NNNN为随机序列，TTT为斜体部分序列。

4.如权利要求3所述的一种单细胞转录组文库建立方法，其特征在于，所述第二引物斜体部分序列GGG和第三引物的斜体部分序列TTT可删除，也可以被下列碱基对替代：GGG与AAA对；CCC与TTT对；CCC与AAA对。

5.如权利要求3所述的一种单细胞转录组文库建立方法，其特征在于，所述第一引物的随机序列长度为4-20nt，优选地为4-12nt，更优选地为4-8nt；所述第一引物的polyT序列长度为10-50nt，优选地为12-30nt，更优选地为15-25nt。

6.如权利要求3所述的一种单细胞转录组文库建立方法，其特征在于，所述第二引物的随机序列长度为4-20nt，优选地为4-12nt，更优选地为4-8nt。

7.如权利要求3所述的一种单细胞转录组文库建立方法，其特征在于，所述第三引物的随机序列长度为4-20nt，优选地为4-12nt，更优选地为4-8nt。

8.如权利要求1所述的一种单细胞转录组文库建立方法，其特征在于，步骤(3-4)中，所述cDNA二链合成所需的反应液包括第四引物，所述第四引物的序列如SEQ ID NO：4所示，具体为：5’GAGTAGGAAGTGGATGAGAGGTGNNNNNGGG3’，其中，NNNN为随机引物序列，GGG为斜体部分序列。

9.如权利要求8所述的一种单细胞转录组文库建立方法，其特征在于，所述第四引物的随机引物序列长度为4-20nt，优选地为4-12nt，更优选地为4-8nt；所述第四引物斜体部分

CN 108193283 A

权　利　要　求　书

2/2页

序列为G的连续序列，长度为0-30nt，优选地为2-20nt，更优选地为3-10nt。

10.如权利要求1所述的一种单细胞转录组文库建立方法，其特征在于，步骤(3-3)中，所述指数扩增所需的反应液包括第五引物，所述第五引物的序列如SEQ ID NO：5所示，具体为：5’GAGTAGGAAGTGGATGAGAGGTG 3’。

11.如权利要10所述的一种单细胞转录组文库建立方法，其特征在于第五引物序列如SEQ ID NO：5的反向互补序列、序列如SEQ ID NO：5或其反向互补序列的一部分、优选地为序列如SEQ ID NO：5全长序列。

12.如权利要求1所述的一种单细胞转录组文库建立方法，其特征在于，步骤(3-4)中，所述“无用DNA”的去除采用单链消化的方式。

13.如权利要求1或12所述的一种单细胞转录组文库建立方法，其特征在于，所述“无用DNA”包括但不限于由rRNA、tRNA、线粒体RNA、高表达的持家基因的RNA、其他需要去除的目标RNA反转获得的cDNA。

14.如权利要求12所述的一种单细胞转录组文库建立方法，其特征在于，所述单链消化方式包括如下步骤：

a.通过扩增或合成获得所述“无用DNA”的互补序列；b.所述“无用DNA”互补序列和“无用DNA”结合，形成非闭合结构单链DNA；c采用核酸外切酶消化所述非闭合结构单链DNA。

15.如权利要求14所述的一种单细胞转录组文库建立方法，其特征在于，所述核酸外切酶包括但不限于以下一种或几种：核酸外切酶T、RecJf核酸外切酶、核酸外切酶VII、核酸外切酶I。

16.如权利要求1-15任一项所述文库建立方法用于单细胞样本或多细胞样本转录组测序中的用途。

17.一种单细胞样本或多细胞样本转录组测序方法，其特征在于，包括如下步骤：采用如权利要求1-15任一项所述文库建立方法获得转录组文库后，进行测序，对所述测序结果进行分析。

18.一种单细胞转录组文库构建试剂盒，其特征在于，按照权利要求1-15中任一项所述的一种单细胞转录组文库建立方法使用，包括：细胞裂解液、反转录反应物、DNA消化试剂、RNA消化试剂、线性PCR反应物、指数PCR反应物和转录组文库构建试剂。

CN 108193283 A

说　明　书

一种单细胞转录组文库建立方法及其应用

1/16页

技术领域

[0001]本发明涉及分子生物学与转录组学领域，尤其涉及一种单细胞转录组文库建立方法及其应用。

背景技术

[0002]转录组为一个活细胞所能转录出来的所有RNA的总和，它是研究细胞表型和功能的一个重要手段。

[0003]随着技术的发展，单细胞RNA测序越来越受到研究者的青睐。传统测序实际上是对一个细胞群体进行分析，这种分析方案将所有细胞的信息平均化，无法获得个体细胞的差异信息。如果能够从整个系统中挑选多个不同的单细胞进行研究，则可以重建出整个系统，而且这种重建过程能够提供更多更有价值的信息。现行研究中如胚胎发育早期、癌症早期，由于无法获得大块组织、细胞数量非常稀缺的问题而难以用传统方法开展研究，这就使得单细胞测序凸显出其重要性。单细胞测序技术不仅有助于我们认识细胞之间的差异，还可以为我们提供一个重新定义细胞类型的方法。

[0004]现有技术中单细胞转录组的扩增方法如表1所示：[0005]表1

[0006]

CN 108193283 A[0007]

说　明　书

2/16页

目前市场上有多种单细胞RNA扩增试剂盒，可针对不同研究区域进行选择(如表

1)。这些单细胞RNA的扩增技术可以概括为五大类：针对带A尾的RNA进行扩增；针对全长RNA进行逆转录的方案；用特制的探针进行去除以及扩增；采用随机引物的方式进行扩增；用于rRNA去除的方法进行扩增。基于这五大类方法方法衍生出了如Smart-seq2、CEL-Seq、STRT-seq、Quartz-Seq等具体的实验方案。[0009]现有的方案存在以下缺点：首先，针对目前常用的单细胞扩增方案如SMART-seq，通过polyT的方式富集含有polyA的转录本，由于只有2％-60％的mRNA带有polyA，所以这一

[0008]

CN 108193283 A

说　明　书

3/16页

方案会造成不含polyA的转录本信息的丢失。其次，单细胞转录组建库过程(例如REPLI-Single Cell RNA Library Kit，Qiagen)无rRNA的去除步骤，而文库中约60％-99％的信息来源于rRNA，这一部分信息对于目前的研究意义不大且会造成测序数据的极大浪费。最后，现有技术中，FFPE等高度降解样本建库过程中由于需要价格较贵的酶、采用特制探针等问题导致成本高昂，了这一技术的应用。发明内容

[0010]鉴于现有技术的不足，本专利旨在提供一种较佳的单细胞转录组文库建立方法，采用特制随机引物与polyT引物相结合的方式对单细胞RNA进行扩增，扩增后的文库意想不到的通过单链消化的方法去除大部分“无用DNA”，从而获得单细胞转录组文库。这一发明利用改进的单细胞扩增方法进行转录组扩增，相比现有单细胞转录组方案更高效、简单、实用、精准、污染小、损失少、成本低、方法重复性好，拓展了样本应用范围，同时提高了检测的精密度。

[0011]为实现上述目的及其他相关目的，本发明提供了一种单细胞转录组文库建立方法，包括如下步骤：[0012](1)通过细胞裂解或抽提获得样本RNA；[0013](2)对样本进行反转录操作，使RNA反转录成为cDNA；[0014](3)以分离后的cDNA构建转录组文库；[0015]其中，步骤(3)中以分离后的cDNA构建转录组文库包括以下步骤：[0016](3-1)对cDNA的3’端进行加尾反应或采用单链连接方式加入接头；[0017](3-2)对经步骤(3-1)处理后的cDNA进行二链合成以及扩增反应；[0018](3-3)对经步骤(3-2)处理后的cDNA二链扩增产物进行指数扩增；[0019](3-4)对经步骤(3-3)处理后的cDNA扩增产物进行转录组文库构建后，除去“无用DNA”；或除去经步骤(3-3)处理后的cDNA扩增产物中的“无用DNA”后，构建转录组文库。[0020]需要指出，在进行步骤(3-1)前，可选择的对经步骤(2)处理后获得的cDNA进行消化RNA模板或消化多余引物处理。消化RNA模板或消化多余引物处理是本发明设计方案的优选步骤而非必选步骤，通过消化多余引物以及RNA模板可以减少由于引物扩增而产生的非特异性产物，从而降低由于非特异性产物可能造成的测序数据浪费、比对效率的降低及扩增的偏向性；但RNA模板或多余引物的存在本身并不影响最终单细胞转录组的建库。[0021]需要说明，步骤(3-4)中，可以先进行“无用DNA”的去除后进行文库的构建，也可以先构建文库后进行“无用DNA”的去除，在本方案中，次序不限。[0022]于本发明的一个实施例中，所述样本转录组RNA由单细胞样本裂解获得或由多细胞样本抽提获得，也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细胞样本抽提获得的RNA样本。

[0023]所述细胞可以是原核细胞或真核细胞。所述真核细胞可以是植物细胞或动物细胞及微生物。所述动物细胞具体选自组织消化的细胞、培养所得的细胞、胚胎发育早期的细胞、癌症早期的细胞、未经富集培养的微生物细胞、流式分选获得的细胞、有限稀释获得的细胞、激光捕获等方法获得的细胞中的任一种。[0024]于本发明的一个实施例中，若采用已获得的微量RNA，则无需进行步骤(1)细胞裂

CN 108193283 A

说　明　书

4/16页

解的操作，可直接进行步骤(2)逆转录的操作。[0025]于本发明的一个实施例中，步骤(1)中，所述细胞裂解的细胞裂解液包括混合引物，所述混合引物为特制引物。

[0026]所述混合引物包括第一引物、第二引物和第三引物：[0027]所述第一引物的序列如SEQ ID NO：1所示，具体为：[0028]5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNN TTTTTTTTTTTTTTTTT3’，下划线部分NNNN为随机引物序列，长度推荐但不限于4-20nt，优选地为4-12nt，更优选地为4-8nt；随后的polyT序列(TTTTTTTTTTTTTTTTT为polyT序列)长度推荐但不限于10-50nt，优选地为12-30nt，更优选地为15-25nt。

[0029]所述第二引物的序列如SEQ ID NO：2所示，具体为：[0030]5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNNGGG3’，下划线部分NNNN为随机引物序列，长度推荐但不限于4-20nt，优选地为4-12nt，更优选地为4-8nt；GGG为斜体部分序列。[0031]所述第三引物的序列如SEQ ID NO：3所示，具体为：[0032]5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNNTTT3’，下划线部分NNNN为随机引物序列；长度推荐但不限于4-20nt，优选地为4-12nt，更优选地为4-8nt；TTT为斜体部分序列。[0033]第二引物和第三引物的斜体部分序列GGG与TTT对可删除，也可以被下列碱基对替代：GGG与AAA对；CCC与TTT对；CCC与AAA对，斜体部分序列的引物对长度推荐但不限于3nt。此共同序列部分可以减少引物二聚体形成，优选地加入斜体部分的序列。[0034]于本发明的一个实施例中，步骤(1)中，所述细胞裂解液中同时也可加入脱氧核糖核酸酶进行DNA的消化，优选地为加入DNase I。[0035]于本发明的一个实施例中，步骤(1)中，所述细胞裂解液包括Rnase OUT，所述Rnase OUT也可以由其它具有同等功效的RNA酶抑制剂所替代。[0036]于本发明的一个实施例中，步骤(3-1)中，所述加尾反应在混合液中进行，所述混合液包括：TdT buffer、dCTP、TdT terminal transferase、Rnase-free H2O；[0037]进一步地，所述混合液中优选地可加如ddCTP以防止加尾过长，优选地ddCTP与dCTP的浓度为1:50-1:1000，更优选地为1:100-1:500，更优选地为1:200-1:400。[0038]进一步地，所述混合液中优选地可加如dNTPs以增加PCR扩增效率，优选地dCTP与dNTPs的浓度为1:1-1:200，更优选地为1:10-1:60，更优选地为1:20-1:40。[0039]于本发明的一个实施例中，步骤(3-2)中，所述cDNA二链合成所需的反应液包括第四引物，所述第四引物的序列如SEQ ID NO：4所示，具体为：[0040]5’GAGTAGGAAGTGGATGAGAGGTGNNNNNGG3’，下划线部分NNNNN为随机引物序列，长度推荐但不限于4-20nt，优选地为4-12nt，更优选地为4-8nt；斜体部分序列(GG)为G的连续序列，长度推荐但不限于0-30nt，优选地为2-20nt，更优选地为3-10nt。[0041]于本发明的一个实施例中，步骤(3-3)中，所述指数扩增所需的反应液包括第五引物，所述第五引物的序列如SEQ ID NO：5所示，具体为：[0042]5’GAGTAGGAAGTGGATGAGAGGTG 3’，第五引物的序列也可以是列举序列的反向互补序列，及该序列或其反向互补序列的一部分，优选地为该全长序列。[0043]于本发明的一个实施例中，步骤(3-4)中，所述“无用DNA”的去除采用单链消化的方式。

CN 108193283 A[0044]

说　明　书

5/16页

进一步地，所述通过扩增或合成获得的“无用DNA”的互补序列可以和“无用DNA”结

合，使其不能形成完整的双链结构，即形成非闭合结构单链DNA，采用核酸外切酶消化非闭合结构单链DNA而使其在后续的接头扩增中无法扩增、在测序中无接头序列而不能形成有效的cluster而不能被测序，达到去除“无用DNA”的目的。[0045]进一步地，所述“无用DNA”包括但不限于由rRNA、tRNA、线粒体RNA、高表达的持家基因的RNA、其他需要去除的目标RNA反转获得的cDNA。[0046]进一步地，所述核酸外切酶包括但不限于以下一种或几种：核酸外切酶T、RecJf核酸外切酶、核酸外切酶VII、核酸外切酶I。[0047]进一步地采用单链消化“无用DNA”的过程中先采用无链置换活性的DNA聚合酶，包括但不限于以下一种：KAPA HiFi Hotstart polymerase、T7DNA聚合酶、T4DNA聚合酶、

热启动Taq DNA聚合酶、热启动DNA聚合酶、超保真DNA聚合酶、

热启动Taq DNA聚合酶、DNA聚合酶、热启动超保真DNA聚合酶、

Taq DNA

聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、TaqDNA聚合酶、Taq DNA聚合酶、

热启动Flex DNA聚合酶、超保真DNA聚合酶、KAPA

HiFi Uracil+ReadyMix(2x)、PfuTurbo Cx热启动DNA聚合酶等一种或几种酶的组合。[0048]上述聚合酶起到扩增作用，将未被探针识别的序列扩增成为完整的双链DNA而使DNA不被降解，但是和探针互补的序列，由于探针占位而不能扩增为完整的双链DNA则在后续会被单链消化，在最后的测序或扩增过程中不能被保留而达到去除的目的。[0049]于本发明的一个实施例中，步骤(3-4)中，所述cDNA进行扩增所需扩增试剂包括第五引物，所述第五引物的序列如SEQ ID NO：5所示，具体为：[0050]5’GAGTAGGAAGTGGATGAGAGGTG 3’，所述第五引物的序列也可以是列举序列的反向互补序列，及该序列或其反向互补序列的一部分，优选地为该全长序列。[0051]第二方面，本发明还提供了一种如第一方面所述的文库建立方法用于单细胞样本或多细胞样转录组测序中的用途。[0052]第三方面，本发明还提供了一种单细胞样本或多细胞样本转录组测序方法，包括如下步骤：采用如第一方面所述文库建立方法获得转录组文库后，进行测序，对所述测序结果进行分析。[0053]第四方面，本发明还提供了利用上述一种单细胞转录组文库建立方法制备的一种适用于单细胞的转录组测序的文库构建试剂盒，包括：细胞裂解液、反转录反应物、DNA消化试剂、RNA消化试剂、线性PCR反应物、指数PCR反应物和转录组文库构建试剂，进一步地，还包括说明书，说明书上记载着如上所述任一用于一种单细胞转录组文库建立方法。[0054]第五方面，本发明还提供了一种适用于单细胞的转录组测序产品，包括如第五方面所述的文库构建试剂盒。

[0055]针对目前单细胞及微量样品的转录组扩增技术的不足，本申请提供了一种优化的单细胞转录组文库建立方法，创造性地通过单链消化的方式进行“无用DNA”的去除，旨在利用改进的单细胞扩增方法，可以以完整或降解的单细胞或等量的RNA为起始样本，进行转录组扩增。与现有技术相比，本发明具有如下有益效果：[0056]1、本发明的设计方案，可以以完整或降解的单细胞或等量的RNA为起始样本，实现单细胞的起始量(10pg)。与目前绝大多数的产品相比，传统的poly T的富集方案只能对质

CN 108193283 A

说　明　书

6/16页

量好的RNA(RIN值大于8)进行富集、扩增。在微量起始的前提下，采用不依赖于polyA的扩增方式，可应用于微量样品、FFPE等不同程度降解的低质量样本的转录组构建，提高了样本的利用率，因此具有广泛的应用前景。[0057]2、本发明的设计方案，采用特制引物结合polyT引物的近线性扩增方式，更全面的覆盖整个转录组，包括带polyA的RNA、降解的不带polyA的RNA、lncRNA、miRNA，获得多样性文库，更均匀的覆盖转录组并减少偏向性。相对于目前市场上试剂盒多是利用polyA进行扩增，只适用于质量较好的样本；同时定向针对具有polyA尾的RNA进行富集，减少了文库的多样性。本发明采用polyT引物富集含有polyA尾的RNA，同时加入特制引物富集降解的或其他不带polyA尾的RNA，从而尽可能全面地收集整个转录组信息，不限于带有polyA尾的RNA。因此本申请提供的设计方案步骤更简单、效果更精准、方法重复性好、文库污染小、成本较低、时间周期较短、应用更广泛。[0058]3、本发明的设计方案，通过后续的“无用DNA”的去除方案，即采用单链消化的方式可特异性地去除包括rRNA反转后获得的“无用DNA”，包括真核生物rRNA、线粒体RNA、原核生物rRNA、重复序列如ALU序列、STR、串联重复序列等反转获得的cDNA，大大降低测序成本，节约数据分析时间，因此本申请提供的设计方案更方便简洁、成本更低。[0059]4、本发明的设计方案，在加尾的时候加入ddCTP，可以防止加尾过长而造成数据的浪费。

[0060]5、本发明的设计方案，在加尾的时候加入dNTPs，可以增加多聚C尾的多样性，可以更好的和指数扩增引物结合。

附图说明

[0061]图1是单链消化“无用DNA”的流程示意图

[0062]图2是一个较佳实施例的扩增cDNA目标序列的初步鉴定图[0063]图3是一个较佳实施例的cDNA大小鉴定图

[00]图4是一个较佳实施例的样品基因5端到3端的平均覆盖度图[0065]图5是一个较佳实施例的不同类型的转录组的覆盖情况图[0066]图6是一个实施例样本以rRNA为例去除无用DNA的前后对比图

具体实施方式

[0067]下面结合具体实施例，进一步阐述本发明。应理解，实施方式只是为了举例说明本发明，而非以任何方式发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件或按照制造厂商所建议的条件。[0068]除非另行定义，文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外，任何与所记载内容相似或均等的方法及材料皆可应用于本发明方法中。文中所述的较佳实施方法与材料仅作示范之用。[0069]实验步骤[0070]步骤一、细胞裂解

[0071]采用以下表1裂解液裂解细胞：[0072]表1

CN 108193283 A[0073]

说　明　书

7/16页

试剂体积(μl)0.1％Triton-X in DEPC H2O20.2M DTT0.5Rnase OUT0.5混合引物(第一引物(10μM),第二引物(10μM),第三引物(10μM))1dNTPs1DEPC水3细胞1Dnase I1总体积10[0074]将样品与细胞裂解液充分混匀，72℃裂解5到10min,迅速转移到冰上冷却。[0075]若采用已获得的微量RNA，则无需进行细胞裂解的步骤，直接进行逆转录的操作。[0076]第一引物：5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNN TTTTTTTTTTTTTTTTT3’[0077]第二引物：5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNN GGG3’[0078]第三引物：5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNNTTT3’[0079]第一引物的序列如SEQ ID NO：1所示，具体为：[0080]5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNN TTTTTTTTTTTTTTTTT3’，下划线部分NNNN为随机引物，长度推荐但不限于4-20nt，优选地为4-12nt，更优选地为4-8nt；随后的polyT序列(TTTTTTTTTTTTTTTTT为polyT序列)长度推荐但不限于10-50nt，优选地为,12-30nt，更优选地为15-25nt。

[0081]第二引物的序列如SEQ ID NO：2所示，具体为：[0082]5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNNGGG3’，下划线部分NNNN为随机引物，长度推荐但不限于4-20nt，优选地为4-12nt，更优选地为4-8nt；GGG为斜体部分序列。[0083]第三引物的序列如SEQ ID NO：3所示，具体为：[0084]5’GAGTGAGTAGGAAGTGGATGAGAGGTGNNNNTTT3’，下划线部分NNNN为随机引物，长度推荐但不限于4-20nt，优选地为4-12nt，更优选地为4-8nt；GGG为斜体部分序列。[0085]第二引物和第三引物的斜体部分序列GGG与TTT对可删除，也可以被下列碱基对替代：GGG与AAA对；CCC与TTT对；CCC与AAA对，斜体部分的引物对长度推荐但不限于3nt。此共同序列部分可以减少引物二聚体形成，优选地加入斜体部分的序列。[0086]在裂解反应体系同也可加入脱氧核糖核酸酶进行DNA的消化，优选地为加入DNase I。

[0087]Rnase OUT也可以由其它具有同等功效的RNA酶抑制剂所替代。[0088]本发明设计方案，在进行细胞裂解步骤中，将扩增引物直接加入细胞裂解液中，从而减少操作步骤，避免污染；同时在微量起始情况下，尽可能减小反应体系，增加有效浓度，从而实现更好的扩增，即裂解体系加酶后可直接用于后续的扩增体系，实现单细胞操作一管式反应。

[00]需要指出，本步骤中样本转录组RNA可由单细胞样本裂解获得或由多细胞样本裂解获得，也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细

CN 108193283 A

说　明　书

8/16页

胞样本抽提获得的样本转录组RNA。[0090]步骤二、逆转录

[0091]配置以下表2中的逆转录试剂[0092]表2

[0093]

试剂体积(μl)5X FS buffer1.50.2M DTT0.5Rnase OUT0.3Superscript II0.3无核酸水2.4总体积5μl[0094]将裂解产物与逆转录试剂充分混匀，按照以下表3进行逆转录反应[0095]表3

[0096]

[0097]

需要指出，本步骤中所采用的逆转录酶也可以是其他具有相同功效的酶，如

Superscript III、Superscript IV。[0098]步骤三、多余引物的消化

[0099]将完成逆转录的反应液50℃加入1min后，加入0.5μl的Exonuclease I或T4DNA polymerase，按以下表4方案消化多余的引物。[0100]表4

[0101]

温度37℃75℃4℃

[0102][0103]

时间循环数30min120min1forever1

步骤四、消化RNA模板

完成引物消化的反应液中加入1μL的RnaseH，轻弹混匀，按以下表5进行RNA模板的

消化。

CN 108193283 A[0104][0105]

说　明　书

9/16页

表5

时间循环数30min120min1forever1

[0106]需要说明，步骤三、步骤四是本发明设计方案的优选步骤而非必选步骤，通过消化多余引物以及RNA模板可以减少由于引物扩增而产生的非特异性产物，从而降低由于非特异性产物可能造成测序数据的浪费及比对效率的降低及扩增的偏向性；但RNA模板或多余引物的存在本身并不影响最终单细胞转录组的建库。[0107]步骤五、cDNA的3’端加尾或单链连接加入接头

[0108]按以下表6配置混合液后加入到完成引物消化的反应液中。[0109]表6

[0110]

温度37℃72℃4℃

试剂体积(μl)10X TdT buffer0.5100mM dCTP0.5TdT terminal transferase0.5Rnase-free H2O3.4总体积5[0111]在混合液中优选地可加入ddCTP以防止加尾过长，优选地ddCTP与dCTP的浓度为1:50-1:1000，更优选地为1:100-1:500，更优选地为1:200-1:400。[0112]在混合液中优选地可加如dNTPs以增加PCR扩增效率，优选地dCTP与dNTPs的浓度为1:1-1:200，更优选地为1:10-1:60，更优选地为1:20-1:40。[0113]按以下表7进行加C尾反应[0114]表7

[0115]

时间循环数30min120min1forever1

[0116]需要指出，为进行cDNA扩增，本步骤中不限于采用上述步骤五中的加polyC的方式进行加尾后扩增，也可以采用单链连接方式加入接头，也可以不加入ddCTP和dNTPs。[0117]步骤六、cDNA二链合成及扩增

[0118]按以下表8配置cDNA二链合成所需的反应液：[0119]表8

[0120]

温度37℃72℃4℃

试剂10X Thermopol buffer

体积

2μL

CN 108193283 A

说　明　书

10/16页

dNTPs(10mM each)1μL第四引物(10μM)0.5μL无核酸水14.5μL总体积18μl[0121]将二链反应液加入到21.5μl的完成加C尾的样本中，75℃ 3min，50℃暂放1min,加入扩增酶0.5μl的Deepvent exo-，充分混匀，按以下表9进行二链扩增反应[0122]表9

[0123]

第四引物的序列如SEQ ID NO：4所示，具体为：

[0125]5’GAGTAGGAAGTGGATGAGAGGTGNNNNNGG3’，下划线部分为NNNNN随机引物，长度推荐但不限于4-20nt，优选地为4-12nt，更优选地为4-8nt；斜体部分为G的连续序列，长度推荐但不限于0-30nt，优选地为2-20nt，更优选地为3-10nt。

[0126]其中扩增酶也可以有其他具有相似功效的聚合酶替代如vent DNA聚合酶、T7DNA聚合酶、Bsu DNA聚合酶，大片段、T4DNA聚合酶、DNA聚合酶I，(Klenow)大片段、DNA聚合酶I(E.coli)、TherminatorNA聚合酶、Sulfolobus DNA聚合酶IV、phi29DNA聚合酶、Bst2.0

DNA聚合酶、Bst 2.0DNA聚合酶、Bst DNA聚合酶，全长、Bst DNA聚合酶、Deep VentRNA聚合酶、VentR(exo–)DNA聚合酶、聚合酶、

热启动Taq DNA聚合酶、

缓冲液)、

DNA聚合酶、

热启动Taq DNA

Taq DNA聚合酶、热启动Taq DNA聚热启动DNA聚合酶、超保真DNA聚合酶、

DNA聚合

[0124]

合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶(提供不含镁离子的ThermoPol II缓冲液)、Taq DNA聚合酶(提供酶、聚合酶、

热启动Flex DNA聚合酶、

热启动超保真DNA

超保真DNA聚合酶、KAPA HiFi Uracil+ReadyMix(2x)、PfuTurbo Cx热启动DNA

聚合酶等一种或几种酶的组合。

[0127]步骤七、指数扩增

[0128]按照以下表10配置指数扩增所需的试剂[0129]表10

[0130]

试剂

二链扩增完毕的产物10X Thermopol Buffer第五引物(10μM)dNTPs(10mM)Deepvent exo-DNA polymerase

体积(μl)

408222

CN 108193283 A

说　明　书

46100μl

11/16页

无核酸水

总体积

[0131]按照以下表11进行PCR反应[0132]表11

[0133]

具体循环数可根据产量进行调整。

[0135]第五引物的序列如SEQ ID NO：5所示，具体为：[0136]5’GAGTAGGAAGTGGATGAGAGGTG 3’，所述第五引物的序列也可以是列举序列的反向互补序列，及该序列或其反向互补序列的一部分，优选地为该全长序列。[0137]需要指出，本步骤中指数扩增的时候，可以采用其他酶扩体系进行，如vent DNA聚合酶、T7DNA聚合酶、Bsu DNA聚合酶，大片段、T4DNA聚合酶、DNA聚合酶I，(Klenow)大片段、DNA聚合酶I(E.coli)、TherminatorNA聚合酶、Sulfolobus DNA聚合酶IV、phi29DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0DNA聚合酶、Bst DNA聚合酶，全长、Bst DNA聚合酶、Deep VentRNA聚合酶、VentR(exo–)DNA聚合酶、启动Taq DNA聚合酶、动DNA聚合酶、DNA聚合酶、

热启动Taq DNA聚合酶、

DNA聚合酶、

热启动超保真DNA聚合酶、

DNA聚合酶、

热热启超保真

Taq DNA聚合酶、热启

[0134]

动Taq DNA聚合酶、TaqDNA聚合酶大片段、Taq DNA聚合酶、Taq DNA聚合酶、

热启动Flex DNA聚合酶、

超保真DNA聚合酶、KAPA HiFi Uracil+

ReadyMix(2x)、PfuTurbo Cx热启动DNA聚合酶等一种或几种酶的组合。。[0138]步骤八、“无用DNA”的去除[0139]1、根据数据库(GenBank、EMBL、DDBJ)上的序列信息，针对需要去除的目标序列(如5S rRNA、5.8S rRNA、18S rRNA、28S rRNA、26S rRNA、23S rRNA、16S rRNA、12S rRNA、tRNA、线粒体RNA、GAPDH、Actin)设计与目标序列互补的引物，形成针对转录后的cDNA的“无用DNA”的探针捕获库。其中所需的探针库可以通过直接合成获得，也可以通过PCR扩增或体外转录等本领域人员熟知的方法获得。

[0140]本发明中通过扩增或合成获得的“无用DNA”的互补序列可以和“无用DNA”结合，使其不能形成完整的双链结构，即形成非闭合结构单链DNA，采用核酸外切酶(核酸外切酶T、RecJf核酸外切酶、核酸外切酶VII、核酸外切酶I中的一种或几种的组合)消化非闭合结构单链DNA而使其在后续的接头扩增中无法扩增、在测序中无接头序列而不能形成有效的cluster而不能被测序，达到去除“无用DNA”的目的。[0141]2、若探针由扩增获得则取1μg-20μg的扩增产物，超声打断至20-100bp，体积为65μ

CN 108193283 A

说　明　书

12/16页

l。若由合成获得，则通常不需要进行打断处理。按下表12配置实验体系：[0142]表12

[0143]

试剂样本DNA探针

接头引物KAPA HiFi Fidelity Buffer(5x)KAPA HiFi Hotstart polymerase(1U/μl)无菌水总体积

[0144]反应条件如下表13：[0145]表13

[0146]

用量

200ng-10μg1μg-20μg10μM16μl1ul

补齐至80μl80μl

时间循环数

10min150s150s150s150s150s150s150s15min1forevre1

[0147]向反应物中加入2μl的Exonuclease I,10μl的Exonuclease I Reaction Buffer，8μl的无菌水，37℃反应30min-2h，75℃失活。[0148]利用1X的Ampure XP磁珠纯化消化完毕的DNA，洗脱至30μl的无菌水中。[0149]需要说明的是样本DNA可以是cDNA也可以是建库完成的转录组样本，相应的使用的接头引物也有所改变，所用引物可以是所示的全长引物，也可以是所示引物的部分序列：[0150]a.若使用的为步骤七中的cDNA,，则相应的接头引物为SEQ ID NO：5所示，具体为：5’GAGTAGGAAGTGGATGAGAGGTG 3’[0151]b.若使用的为扩增完成的转录组文库，则相应的接头引物为文库构建使用的接头引物。在本实施例中采用的接头引物为与illumina测序平台匹配的序列，SEQ ID NO：6所示，具体为：5’AATGATACGGCGACCACCGA 3’；SEQ ID NO：7所示，具体为：5’CAAGCAGAAGACGGCATACGA 3’。

[0152]通常样本的使用量大于200ng，相对应的探针浓度为样本浓度的5-20倍为佳，优选地为5-15倍，更优选地为8-12倍。

[0153]反应条件可以如上述实施例所示，也可以采用本领域技术人员熟知的方案进行，

温度95℃10℃20℃30℃40℃50℃60℃70℃72℃4℃

CN 108193283 A

说　明　书

13/16页

满足完全变性DNA样本后，缓慢退火使探针和目的序列充分退火。[0154]KAPA HiFi Hotstart polymerase可以被其他具有相似功效的聚合酶所取代，需要指出的是所使用的聚合酶没有链置换活性，如T7DNA聚合酶、T4DNA聚合酶、启动Taq DNA聚合酶、动DNA聚合酶、聚合酶、

热启动Taq DNA聚合酶、

DNA聚合酶、

动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶、Taq DNA聚合酶、

热启动Flex DNA聚合酶、

热启动超保真DNA聚合酶、

热热启超保真DNA

Taq DNA聚合酶、热启

超保真DNA聚合酶、KAPA HiFi Uracil+

ReadyMix(2x)、PfuTurbo Cx热启动DNA聚合酶等一种或几种酶的组合。[0155]步骤九、cDNA的扩增[0156]对于“无用DNA”去除完毕的样本可选的按照以下表14配置扩增试剂：[0157]表14

[0158]

[0159]

第五引物的序列如SEQ ID NO：5所示，具体为：

[0161]5’GAGTAGGAAGTGGATGAGAGGTG 3’，所述第五引物的序列也可以是列举序列的反向互补序列，及该序列或其反向互补序列的一部分，优选地为该全长序列。[0162]KAPA HiFi Hotstart polymerase可以被其他具有相似功效的聚合酶所取代，如vent DNA聚合酶、T7 DNA聚合酶、Bsu DNA聚合酶，大片段、T4 DNA聚合酶、DNA聚合酶I，(Klenow)大片段、DNA聚合酶I(E.coli)、TherminatorNA聚合酶、Sulfolobus DNA聚合酶IV、phi29DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0DNA聚合酶、Bst DNA聚合酶，全长、Bst DNA聚合酶，Deep VentR(exo–)DNA聚合酶、Deep VentRNA聚合酶、VentR(exo–)

[0160]

DNA聚合酶、DNA 聚合酶、

DNA聚合酶、热启动Taq DNA聚合酶、

热启动DNA聚合酶、超保真DNA聚合酶、

热启动Taq DNA聚合酶、

Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、

热启动超保真DNA聚合

Taq DNA聚合酶、Taq DNA聚合酶、

热启动Flex DNA聚合酶、

酶、超保真DNA聚合酶、KAPA HiFi Uracil+ReadyMix(2x)、PfuTurbo Cx热启动DNA聚合酶等一种或几种酶的组合。

[0163]按照以下表15进行PCR反应

CN 108193283 A[01]

说　明　书

14/16页

表15

[0165]

扩增完成的产物利用1X的Ampure XP磁珠进行纯化，具体步骤如下：

[0167]1.AMPure XP beads在室温平衡30min以上。[0168]2.将50μl平衡后的AMPure XP beads于100ul样品用吹打混匀。[0169]3.在室温孵育10min。

[0170]4.将样品转移到磁力架上，带样品澄清后弃去上清。[0171]5.用200μl 80％(vol/vol)的乙醇，清洗beads。[0172]6.弃去乙醇。

[0173]7.重复洗涤一次。[0174]8.室温开盖等待，至乙醇充分挥发。[0175]9.加入20-100μl的无菌水进行洗脱。[0176]需要指出，本步骤中的扩增为指数扩增，扩增的次数可以自由选定，同时也可以不进行该指数扩增步骤，而直接进行后续操作。[0177]步骤十、构建二代测序文库[0178]利用相关建库试剂盒如illumina公司的SureSelect建库试剂盒或其他方式等进行文库构建，具体操作步骤按说明书进行。[0179]可以先进行“无用DNA”的去除后进行文库的构建，也可以先构建文库后进行“无用DNA”的去除，在本方案中，次序不限。[0180]需要指出，本发明的设计方案主要是由总RNA的获得、逆转录、cDNA二链扩增、指数扩增、“无用DNA”的去除、文库构建六部分构成，操作方式不局限于上述事例展示的方法，在总RNA的获得、逆转录、cDNA二链扩增、指数扩增、文库构建五个具体步骤的分别操作过程中可采用其他的方式，整体作用不变，“无用DNA”的去除和文库构建可有顺序上的变动。[0181]取构建文库之后的样品1ug,平均分成2份，每份500ng.第一份不做任何处理，成为去除前的样本，直接测序，并分析核糖体RNA、编码基因、其他类型的RNA经过反转后最后在样本中占的比例。另一份500ng的样品，通过所述的“用cDNA”无的去除方案，进行以rRNA反转出的cDNA为目标的“无用DNA”的去除，成为去除后的样本，并和去除前的样品进行相同的测序与分析。

[0182]结果及分析

[0183]经过实施例中步骤七通常获得的cDNA的产量，具体请见表1。表14中所示为20个指数循环的产量，从表16可知阴对产量远低于样品产量，样品产量可通过指数循环数控制。

[0166]

CN 108193283 A[0184][0185]

说　明　书

15/16页

表16样品cDNA扩增产量表

关于扩增效果，本实验采用qPCR技术来鉴定扩增是否成功，具体请见图2。图2所示

为用actin对扩增的cDNA进行初步鉴定，M为DNA大小指示剂，1为Sample3，2为Sample4，3为Sample5，4为Sample6，5为阳性对照。如图1所示，所有样品均与阳对相同，能扩增出目的条带，证明扩增结果良好。

[0187]关于扩增所得cDNA大小，本实验采用Agilent High Sensitivity DNA Kit 210来0鉴定所得cDNA的大小，具体请见图3。如图3所示，鉴定所得cDNA的大小，片段分布基本为200bp-2000bp之间。

[0188]关于扩增所得所有基因覆盖情况，具体请见图4。如图4所示，图4所示为sample3到sample6这四个样品对于基因5端到3端的平均覆盖度。横坐标为每个转录本归一化后长度的相对位置，0表示基因的5’端，100表示基因的3’端；纵坐标为比对到所有基因的横轴位置上相应区间内的序列条数的总和；阴影表示4个数据的标准差。图3中体现了所有基因覆盖情况的叠加结果，曲线中每个点的纵坐标表示所有基因在该相对比例位置上所有序列的数量；曲线反映了测序所得序列是否在基因上均匀分布。如果在靠近左端有明显的峰值，说明测序结果有明显的5’偏向性。如果在靠近右端有明显的峰值，说明测序结果有明显的3’偏向性。本图左右两端未有明显峰值，说明测序结果不具有偏向性，结果较均一。[01]关于测序的数据质量，具体请见表17。如表17所示，表15所示为测序的数据质量。序列数(条)：通过iliiumina的X 10测序所获得的总共的reads数；Q20％：Phred数值大于20的碱基占总体碱基的百分比；Q30％：Phred数值大于30的碱基占总体碱基的百分比；GC％：数据中C碱基和G碱基占A,T,C,G四种碱基的百分比。[0190]表17测序数据质量表

[0186][0191]

样本名称Sample3Sample4Sample5Sample6样品来源

1个SW480活细胞1个SW40活细胞3个SW480活细胞3个SW480活细胞序列数(条)438061236328444147073069070708

Q20％95.95.9495.2797.42Q30％91.92.0591.1394.21GC％45.0145.4145.6349.41

CN 108193283 A[0192]

说　明　书

16/16页

关于不同类型的转录组的覆盖情况，具体请见图5。如图5所示，图5所示为对不同

类型的转录组的覆盖情况。Protein coding RNA指代基因编码RNA；lnc RNA为非编码RNA；mi RNA为micro RNA。所示数字为对应类型RNA检测到的数量。从图5中可以知道本申请的方案除了对于编码RNA的覆盖度佳，对非编码RNA也有良好的覆盖。[0193]关于无用DNA去除前后，核糖体RNA、编码基因、其他类型的RNA对比情况，具体请见图6。从图6中可以看出，去除无用DNA后，核糖体RNA占比量明显降低，编码基因占比量明显增多。

[0194]以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

CN 108193283 A

序　列　表

序列表<110> 上海美吉生物医药科技有限公司<120> 一种单细胞转录组文库建立方法及其应用<160> 5<170> SIPOSequenceListing 1.0<210> 1<211> 48<212> DNA<213> 人工序列(Artificial Sequence)<400> 1gagtgagtag gaagtggatg agaggtgnnn nttttttttt tttttttt <210> 2<211> 34<212> DNA<213> 人工序列(Artificial Sequence)<400> 2gagtgagtag gaagtggatg agaggtgnnn nggg <210> 3<211> 34<212> DNA<213> 人工序列(Artificial Sequence)<400> 3gagtgagtag gaagtggatg agaggtgnnn nttt <210> 4<211> 31<212> DNA<213> 人工序列(Artificial Sequence)<400> 4gagtaggaag tggatgagag gtgnnnnngg g <210> 5<211> 23<212> DNA<213> 人工序列(Artificial Sequence)<400> 5gagtaggaag tggatgagag gtg 20

1/1页

4834343123

CN 108193283 A

说　明　书　附　图

1/3页

图1

图2

CN 108193283 A

说　明　书　附　图

2/3页

图3

图4

CN 108193283 A

说　明　书　附　图

3/3页

图5

图6

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文