责编
兮
年诺贝尔化学奖授予了EmmanuelleCharpentier和JenniferA.Doudna,以表彰她们发展了基于CRIPSR-Cas9系统的基因编辑工具。但CRISPR-Cas9系统在进行基因编辑的过程中有可能会脱靶产生DNA双键断裂(doublestrandbreak,DSB),从而造成基因组的不稳定。
Broadinstitute的DavidR.Liu教授在年在CRISPR-Cas9系统的基础上通过融合脱氨酶(rAPOBEC)和尿嘧啶糖基化酶抑制剂(UGI)发展了不会产生DNA双键断裂就可以进行基因组特定位点的C-to-T编辑的胞嘧啶碱基编辑器(cytosinebaseeditor,CBE)。由于CBE系统在编辑过程中不产生DNA双链断裂,所以一般认为CBE系统比CRISPR-Cas9系统拥有更高的安全性。但是,在真正将CBE应用到临床进行遗传疾病治疗前,有必要对其安全性与特异性进行评估。
图-1CBE通过产生中间产物脱氧尿嘧啶(dU),实现碱基编辑针对CBE造成的DNA脱靶(off-targets)效应,目前已有的全基因组检测技术包括:(1)基于体外生化孵育后测序的Digenome-seq技术;(2)基于检测Cas9蛋白介导产生DSB的GUIDE-seq,CIRCLE-seq等技术;(3)基于生物信息学序列预测的Cas-OFFinder等软件;(4)基于单细胞、单克隆技术扩增后进行全基因组测序的技术等。然而,依然缺乏灵敏、高效的检测手段,无偏向性地鉴定CBE在体内造成的脱靶位点。
年6月7日,北大-清华生命科学联合中心、北京大学生命科学学院伊成器课题组在NatureMethods杂志发表了题为“Detect-seqrevealsout-of-protospacereditingandtarget-strandeditingbycytosinebaseeditors”的文章。研究人员巧妙地利用了CBE在进行靶向编辑过程中会产生中间产物脱氧尿嘧啶(dU)这一特点,对CBE产生的dU进行生物素(biotin)标记、富集;同时在dU位点的附近,将正常胞嘧啶C替换为d5fC,结合后续的化学标记反应,产生串联C-to-T的信号从而增敏脱靶编辑的检测,开发了名为Detect-seq(dU-detectionenabledbyCtoTtransitionduringsequencing)的CBE脱靶检测技术。
图-2Detect-seq实验流程示意图研究人员首先在人胚肾细胞HEKT和人乳腺癌细胞MCF-7转染BE4max,分别使用4种、2种不同的sgRNA对基因组靶向位点进行C-to-T的编辑;同时对这些样本中进行了Detect-seq检测。通过Detect-seq检测发现,除RNF2位点外,其它靶向位点均可以产生几十至数百个Cas9依赖型的脱靶位点。
图-3在三种不同sgRNA样品中鉴定到的Cas依赖型的脱靶位点。其中蓝色圆圈代表脱靶位点(off-targets),红色方块代表靶向位点(on-target)EMX1n=48,VEGFA_site_2n=,HEK_site_4n=随后,研究人员比较了由Detect-seq鉴定到的脱靶位点与之前研究报道的使用体外生化孵育Digenome-seq方法或基于Cas-OFFinder软件预测的脱靶位点。通过靶向扩增子测序的验证(targetedampliconsequencing),由Detect-seq鉴定的脱靶位点均可以在验证实验中表现出显著高于背景的C-to-T的突变;而仅仅被体外生化孵育Digenome-seq方法或基于Cas-OFFinder软件预测到的脱靶位点,则没有表现出显著高于测序背景的C-to-T的突变。进一步的生物信息学分析则表明,Detect-seq鉴定到的脱靶位点显著富集于活跃转录的基因区、基因启动子区等开放染色质区域,与体外实验和计算机预测结果呈现了鲜明的对比。
图-4Detect-seq技术与体外孵育检测技术Digenome-seq及预测软件Cas-OFFinder相比,鉴定到的位点富集于活跃转录区等染色质开放区域。在Detect-seq之前,领域内常使用检测DNA双链断裂(DNAdoublestrandbreaks,DSBs)的技术(如GUIDE-seq,CIRCLE-seq等)检测由Cas蛋白核酸内切酶切割DNA双链造成的脱靶效应。并以此来替代CBE系统造成的脱靶效应。在文章中,研究人员也比较了Detect-seq与GUIDE-seq在三种sgRNA样品中鉴定到的Cas依赖型脱靶位点。结果发现,除EMX1位点外,剩余两个sgRNA样品中Detect-seq均检测出远多于GUIDE-seq的Cas依赖型脱靶位点。这提示了Cas蛋白的结合活性造成的脱靶与其核酸内切酶造成的脱靶可能不同。
有趣的是,研究人员基于Detect-seq技术还发现了两种新型的Cas依赖型的脱靶编辑:sgRNA结合区域外编辑(out-of-protospaceredit)及靶向链编辑(target-strandedit)。
图-5CBE介导的sgRNA结合区域外编辑与靶向链编辑sgRNA结合区域使用阴影标出,IGV图中红色方块代表正链C-to-T突变,绿色方块代表反链C-to-T突变;图下半部分为该区域靶向扩增子测序结果。sgRNA结合区域外编辑即C-to-T的编辑发生在sgRNA结合区域外;而靶向链编辑则是C-to-T编辑发生在sgRNA与DNA结合链。根据Detect-seq的结果,上述两种编辑普遍存在于Cas依赖型的脱靶位点的结合区域。值得一提的是,虽然RNF2位点未发现Cas依赖型的脱靶,但是在其靶向位点的靶向链发现了显著高于测序背景的C-to-T编辑。根据后续的机器学习计算结果,研究者认为sgRNA5’端错配和PAM附近的错配可能是影响sgRNA结合区域外编辑和靶向链编辑的关键因素。
图-6sgRNA结合区域外编辑与靶向链编辑模式图随后,研究人员发现,除了上述Cas依赖型的脱靶位点,Detect-seq技术也可以在转染BE4max的样品中检测到一些信号明显较弱、删除sgRNA后依然存在,但删除脱氨酶后降低至背景水平的Cas非依赖型脱靶。对于上述位点进行生物信息学分析后发现,该种位点主要发生在TCmotif中的C中,与之前报道的rAPOBEC偏好性相同。
Detect-seq技术为碱基编辑领域内提供了一种能够高灵敏、高特异、无偏好性地检测细胞内的CBE脱靶位点的方法。脱靶效应理解的加深,也将为阐明CBE的催化机制、优化改造更安全的CBE工具带来新的视角与可能。为了便于Detect-seq技术的使用,研究人员还为Detect-seq编写了配套的生物信息学分析软件(代码已上传至Github,详见论文Methods部分)。
原文链接: