深度长文:为什么CRISPR必须拿诺奖?(上)

来源: 医药魔方数据/iyiyaomofang
Jerry发呆

德国药物化学博士在读,关注新药研发领域


I


2011年春天,加州大学伯克利分校的Jennifer Doudna(詹妮弗·杜德纳)教授前往波多黎各参加当年的美国微生物学会年会。会议第二天下午她与好友John van der Oost 一起去一家咖啡厅喝咖啡,而正是在那里她遇见了一位穿着时尚的女科学家Emmanuelle Charpentier (艾曼纽·卡彭特)。詹妮弗大概怎么也不会想到,正是这一次相逢,改变了她的整个职业生涯。

 

詹妮弗第一次听到CRISPR这个词是2006年的时候。在与Jill Banfield教授的一次商议学术合作的通话中,Jennifer 听到一个发音类似Crisper的东西,Jill并没有解释这个词的含义,甚至连这个单词怎么拼写都没提,她只是说想寻求该方面研究合作。Jill说CRISPR与RNAi之间可能存在着某种共性,而Jennifer课题组当时主要的研究领域正是RNAi。Jennifer也非常爽快的答应她下周在学校图书馆旁边的咖啡厅见面商议合作的事宜。

 

当天Jennifer来到那家咖啡厅的时候Jill早已在那里等候。她面前放着一个笔记本和几篇论文。简单的闲聊后她便开始在笔记本上画起了草图。


CRISPR序列  来源: Jennifer Doudna


这串由菱形和正方形构成的区域便是CRISPR了。每一个菱形所代表的区域有着相同的碱基序列,而正方形区域的序列却各不相同。Jennifer立即明白了CRISPR(clustered regularly interspaced short palindromic repeats,常间回文重复序列丛集)的含义。当Jennifer问Jill该序列的功能时Jill回答:不是很清楚。她同时也说道大概有一半的细菌以及几乎所有的古细菌基因组中都会存在该序列。很显然如果该序列如此广泛,它对细菌和古菌正常功能的维持也一定扮演着非常重要的角色。

 

接下来Jill拿出那几篇论文,兴奋地为Jennifer总结这几篇论文所完成的工作。2005年三个独立课题组均发现CRISPR重复序列间的间隔序列与某些噬菌体的DNA片段完全匹配,而且CRISPR中与噬菌体DNA片段匹配的数量越多,细菌受噬菌体感染的风险也就越低。很明显CRISPR可能是细菌和古细菌的免疫系统的重要组分,用以防御噬菌体的侵入。最后,Jill给Jennifer看了Kira Makarova 和 Eugene Koonin等人发表的最新的一篇文章,该文章也提出了CRISPR的适应性免疫功能的假设。

 

很长一段时间内,Jennifer一直从事RNAi功能的研究,而现在看来CRISPR有着与RNAi相似的功能。对于Jennifer来说,CRISPR这一研究课题的诱惑力实在是太大了。并且她认为当时的时点对于她来说也非常有利:虽然已经有人提出了关于CRISPR功能的理论,但并没有人能够完全验证并且解析完整的作用机制,而她作为资深的分子生物学家做这方面的工作自然是得心应手。

 

但Jennifer一时却难以找到合适的人来做这方面的研究。Blake Wiedenheft的适时出现解决了她的难题。当时Blake正申请前往Jennifer课题组做博士后研究工作。当Jennifer问及他感兴趣的研究方向时,Blacke回了一句:你听说过CRISPR么?大概没有比Blake更合适的人选了吧。


于是Jennifer组的CRISPR项目就这样开始了。在Blake刚加入新实验室不久时,丹麦的生物公司Danisco就已经验证了CRISPR的功能正是细菌的特异性免疫。随即Stan Brouns等人报到了RNA在CRISPR系统中的关键作用:CRISPR会先整体转录为RNA,再由酶剪切为具有单个重复序列/间隔序列的小片段,再与病毒DNA结合。而西北大学的Erik Sontheimer也发现了CRISPR RNA能够通过DNA-RNA配对来诱导DNA降解。

 

Blake和Jennifer在为这些新发现感到兴奋的同时,也认识到仍有太多的基础问题尚未解决。首先他们需要解析病毒DNA整合进入CRISPR序列以及CRISPR转录及RNA片段剪切的过程,其次他们也需要解析CRISPR RNA诱导病毒DNA降解的过程。于是他们将目光扩大到了CRISPR相关基因cas。


 Cas基因 来源:Jennifer Doudna


cas基因的发现对于理解CRISPR功能具有重要贡献。2002年Jansen首次在公开发表的文章中使用CRISPR这一名词,通过生物信息学计算分析了CRISPR序列的特征并鉴定了4个CRISPR相关基因(CRISPR associated system, cas) cas 1-4。cas基因全都与CRISPR基因位点相邻,提示两者可能存在功能上的相关性。而且Cas蛋白同时具有螺旋酶和核酸酶结构域,表明他们可能参与DNA代谢以及基因调控过程。

 

为了研究Cas蛋白的功能,Blake首先通过基因工程技术获得了大量Cas1蛋白。在得到Cas1蛋白之后他通过一系列的实验揭示了该蛋白的功能,发现Cas1蛋白能够剪切DNA片段以使病毒DNA序列能够嵌入到CRISPR序列中。此时,Rachel Haurwitz也加入了该项研究,并参与了Cas 6的研究,确定了Cas 6的功能为剪切已转录的长链CRISPR RNA。之后他们解析了越来越多的Cas蛋白功能,但这些蛋白与Cas1或Cas6的蛋白功能都非常相似。

 

到了2011年,组内的多位老成员也加入了CRISPR战队。此时Blake和Jennifer的兴趣已经逐渐由剪切CRISPR DNA/RNA的Cas蛋白转向了剪切病毒DNA序列的Cas蛋白。他们与John组的合作研究却发现剪切病毒DNA的过程极其复杂,需要多个Cas蛋白来靶向和剪切病毒DNA:首先CRISPR RNA会与大约10个Cas蛋白形成能够靶向需要剪切的病毒DNA序列的复合体,紧接着Cas3会剪切目标DNA序列。之后Jennifer又与其他组合作解析出了识别剪切序列复合体的结构,并确定了碱基配对在识别过程中的重要作用。而立陶宛的一个实验室也确定了Cas3蛋白的剪切方式:Cas3并不是一次剪切完成,而是将其剪切为数百个DNA片段。

 

随着研究的深入,科研人员也逐渐认识到CRISPR系统的极高的多样性。一般而言CRISPR系统被分为两大类,六个组,19个亚组。而2011年之前Jennifer组的研究只集中于第一类,对于第二类CRISPR如何剪切DNA的,她却知之甚少。此时的她进入了研究的瓶颈期。


II


2011年初,Jennifer在美国微生物学会年会上遇见了Emmanuelle Charpentier。当John向她介绍Emma时,她立即想起了她的学生提到的Emma在瓦赫宁根的会议上关于tracrRNA的精彩报告。Emma从2000年初就一直对CRISPR很感兴趣,她通过与马普所的JörgVogel合作对化脓性链球菌内的小RNA进行测序,并发现该细菌内tracrRNA的含量异常丰富。通过生物信息学分析他们预计编码该RNA的基因序列与CRISPR位点临近,并推测其可能影响CRISPR的功能。之后的一系列实验表明该系统具有三个组分:CRISPRRNA,Csn1蛋白,以及tracrRNA。


左:JenniferDoudna;右:Emmanuelle Charpentier 



然而该系统的作用机制她却并不清楚,与Jennifer合作会是她比较明智的选择。Jennifer对这次合作感到非常兴奋,此前她并没有涉足过第二类CRISPR系统的研究,而这次的合作为她的工作提供了新的方向。她迅速指定组里的博后Martin Jinek,以及来自德国的硕士交换生Michael Hauer作为参与者,Emma组的博士生Krzysztof Chylinski也加入了该研究项目。

 

其实在第一次与Emma交谈的过程中Jennifer就已经意识到Csn1的重要作用。Csn1蛋白就是后来为人们熟知的Cas9。早在2007年Rodolphe和 Philippe等人就报道了Cas9能够抵御嗜热链球菌的病毒感染,Josiane 和 Sylvain等人的工作也发现Cas9蛋白失活会影响病毒DNA的剪切过程。Emma的课题组则发现cas9基因突变会影响CRISPRRNA的生成,并导致整个免疫过程受损。Virginijus Siksnys等人的研究更进一步,他们发现Cas9是嗜热链球菌的CRISPR系统中唯一起重要作用的Cas蛋白。越来越多的证据显示Cas9在第二类CRISPR系统中病毒DNA剪切过程中具有非常重要作用。

 

然而如何解析该CRISPR体系的作用机制呢?很明显,第一步是弄清楚Cas9的功能,与之前的工作类似,首先要做的是Cas9蛋白的提取和纯化工作。Krzysztof把含有cas9基因的人工染色体寄给了Jennifer组,由她们组来完成该项任务。由于Martin此时正忙于寻找教职,他只能指导Michael完成蛋白的纯化。但当Michael将Cas9,CRISPRRNA以及相应的病毒DNA混合之后,他却发现Cas9无法剪切病毒DNA,而此时Michael在该实验室交流的期限也到了,他只得悻悻的回到德国准备毕业。

 

在Michael回国前夕,Martin终于在苏黎世大学顺利找到了教职并接替了Michael。他与Krzysztof顺利找到了Michael实验失败的原因:tracrRNA的缺失。经过夜以继日的工作,Cas9剪切过程的全貌逐渐浮出水面:首先Cas9需要结合到病毒DNA上,并打开DNA的双链使CRISPRRNA能与DNA的一条单链进行碱基配对,配对成功则会诱导Cas9的两个核酸酶功能模块同时剪切两条DNA单链,使DNA断裂。随着CRISPR RNA的变换,该系统几乎可以剪切所有能够与CRISPRRNA配对的病毒DNA序列。

 

那么Cas9能不能剪切除病毒DNA序列外的其他DNA序列呢?如果可以的话CRISPR将可能成为新的基因编辑工具。基因编辑领域拥有广阔的应用前景,但现有的基于TALE和锌指蛋白的核酸酶有着严重的局限性。主要的问题在于蛋白与DNA序列的配对效率太过。而Cas9蛋白剪切只需要CRISPRRNA和病毒DNA序列的配对就能完成剪切,如果Cas9能够作为基因编辑工具剪切其他类型的DNA序列,那么Cas9将会给基因编辑领域带来革命性的变革。

 

为了简化基因编辑系统,Martin将CRISPR RNA与TracrRNA连接形成一条嵌合RNA链。接下来为了验证该系统的剪切病毒DNA之外的能力,他选择了绿色荧光蛋白(GFP)中由20个碱基组成的5个不同序列,并且获得了能够与之配对嵌合RNA。在将RNA与Cas9和GFPDNA混合之后,不出所料,所有的GFP DNA都能在所设定的位点被完美的剪切。

 

2012年6月8日,Jennifer和Emma向科学杂志提交了论文,仅在二十天之后该文章就被接收。纵使她们很清楚这篇文章会对基因编辑领域产生巨大冲击,她们也从不曾料想到CRISPR会掀起如此的惊涛巨浪。


III


Jennifer与Emma的文章为CRISPR作为基因编辑工具的应用奠定了基础,但该文章仅验证了该系统剪切游离GFPDNA的能力,而CRISPR系统能否在细胞内剪切DNA,成了另一个急需验证的问题。于是Martin和Jennifer一刻也不敢停,立即开始了该方向研究。首先Martin将编码Cas9和向导RNA的DNA序列分别转入两个质粒中并将质粒导入细胞,通过转录则能够生成Cas9蛋白和向导RNA,并在细胞内剪切DNA。由于已有研究表明ZFN可以在人胚胎肾细胞系HEK293成功编辑CLTA基因,因此他们选择了同样的基因,同样的细胞,以便对比两种基因编辑方式的优劣。

 

然而早在Jennifer和Emma的文章发表之前,很多人就已经预计到CRISPR的巨大潜力,这其中就包括张锋和Geroge Church。张锋出生于1982年,是哈佛-麻省理工布罗德研究所(Broad Institute of Harvard and M.I.T)最年轻的核心成员。他在斯坦福大学读博士期间就帮助创建了光遗传学工具,对神经科学领域的研究产生了极为深远的影响。毕业之后,他回到了哈佛大学进行基因编辑的研究,并成为了首位使用TALE来控制哺乳动物基因的科学家。

 

2011年一位访问学者去罗德研究所做报告,而报告的主题正是关于细菌中适应性免疫相关的CRISPR。他坐在报告厅的后排,当时他的思绪并没有集中到报告的内容上,但CRISPR这个听起来有点奇怪的名词却激起了他的兴趣。他此前从未听过CRISPR,在上网搜索相关资料的时候他却变得越来越兴奋。听完那场报告之后的几天他就前往迈阿密参加一场学术会议,但他完全没有心思听会议报告,一直窝在酒店房间里浏览CRISPR的相关资料。

 

所幸当时已公开发表的文章并不多。由于之前发现CRISPR能够对抗影响酸奶制造的病毒,所以当时的应用研究大都集中在酸奶制造行业。但张锋却有一个大胆的想法:他希望把CRISPR应用到人类细胞上。虽然继续从事基因编辑工具TALE的研究对他来说失败的风险更小,但很显然张锋不是一个惧怕失败的人。


左:张锋;右:George Church


回所之后张锋把他的想法告诉了他的学生从乐,而从乐立即明白了为什么张锋对CRISPR感到如此兴奋。此前他们使用的TALE需要繁琐的蛋白合成过程,而且经常合成完蛋白之后发现蛋白无法靶向到目标DNA序列。但CRISPR不同,只需要RNA就能够识别目标DNA序列。如果说合成蛋白质是建造一座摩天大厦,RNA的合成就像建造二层小楼那么简单。

 

然而张锋和从乐并没有像Jennifer和Martin一样从细菌开始研究,而是直接用人类和老鼠细胞做实验。如果想为医疗行业带来革新的话,他们必须证明CRISPR在这些细胞中的潜力。两人开始疯狂的工作。当时他们两人的目标有两个:证明CRISPR能够编辑动物细胞基因组,以及编辑之后的基因组能够产生预期的功能。他们同样选择编码GFP蛋白的基因作为基因编辑的对象。如果编辑之后能产生绿色荧光的细胞越少,则会证明CRISPR成功编辑的细胞越多。

 

张锋和从乐当时没有意识到竞争的存在。2012年6月Jennifer和Emma的文章上线,该文章验证了CRISPR剪切游离DNA的能力,证明了CRISPR作为基因编辑工具的潜力。但张锋并没有因为这篇文章的出现而感到沮丧,因为剪切游离DNA与编辑动物细胞内的基因组之间存在着巨大的差别。最后他们在Jennifer文章发表几个月后完成了该课题的工作。2013年1月,张锋组的文章在Science发表。他同样也没有意识到他之前的导师哈佛大学的George Church当时也在做同样的工作。George类似的工作也在同一期Science发表。

 

对于很多科学家而言知识产权的保护与发表文章同等重要。在2012年5月25日Jennifer等人就提交了保护CRISPR技术的专利申请,七个月后的12月12日张锋也提交了专利申请。由于申请了加快审核专利,张锋在2014年4月第一个拿到了专利授权。2016年1月,Jennifer所在的加州大学要求对布罗德研究所的最早专利以及另外11项专利进行专利干涉,从而引发了著名的CRISPR专利大战。最终这场专利之争以布罗德研究所胜出告终。

 

但我想对很多人而言,最重要的不是谁抢先发表文章,谁第一个拿到专利,最终哪几个人拿到诺奖,大多数人关心的是CRISPR技术究竟会为科研,医疗,甚至大众生活带来哪些影响。从某些层面来讲,这正是CRISPR必须拿诺奖的原因。我们将在下半篇中对此进行详细介绍。