科学家通过多种方法探究长链非编码RNA

直到今天,针对lncRNA的简洁且合理的分类系统仍遥不可及。

长链非编码RNA的概念模型 图片来源:Karissa Y. Sanbonmatsu

2013年,一群研究人员决定更加深入地挖掘一种名为H1的人类胚胎干细胞系,并且获得了一些惊喜。H1是最著名的干细胞系之一,但该团队还是成功发现了2000多个此前未被阐明的RNA片段。更重要的是,其中有146个为人类胚胎干细胞所独有,从而为研究多能性——变成体内任何细胞类型的能力——提供了诱人线索。

然而,这些转录并未受到关注,因为它们含有往往会被序列分析器过滤掉的重复性编码片段。

这是一个巨大的盲点。其他实验室曾发现了富含重复性编码并且在人类干细胞中非常重要的RNA存在的初步证据。在主要来自美国加州斯坦福大学的研究人员分析结果时,他们意识到,自己正好找到了此类RNA。团队成员Vittorio Sebastiano介绍说,在一份包含146个RNA序列的清单中,最丰富的3个——被命名为HPAT2、HPAT3和HPAT5——似乎对于建立可发育成人类胚胎的多能细胞是必需的。

这些RNA片段是长链非编码RNA(lncRNA)(至少有200个碱基长并且不会编码蛋白的序列)的例证。lncRNA存在于很多不同种类的组织中,而且经常在细胞内特定位置处被发现。不过,大多数lncRNA缺少得到明确定义的功能,并且直到最近,还被认为仅仅是转录噪音。

随着更多数据大量涌入,这种观点开始发生变化。数据表明,lncRNA被转录的基因组区域在进化中要比此前想象的更加高度保守,而这意味着它们具备一些功能。不过,直到今天,针对lncRNA的简洁且合理的分类系统仍遥不可及。

功能优先

由于lncRNA的清单是如此之长,因此一个关键步骤是决定哪些被优先用于研究。约15年前在研究生阶段发现了lncRNA的John Rinn提议,从那些来自已同疾病联系起来的基因组区域的lncRNA开始。目前,Rinn在麻省理工学院和哈佛大学成立的布罗德研究所内管理一家专注于研究分子的实验室。

另一个想法是研究lncRNA位于哪些地方——比如,找到靠近转录起始点的lncRNA,这意味着它参与了调控附近的基因。目前,研究人员能相对轻松地追踪到细胞内分子的位置。Rinn和来自布罗德研究所以及宾夕法尼亚大学的其他研究人员利用一种名为单分子荧光原位杂交的技术,成功辨别出61个位于皮肤、肺和宫颈肿瘤细胞内的lncRNA分子的位置。

如今,科学家还能利用CRISPR-Cas9和其他基因编辑技术,干扰lncRNA被转录的部分DNA序列或者指挥其转录的启动子,从而测试lncRNA的功能。一些技术使实验室得以迅速筛选出大量lncRNA。当CRISPR-Cas9被用于研究蛋白编码基因的功能时,逻辑是相同的:将单碱基的删除或替换引入DNA,并且观察被改变转录的效果。

斯坦福大学医学院癌症生物学家Howard Chang介绍说,唯一的问题在于,和蛋白相比,lncRNA因微小改变失去能力的可能性更小,而序列改变通常要更加强烈。

这便是RNA研究人员自己制作CRISPR-Cas9的原因所在。他们扩展了CRISPR工具箱,将阻断或启动特定lncRNA转录的方法包括进来。不过,Rinn及其团队开发了另一种方法:一种名为CRISPR-Display的工具。Rinn将其比作在细胞中任何地方都能运送物品——在这种情况下是特定lncRNA——的无人机。如果基因激活中的某项任务受到怀疑,那么它可以通过将lncRNA运送到一个不同的基因组区域并且观察新位点的基因激活而得到测试。

RNA相互作用组

一种完全不同的方法是找到正在同lncRNA发生相互作用的对象。“人们仍然相信,尽管lncRNA很重要,但在没有辅助因素的情况下,最终还是无法执行它们的功能。”RaNA疗法公司共同创始人、马萨诸塞州综合医院分子生物学家Jeannie Lee介绍说,而这些辅助因素几乎总是蛋白。

Lee和其他人已着手利用一种名为Xist的lncRNA揭示其相互作用。研究发现,Xist对于令雌性哺乳动物细胞中的两条X染色体之一失活是必需的,从而阻止雌性拥有很多两倍于雄性的X染色体基因产物。同Xist结合的蛋白通过多种机制令基因表达沉默。不过,去年科学家最终确定了这些“搭档”的身份。如今,研究发现,这些蛋白不仅能吸引令转录沉默的其他分子,还能排斥一些启动转录的分子。

对于探究某个lncRNA的蛋白“搭档”群有很多技术可用:广义地讲,研究人员利用诸如甲醛或紫外线将RNA和蛋白连在一起,然后利用质谱分析法解析谁和谁结合在一起,并且提出了“相互作用组”的概念。通常,这些分析拥有诸多步骤,因此需要科学家作出很多战略性选择。RNA和蛋白应该如何被连在一起?如何将相互作用的真实信号同虚假信号区分开来?笼罩着所有此类研究的是这样一个问题:RNA在试管内的表现通常和在细胞内的表现不同。

这便是为何致力于Xist相互作用研究的科学家聚焦能辨别出同活体细胞内的蛋白结合在一起的RNA的各种技术。最近质谱分析敏感性的改善正在帮助研究人员。去年,Chang的团队将利用甲醛作为连接剂的试验和最新的质谱分析法结合起来,并且发现,Xist在试管内能和81种蛋白结合。

结构中的秘密

探究lncRNA功能的第三种方法是研究它们的结构。虽然该方法不能像预测蛋白的功能那样,直接预言lncRNA的功能,但对RNA的拱起和折叠有更多了解可能会提供一些信息。“这是一个完全开放的领域,需要开展很多工作。”新墨西哥州洛斯阿拉莫斯国家实验室结构生物学家Karissa Sanbonmatsu表示。

建立某个lncRNA二级结构的方法包括化学探测,比如被称为SHAPE的方法。它牵扯到将乙酰基附着到RNA上,并且仅在灵活的区域修改其“支柱”。被修改的地点会阻断“阅读”RNA以创建互补DNA序列的酶,以至于生成的是短的DNA片段而非长链。随后,这些片段能在凝胶上被测序或按大小分类。

2012年,Sanbonmatsu团队最早描述了一种人类lncRNA的二级结构:十几年来一直被认为同雌激素受体存在关联的类固醇受体RNA激活子。

不过,这种结构方法不得不解决RNA在试管内和细胞中表现不同的问题。和结合研究一样,最新技术是在试管内进行的。2012年,一个包括Chang在内的团队描述了能在活体细胞内发挥作用的SHAPE的一个版本,并且从那以后对其进行改善,以同时描绘上千个RNA的结构。

和其他方法一样,结构研究需要大量时间的投入,因此在聚焦最有可能具备功能的lncRNA时,必须作出谨慎的选择。Sanbonmatsu介绍说,幸运的是,研究人员在这种分类上表现得越来越好。她建议在判断功能意义的可能性时,科学家应先从拥有已知表型的lncRNA开始,然后通过化学方法探究它们,以获得二级结构,并且检查它们在多大程度上能在其他物种中被保留下来。

2016-05-18