RNA、转录聚合酶、启动子及载体构建

生物体中的RNA种类繁多,功能复杂,一般按照是否编码蛋白质将其分为编码RNA(coding RNA)和非编码RNA(non-coding RNA, ncRNA)两大类。前者就是指mRNA,后者则包括很多种类,如众所周知的tRNA和rRNA,参与mRNA剪接的snRNA,参与RNA修饰的snoRNA等。

非编码RNA种类很多,按照长度可分为两大类:大于200 nt(核苷酸)的称为长非编码RNA(lncRNA),小于200 nt的称为小非编码RNA(small ncRNA),50 nt以下的还可称为tiny ncRNA,如siRNA、miRNA和piRNA等。

非编码RNA也可以按照表达和功能特性分为管家非编码RNA(housekeeping ncRNA)和调节非编码RNA(regulatory ncRNA)。前者是细胞生存所必需的,所以含量较为恒定,呈组成型表达,也称为组成型ncRNA。后者的表达有明显的时空特异性,通常短暂表达,对转录、翻译等过程起调节作用。

图1. 非编码RNA分类

管家非编码RNA 主要包括tRNA、rRNA、snRNA、snoRNA以及telomerase RNA等。其中核糖体RNA(ribosomal RNA,rRNA)是细胞内含量最多的一类RNA,占RNA总量的82%左右。其生理功能是与蛋白质一起构成核糖体,负责蛋白质的合成。

常见的RNA有:

mRNA:信使RNA,可翻译为蛋白质序列,在蛋白质合成过程中发挥“合成模板”作用。

rRNA:核糖体RNA,核糖体组成部分,在蛋白质合成过程中发挥“合成工厂”作用。

tRNA:转运RNA,可携带氨基酸,在蛋白质合成过程中发挥“运输工具”作用。

hnRNA(heterogeneous nuclear RNA, hnRNA):核内最初转录生成的RNA。

Ribozyme:核酶,具有催化功能的RNA,可催化RNA的剪切。

Genome RNA:类似DNA,具有遗传信息功能的RNA,如某些RNA病毒以RNA作为遗传物质。

gRNA(Guide RNA):指导RNA,指导RNA剪辑。

tmRNA:兼具tRNA及mRNA功能的RNA。

scRNA(small cytoplasmic RNA):胞质小RNA分子,如信号识别颗粒7sRNA。

snRNA(small nuclear RNA):RNA剪辑体组分,参与RNA的剪辑。

snoRNA(small nucleolar RNA):核仁小RNA,在核仁内参与rRNA的加工。

lncRNA(long non-coding RNA):长非编码RNA,广泛参与体内DNA、RNA、蛋白的调控。

lincRNA(large intergenic non-coding RNA):基因间长非编码RNA,属lncRNA的一种。

circRNA(circle RNA):环RNA,属lncRNA的一种,一部分由内含子剪切产生,参与基因表达调控。

ceRNA(competing endogenous RNAs):体内竞争性RNA。

miRNA:微小RNA,长度集中在22nt,广泛参与体内的基因表达调控。

stRNA(small temporal RNA):双链小RNA,是miRNA的亚类,参与发育时序调控。 

sRNA(small RNA):包括miRNA、piRNA等,细菌也可产生的长度50-500bp的小RNA分子,参与细菌基因的表达调控。

piRNA(Piwi-interactingRNA):哺乳动物精细胞发现的长度约30nt的小RNA,参与生殖细胞的生长发育。

aRNA(anti-sense RNA):反义RNA,调控基因的表达。

eRNA(enhancer RNA):增强子转录出的RNA,功能未知。

siRNA(small interfering RNA):人为设计的干扰基因表达的外源RNA。

shRNA(short hairpin RNA):一般用于构建载体表达siRNA。


RNA的种类很多,看着也非常晕,实际科研的过程中搞清楚几个常用的应用场景中就不至于迷失方向。

需要过表达重组蛋白

这时候我们需要DNA转录出mRNA,然后再翻译出蛋白质。mRNA在真核细胞中由Pol II转录,经过转录后加工会在RNA的5’加上帽子,3’加上Poly(A)等。6个哺乳细胞常用的组成型启动子有:simian virus 40 early promoter (SV40), cytomegalovirus immediate-early promoter (CMV), human Ubiquitin C promoter (UBC), human elongation factor 1α promoter (EF1A), mouse phosphoglycerate kinase 1 promoter (PGK), and chicken β-Actin promoter coupled with CMV early enhancer (CAGG)。所以常见的哺乳细胞蛋白表达载体上一般都会有上述启动子,同时含有一个加尾信号。值得一提的是,不同启动子在不同细胞系的活性是会有差异的,这也就是为什么在有些细胞系某个启动子不表达,表现出启动子沉默现象。

图2. 不同启动子在不同细胞系中GFP荧光强度

摘自:Qin JY, Zhang L, Clift KL, Hulur I, Xiang AP, Ren BZ, et al. Systematic comparison of constitutive promoters and the doxycycline-inducible promoter. PLoS One. 2010;5(5):e10611

需要过表达长非编码RNA

长非编码RNAs(lncRNAs)已经成为表观遗传、转录和翻译水平上基因表达的重要调节器,并被认为是几种癌症以及神经系统、自身免疫和心血管疾病的关键调节器。LncRNAs长度超过200个核苷酸,几乎没有蛋白质编码潜力,与mRNAs相比,它们通常具有更多的细胞类型特异性表达模式。它们能够在转录水平上调节基因的表达。大多数lncRNAs由RNA聚合酶II(Pol II)转录,并像mRNAs一样被多聚腺苷酸化和5′加帽。从现有的数据库和发表的文献中整理出的lncRNAs知识库表明,有超过268,000个人类lncRNA转录物,而其中只有少数有已知的功能作用。

由于长非编码RNA和mRNA的结构很类似,而且主要有Pol II编码,因此选择载体上基本和过表达重组蛋白的要求类似。

需要过表达小非编码RNA

真核生物的转录是由三种RNA聚合酶(Pol)进行的。Pol I、II和III。这些聚合酶分别含有14、12和17个亚单位,并共享一个10个亚单位的催化核心,但它们合成不同类别的细胞转录物。Pol I转录大的rRNAs;Pol II合成mRNAs、大多数的lncRNAs和大多数小的核RNAs(snRNAs);Pol III独特地转录小的非编码RNAs,包括5S rRNA(1型)、tRNAs(2型)和其他基本RNAs(3型),如U6 snRNA。

3型Pol III启动子,如7SK、U6和H1,可用于表达几乎任何小RNA,包括RNAi应用中的短发夹RNA(shRNA)和CRISPR-Cas9基因组编辑平台中的引导RNA(gRNA)等热门分子。一般来说,Pol III转录本不适合蛋白质翻译,因为它们通常太短,而且一个mRNA在5′端需要一个7-甲基鸟苷(m7G)帽和一个3′多腺苷尾。也有文献报道,这三中启动子也可以招募Pol II从而起始蛋白质(比如荧光素酶)的翻译。

Souce: 纽普生物    2021-10-26