乳腺癌长链非编码RNA研究进展
2018-6-21 来源:不详 浏览次数:次闫宁宁,和占强,徐海燕,张凤春
上海交通大医院
上海交通大医院
上海交通大医院
随着人类基因组计划的拓展及后基因组时代的来临,人们对人类基因组结构和功能的认识不断深化。越来越多的非编码RNA(ncRNA)被发现,其中长度>个核苷酸的ncRNA被称为长链ncRNA(LncRNA),广泛参与了包括生长、分化、发育和凋亡在内的病理生理过程,成为肿瘤研究的新热点。乳腺癌是女性最常见的恶性肿瘤。该文就LncRNA概念及其对乳腺癌发生、发展和预后的影响作一综述。
原文参见:上海交通大学学报(医学版).;37(1):-.
乳腺癌是女性最常见的恶性肿瘤,具有高度异质性,以肿瘤分子生物学特征为基础的靶点的确立已成为个体化精准治疗的关键。长期以来,人们认为细胞内的生命过程均遵循所谓的中心法则。研究发现,在哺乳动物的基因组中,只有1%的序列有蛋白编码的功能。基因组中存在的大量转录却不翻译成蛋白质的RNA序列,统称为非编码RNA(ncRNA)。其并非基因转录的副产品或暗物质,而是广泛参与了包括生长、分化、发育和凋亡在内的几乎所有生理和/或病理过程。长链非编码RNA(LncRNA)是一类长度超过个核苷酸的RNA,其本身并不编码蛋白质,而是以RNA的形式在表观遗传学、转录、转录后调控等多种层面上影响基因的表达,与基因沉默、转录激活、染色体构型修饰等密切相关,其表达异常亦可影响肿瘤的发生、发展、侵袭、转移及预后。
1 LncRNA概述
1.1 LncRNA的来源
哺乳动物基因组序列中4%~9%的序列产生的转录本是LncRNA。大部分的LncRNA发生了多聚腺苷酸化,它们主要是由RNA聚合酶Ⅱ转录和剪切而成,结构类似于mRNA,具有复杂的二级和三级结构,还可以形成茎环状和发夹状结构,具有多重结合功能。目前,LncRNA的来源尚不清楚,研究提示有以下几种可能:①蛋白质编码基因的开放阅读框发生突变,使蛋白编码基因结构中断。②染色质重组导致2个原本距离较远的非转录片段串联与另一个独立的基因并列,产生含多个外显子的LncRNA。③由非编码基因通过反转录转座作用形成。④由非编码基因复制过程中的反移位产生,即ncRNA内部某段序列的重复复制,产生了具有相邻重复序列的LncRNA。⑤基因中插入一个转座成分,转录原件插入产生新的有功能的LncRNA。
1.2 LncRNA的分类
根据在基因组上相对于蛋白编码基因的位置,LncRNA可分为内含子型和基因间型2种;根据LncRNA的方向可分为正向、反向和双向。正义链LncRNA和蛋白编码基因共用一部分或全部DNA序列,依据位置不同又可分为启动子、内含子和3’非翻译区RNA;反义链是由蛋白编码基因的反向DNA序列转录产生;双向LncRNA则是由蛋白编码基因的2条相互反向的DNA序列同时转录产生的,且转录起始位点之间距离往往不超过bp;基因间LncRNA则来自于独立转录产生LncRNA的DNA序列。
此外,根据LncRNA功能所涉及的分子机制,可分为以下4种类型:①信号原型:在细胞受到特定刺激条件下,LncRNA作为信号分子表现出相应的组织特异性,并具有作为生物标记物的潜力。②诱饵原型:LncRNA可作为分子诱饵,诱导特定蛋白质(如转录因子)并与之结合,从而抑制其下游基因表达。③引导原型:通过与DNA或蛋白质结合,引导特定的复合体到特定的染色体位置,影响下游基因的转录。④支架原型:作为蛋白质复合物的骨架,连接2个表观修饰的酶,从而调控相关基因的表达。
1.3 LncRNA的功能
LncRNA的作用机制非常复杂,几乎可以在转录、转录后可变剪切、蛋白质翻译、翻译后修饰、蛋白质的运输、定位和最终的激活等各个层次调节基因表达。目前,已知的功能有以下几个方面:①通过在蛋白编码基因上游启动子区发生转录,干扰下游基因的表达。②通过抑制RNA聚合酶Ⅱ或者介导染色质重构及组蛋白修饰,影响下游基因的表达。③通过与蛋白编码基因的转录本形成互补双链,进而干扰mRNA的剪切,从而产生不同的剪切形式。④通过与蛋白编码基因的转录本形成互补双链,进一步在Dicer酶作用下产生内源性的siRNA,调控基因的表达水平。⑤通过结合到特定蛋白质上,LncRNA转录本能调节相应蛋白质的活性。⑥作为结构组分与蛋白质形成核酸蛋白复合体。⑦通过结合到特定蛋白质上改变该蛋白的细胞质定位。⑧作为小分子RNA如miRNA、piwi交互作用RNA(piRNA)的前体分子转录等。
2 乳腺癌相关LncRNA
乳腺癌是一个多因素作用、多基因参与、多阶段形成的复杂的异质性疾病,病程中伴随着有害突变的积累、基因组不稳定性增加、表观遗传学修饰的改变以及众多癌基因和抑癌基因的功能和表达异常的分子事件。LncRNA是基因表达的重要调控分子,可以影响肿瘤细胞凋亡、信号通路和肿瘤浸润及转移等多方面,在肿瘤发生、发展中发挥着关键的作用;但由于其研究尚处于起步阶段,在乳腺癌方面报道不多。年,Reiche等对26例乳腺癌组织和5例正常组织进行芯片分析,发现个肿瘤特异性表达区域,其中53%的LncRNA分布在内含子,33%分布在基因间区,14%分布于蛋白编码基因、启动子区、转录因子结合点或增强子区。Ding等同年应用RNA-测序方法,发现62个乳腺癌特异性表达LncRNA,此外尚有个lncRNA在乳腺癌高表达,个LncRNA在乳腺癌低表达。
2.1 LncRNA与乳腺癌发生及早期诊断
在肿瘤组织中发现的LncRNA的表达水平分为上调、下调、双向调节,其中以上调最为多见。如HOX转录反义RNA(HOTAIR)可同时与多硫蛋白抑制体2(PRC2)和组蛋白去甲基化酶复合体结合,结合后可被引导至相关基因位点,分别导致染色体组蛋白H3第27位赖氨酸三甲基化和第4位赖氨酸二甲基化,最终导致部分基因沉默,部分基因异常表达。Gupta等研究发现,在乳腺癌原发灶和转移灶中,HOTAIR的表达水平异常增高0倍,且与乳腺癌的转移及预后密切相关,HOTAIR高表达预示高转移风险和不良预后。有研究提示,血清HOTAIR诊断乳腺癌敏感度为73.3%,特异度为93.3%,具有潜在的诊断价值。HOTAIR还参与了上皮间质转化(EMT)及乳腺癌干细胞特性维持。另有研究发现,HOTAIR的单核苷酸多态性位点rs与乳腺癌易感性及部分临床病理特征相关。
此外,对于LncRNALSINCT5的研究发现,其能够在乳腺癌和卵巢癌中高表达并且调控肿瘤细胞的增殖,影响肿瘤侵袭性,这些基因可能参与了乳腺癌的发生过程。对染色体结构调控的一个经典例子为XIST,它参与X染色体失活的调控。乳腺癌1号基因(BRCA1)相关的乳腺癌具有相对较高的XIST-RNA表达。
转移相关肺腺癌转录本1(MALAT1)通过与RNA剪接、转录和染色体重组相关因子作用,调节RNA剪接、基因转录和细胞周期相关基因的表达,对G1-S期转变和有丝分裂进程至关重要。在乳腺肿瘤组织中MALAT1表达上调,发挥类似“癌基因”的作用,同样的作用亦见于肺癌、结肠癌等肿瘤。另有研究发现,高浓度17β-雌二醇下调了MALAT1的表达水平,抑制其对乳腺癌细胞的影响。近期研究发现,MALAT1诱导乳腺癌细胞的迁徙和侵袭是通过与miR-1结合,下调细胞分裂周期分子42(cdc42)实现的。此外,异常的KDM5B可以通过诱导MALAT1过表达促进乳腺癌细胞的侵袭性。MALAT1可逆转miR-对乳腺肿瘤细胞增殖抑制效应。MALAT1有望成为乳腺癌潜在治疗靶点。
母系表达基因3(MEG3)能活化p53抑癌蛋白,诱导细胞凋亡。在乳腺癌组织细胞中MEG3表达水平较低或基本不表达,故导致凋亡过程受阻,促进乳腺癌细胞的增殖。此外,MEG3表达缺失可促进肿瘤中血管的生成。
LncRNAH19具有双向调节作用,其作用依据肿瘤种类不同而各异。研究发现,在乳腺癌中H19具有致癌作用,肿瘤组织中表达水平明显升高。细胞周期相关转录因子E2F-1与H19结合,促进乳腺癌细胞进入细胞周期。另有研究认为,在乳腺癌和肺癌细胞中,c-Myc作用于母源性特异性H19等位基因,诱导细胞恶性转化。此外,H19作为miR-的前体,促进乳腺癌细胞侵袭性,这种作用部分是通过下调泛素连接酶E3家族成员Cbl-c和Cbl-b实现的。
IRAIN位于胰岛素样生长因子1型受体(IGF1R)的基因座内,在乳腺癌细胞中,IRAIN从基因内反向启动子转变为IGF1R编码mRNA。IRAIN是单等位基因表达的,在正常组织中IRAIN由来自母源性等位基因编码,而在乳腺癌组织中其来自于父源性等位基因;表观遗传分析显示,在基因启动子区域有大量CpG岛去甲基化;但IRAIN等位基因转变的具体机制和其对乳腺癌发展的影响尚未完全明确。
LncRNA-Hh通过调节Shh-GLI1通路影响肿瘤干细胞的微球体形成与自我更新潜能,在Twist阳性的乳腺癌中沉默LncRNA-Hh,可促进Shh-GLI1通路活化,下调干细胞相关基因SOX和OCT4水平,从而影响微球体形成与移植瘤形成能力。LncRNAATB可通过调节miR-和STAT3调节乳腺癌干细胞;HOTAIR过表达上调干细胞相关基因及EMT相关分子标志物,LncRNABCAR4是GLI2靶基因转录激活必需因子,而GLI靶基因在乳腺癌干细胞中发挥重要作用,提示LncRNABCAR4及HOTAIR可能在乳腺癌干细胞调节中有作用。此外,国内学者初步研究表明,Loc、PinX1、LncRNACCAT2均提示其参与了乳腺细胞向肿瘤细胞的转化,但尚需进一步实验研究加以证实。
总之,对LncRNA早期异常变化的检测可能早期预测早期乳腺癌,有助于乳腺癌的早期诊断。这些在表达水平上有差异的LncRNA,有望日后成为肿瘤诊断的新型分子标志物。
2.2 与乳腺癌疾病进展相关的LncRNA
UCA1在乳腺肿瘤中明显增高,且与临床分期密切相关,提示其促进乳腺癌的发生与发展。原位杂交和免疫组织化学分析证实,乳腺癌组织中UCA1和p27表达水平呈明显负相关,UCA1与p27mRNA竞争性结合不均一核糖核蛋白1,抑制p27蛋白表达,从而加快乳腺癌细胞进入细胞周期和促进乳腺癌细胞增殖。此外,UCA1通过下调miR-调节乳腺癌细胞的增殖和凋亡。
GAS5包含12个外显子,具有多种剪切异构体。GAS5通过与糖皮质激素受体的DNA结合域结合,抑制该受体的转录活性,阻断下游基因的表达,影响细胞代谢和存活。乳腺癌中,GAS5通过阻滞细胞周期,诱导细胞凋亡,达到抑制细胞存活的目的。与癌旁的乳腺上皮细胞相比,乳腺癌组织中GAS5表达明显下降,此外,miRNA-21可负调控GAS5的表达,促进乳腺癌细胞的增殖。
类固醇受体RNA激活因子(SRA)以ncRNA形式激活类固醇激素受体转录活性,另尚有编码型SRA通过转录为类固醇激素受体共激活蛋白来发挥作用。SRA在这2种方式之间取得平衡,调节乳腺癌细胞生长,参与乳腺癌的发生及发展过程。在乳腺癌中,SRA的高表达与雌激素受体(ER)和孕激素受体(PR)关系密切,干扰其表达可降低细胞侵袭能力。LncRNASRA上的单核苷酸多态性位点rs的TC基因型与乳腺癌风险相关。
长链基因间非编码RNA-再编程调节因子(LincRNA-ROR)包含4个外显子,在诱导性多能干细胞中首次发现,可通过与人异质性细胞核核糖蛋白1相互作用,抑制抑癌基因p53,从而影响DNA损伤修复、细胞周期进程和增殖分化等过程。在乳腺癌组织细胞中,LincRNAROR表达较癌旁组织细胞显著升高。LincRNA-ROR通过抑制miR-靶基因ZEB的下调诱导EMT转化,促进乳腺癌细胞转移和侵袭,同时增强乳腺癌细胞的干细胞潜能;基因沉默后,可抑制体内乳腺癌细胞的生长及促进肺转移。在三阴性乳腺癌,lincRNA-ROR作为内源性竞争RNA可抑制miR-,从而抑制三阴性乳腺癌的侵袭性作用。
FOXCUT定位于FOXC1基因上游。FOXCUT和FOXC1的表达呈正相关,当FOXCUT的表达被小干扰RNA下调,FOXC1的表达也随之下降。此外,将乳腺癌细胞的FOXCUT敲除可显著抑制体外细胞增殖和转移。在基底样乳腺癌细胞中,FOXCUT通过调控FOXC1促进肿瘤细胞增殖,这表明FOXCUT可能会成为基底样乳腺癌中新型生物标志物和可能治疗的靶点。
BC是神经元和生殖细胞特异性LncRNA,参与蛋白合成的调节,在乳腺癌细胞表达下调。另有研究提示,BC促进乳腺癌细胞侵袭转移。Zfas1作为肿瘤抑制因子,抑制细胞增殖和分化。TreRNA是E-钙黏蛋白mRNA转录抑制因子,可促进EMT及肿瘤细胞侵袭,有研究提示其与乳腺癌细胞的侵袭和转移能力密切相关。
LncRNA和miRNA、mRNA间可形成调节网络,共同参与乳腺癌的进展过程,如miR-19a与LncRNADLEU1共表达,共同调节ESR1的表达,从而影响不同ER表达水平的乳腺癌细胞的发生和进展。
LncRNARP11-H22.4在乳腺癌患者中高表达,检测的灵敏度和特异度分别为92%和74%,其表达水平与ER、PR和绝经状态有关。在HER-2阴性的乳腺癌中,AFAP1-AS1是异常表达较为显著的LncRNA,LOC与HER-2的正相关系数最高,而RPL13P5与HER-2负相关系数最高。
部分自身有调控作用的LncRNA还作为miRNA的前体存在。LncRNAFtx是X染色体失活中的一段保守序列编码的转录本,而在Ftx的序列中又包含4个miRNA。内涵子12包含2个miRNA。一项研究显示,miR-a在乳腺癌中发生了上调,而且它能够通过激活Wnt/β-联蛋白信号通路促进肿瘤的转移。Iranpour等研究中发现4个LncRNA:SOX2OT、PTPRG-AS1、ANRASSF1和ANRIL在乳腺癌组织中高表达,且ANRASSF1和ANRIL在三阴性乳腺癌组织中表达异常增高。
随着分子生物学技术的进步,通过LncRNA微阵列和RNA测序法,更多的乳腺癌细胞特异性和时序特异性LncRNA不断被发现。差异表达的LncRNA在鉴定乳腺上皮细胞亚群,如干细胞、基底细胞、成熟管腔细胞、管腔祖细胞和肺泡祖细胞,干细胞和祖细胞的特性维持,细胞分化的调控等方面发挥重要作用,有望成为乳腺癌发生、发展的标志物。
2.3 LncRNA与乳腺癌治疗
在某些肿瘤发生的早期,LncRNA可通过介导转录水平的基因沉默途径调控癌相关蛋白的表达。因此,在肿瘤细胞发生表观遗传调控差错时,利用LncRNA来纠正这种差错便有可能将肿瘤细胞“扼杀在摇篮里”,从而达到早期治疗肿瘤的目的。
体外研究发现,降低细胞内HOTAIR的表达水平能够抑制乳腺癌细胞(特别是PRC2过表达的癌细胞)的侵袭能力。在内分泌治疗三苯氧胺耐药的乳腺癌细胞系,增高的HOTAIR促进配体非依赖性的ER激活,从而介导了三苯氧胺的耐药。在三阴性乳腺癌细胞系亦存在HOTAIR表达上调,且应用伊马替尼与拉帕替尼联合治疗可以阻断细胞核表达β-联蛋白及β-联蛋白向HOTAIR启动子区的富集,抑制肿瘤细胞增殖。该结果提示HOTAIR可能有望成为乳腺癌治疗的分子靶点。
另外,LncRNAARA与阿霉素抵抗相关。阿霉素可以诱导敏感细胞中ARA的表达,敲除ARA可使细胞周期蛋白B1表达下降20%,ARA能阻断G2/M期的转变。此外,敲除ARA还能诱导反凋亡因子Bcl-xL下调15%,前凋亡因子Bax上调50%,同时伴随自噬体的重要组成因子表达上调,并且能够恢复阿霉素抵抗细胞的凋亡和自噬。ARA还可调节多种肿瘤相关信号途径从而导致耐药性的产生,包括MAPK信号途径、PPAR信号途径、嘌呤代谢、嘧啶代谢和细胞周期。
LncRNAPANDA的过表达阻断了蒽环类药物的抗增殖作用,且与乳腺癌患者的不良预后有关。PANDA通过与核转录因子相互作用抑制凋亡,使肿瘤细胞对化疗敏感性降低。
LncATB在曲妥珠单抗耐药乳腺癌患者组织和细胞系SKBR-3细胞中表达显著上调,其机制为LncATB竞争性结合mir-c,上调ZEB1和ZNF,引起EMT,增加乳腺癌细胞的侵袭性,进而导致乳腺癌细胞对曲妥珠单抗产生抗性。下调的LncATB可以显著抑制SKBR-3细胞的生长,同时增加曲妥珠单抗耐药SKBR-3细胞的凋亡。LncRNAGAS5下调亦参与曲妥珠单抗耐药。在移植瘤模型中XIST低表达可以预测组胺去乙酰化酶抑制剂靶向肿瘤干细胞诱导分化治疗反应性。临床前研究表明,降低的GAS5水平会减弱化疗药物诱导肿瘤细胞凋亡的作用。
Jiang等根据mRNA(包括FCGR1A、RSAD2、CHRDL1)和LncRNA(包括HIF1A-AS2、AK454)的表达情况,在三阴性乳腺癌患者中制定了综合的mRNA-LncRNA评价系统,并据此为患者进行风险评估。临床试验证实该方法能有效预测肿瘤复发和含紫杉醇类化疗方案敏感性。LncRNAMA-linc1可促进乳腺癌细胞对紫杉醇的敏感性。
综上,LncRNA本身及其参与的关键信号通路调节因子可能作为靶向治疗靶标,为乳腺癌的靶向治疗和精准治疗提供新的靶点。
2.4 LncRNA与乳腺癌预后
LncRNA表达谱可用于预测淋巴结阴性乳腺癌患者的预后,敏感度高达90%,特异度为64%~65%。HOTAIR高表达的乳腺癌患者组的无瘤生存期和总生存期均明显低于低表达组;多因素分析结果进一步说明它是乳腺癌转移和预后差的独立危险因素。此外,HOTAIR是ER阳性乳腺癌患者预测复发转移的独立因素。多数雌激素上调的LncRNA在其编码基因的启动子附近都有ERBSs,该区域受雌激素调节,这些区域LncRNA的表达与编码细胞增殖和肿瘤细胞信号途径蛋白质的mRNA表达密切相关。
NKILA是通过NF-κB信号途径中的炎症细胞因子而上调的一种LncRNA,它对NF-κB信号途径起负调节作用。NKILA与NF-κB/IκB结合,直接模拟IκB的磷酸化,从而直接抑制IKK诱导的IκB磷酸化和NF-κB激活。此外,NKILA还可以阻止NF-κB介导的乳腺癌的转移,NKILA表达下降提示乳腺癌患者预后不良。
NBAT1与PRC2成员EZH2结合,可上调Wnt信号通路DKK1,调节细胞增殖,抑制乳腺癌细胞的侵袭转移。在乳腺癌细胞中,NBAT1的低表达与癌细胞的转移和不良预后有关,提示NBAT1有望作为乳腺癌预后标志物和转移治疗靶标。
EGOT是参与调节嗜酸性颗粒蛋白转录翻译的LncRNA。相比于癌旁正常的组织,EGOT在乳腺癌组织中表达水平较低。EGOT的低表达与肿瘤大小、淋巴结转移的数目以及高Ki-67水平显著相关,EGOT低表达的患者总体预后更差,有望成为乳腺癌患者预后预测指标。
EPB41L4A-AS2是功能不明的新发现的LncRNA。EPB41L4A-AS2高表达可以抑制肿瘤细胞增殖,过表达EPB41L4A-AS2的乳腺癌患者预后良好。Linc与组织学分级为2的乳腺癌患者的无病生存期相关。
LncRNA还可预测不同亚型乳腺癌的预后,如腔上皮A亚型中PSORS1C3的高表达预后好,而腔上皮B型、Her-2和基底样亚型中RP11-F24.4、RP4-G5.1和AC.1预后差。LINC属于基因间型LncRNAs,有研究提示其高表达与ER阳性、低组织学分级和预后好的分子分型相关;在组织学分级为2的乳腺癌患者中,LINC与无病生存期相关;因此,LINC可作为肿瘤复发的早期预测因子。
3 结语