長鎖ノンコーディングRNA
長鎖ノンコーディングRNA(ちょうさノンコーディングRNA、英: long non-coding RNA、略称: lncRNA)はRNAの一種であり、一般的に、タンパク質へ翻訳されない200ヌクレオチド以上の長さの転写産物として定義される[2]。miRNA、siRNA、piRNA、snoRNAなどの短鎖ノンコーディングRNAとlncRNAとの区別は、こうした恣意的な基準によってなされている[3]。
lncRNAには、タンパク質をコードする遺伝子領域と重複しない領域に位置するlincRNA(long intervening/intergenic non-coding RNA)[4]、intronic ncRNA(イントロン内)、sense lncRNA(センス鎖)、antisense lncRNA(アンチセンス鎖)などに分類されることもあり、ゲノム上での遺伝子やエクソンとの位置関係がそれぞれ異なる[1][5]。
存在
2007年の研究では、ヒトゲノム上で行われている転写のうち、タンパク質コーディング遺伝子と関係したものはわずか1/5であり[6]、lncRNAはタンパク質コーディングRNA配列よりも少なくとも4倍以上転写されていることが示された。FANTOMなどの大規模cDNAシーケンシングプロジェクトによって、こうした転写の複雑性が明らかとなった[7]。FANTOM3プロジェクトでは、5'末端のキャップ形成、スプライシング、ポリアデニル化など、mRNAの多くの特徴を持つものの、オープンリーディングフレーム(ORF)をほとんどまたは全く持たないノンコーディング転写産物が約35,000種類同定された[7]。多くのシングルトン転写産物や非ポリアデニル化転写産物は除去されているため、この数は控えめな見積もりである(タイリングアレイデータでは転写産物の約40%がポリアデニル化されていないことが示されている)[8]。タンパク質コーディング転写産物とノンコーディング転写産物との区別は難しい場合があり、こうしたcDNAライブラリ内のncRNAの同定は困難を伴うものである。複数の研究からは、あらゆる組織の中で最も多くのlncRNAを発現しているのは精巣[9]と神経組織であることが示唆されている[10]。FANTOM5では、さまざまなヒト試料から27,919種類ののlncRNAが同定されている[11]。
定量的観点からは、lncRNAの存在量はmRNAの約1/10であり[12][13]、タンパク質コーディング遺伝子と比較して、lncRNAの発現レベルは個々の細胞間での変動が大きい[14]。一般的に、lncRNAの大部分(約78%)が組織特異的な特徴を持つのに対し、mRNAでこうした特徴を持つものはわずか約19%である[12]。組織特異性の高さに加えて、lncRNAは発生段階での特異性の高さや[15]、ヒトの大脳新皮質などの組織でみられるように細胞のサブタイプによる特異性によっても特徴づけられる[16]。2018年には、既存のデータベース、発表文献、RNA-Seqデータの解析に基づく新規RNAアセンブリの包括的統合によって、ヒトには270,044種類のlncRNA転写物が存在することが明らかとなった[17]。
哺乳類と比較して、植物のlncRNAの広がりに焦点を当てた研究は比較的少ない。しかしながら、37種の高等植物と6種の藻類を対象とした広範な研究では、in silicoアプローチによって約200,000種類のノンコーディング転写産物が同定され[18]、植物のlncRNAのレポジトリとしてGreeNCが設立されている。
ゲノム上の構成
2005年、哺乳類のゲノムは長い遺伝子間領域によって隔てられた、無数の転写の「巣」と表現される構造を持つことが記載された[7]。一部のlncRNAは遺伝子間領域に位置しているものの、大部分はタンパク質コーディング遺伝子領域と重複する領域に位置し、センス方向とアンチセンス方向に重複した転写産物が存在する[6]、という複雑な階層性が生じていることが示された[19]。こうした転写の巣の内部の配列は、センス方向とアンチセンス方向の多数のコーディング・ノンコーディング転写産物によって共有されている[20]。例えば、FANTOM2において不完全なコーディング配列としてアノテーションされていた8961種類のcDNAのうち3012種類は、後にタンパク質コーディングcDNAのノンコーディングバリアントとであるとされた[7]。
GENCODEコンソーシアムによって、ヒトのlncRNAのアノテーション、ゲノム上の構成、修飾、細胞内局在、組織発現プロファイルの包括的セットの照合と解析が行われ、ヒトのlncRNAは2つのエクソンからなる転写産物に偏って多く存在していることが示された[10]。
長鎖ノンコーディングRNAの同定ツール
ツール | 生物種 | ウェブサーバ | レポジトリ | 入力ファイル | 主なモデル/アルゴリズム | トレーニングセット | 発表年 | 出典 |
---|---|---|---|---|---|---|---|---|
RNAsamba | 全て | RNAsamba | RNAsamba | FASTA | ニューラルネットワーク | YES | 2020 | [21] |
LGC | 植物/動物 | LGC | FASTA/BED/GTF | ORFの長さとGC含量との関係 | NO | 2019 | [22] | |
CPAT | ヒト/ハエ/マウス/ゼブラフィッシュ | CPAT | CPAT | FASTA/BED | ロジスティック回帰 | YES | 2013 | [23] |
COME | 植物/ヒト/マウス/ハエ/線虫 | COME | COME | GTF | Balanced Random Forest | YES | 2017 | [24] |
lncRScan-SVM | ヒト | NA | FASTA/BED/GTF/GFF | サポートベクターマシン | YES | 2015 | [25] | |
CNCI | 植物/動物 | NA | FASTA/GTF | サポートベクターマシン | NO | 2013 | [26] | |
PLEK | 脊椎動物 | NA | PLEK | FASTA | サポートベクターマシン | NO | 2014 | [26] |
FEELnc | 全て | NA | FEELnc | FASTA/GTF | ランダムフォレスト | YES | 2017 | [27] |
PhyloCSF | 脊椎動物/ハエ/カ/酵母/線虫 | NA | FASTA | Phylogenetic Codon Model | YES | 2011 | [28] | |
PLIT | 植物 | NA | FASTA | LASSO/ランダムフォレスト | YES | 2018 | [29] | |
RNAplonc | 植物 | NA | FASTA | REPTree | YES | 2018 | [30] | |
PLncPRO | 植物/動物 | NA | FASTA | ランダムフォレスト | YES | 2017 | [31] | |
CREMA | 植物/動物 | NA | FASTA | アンサンブル学習 | YES | 2018 | [32] | |
slncky | 全て | NA | slncky | FASTA/BED | 進化的保存性 | YES | 2016 | [33] |
翻訳
lncRNAのアノテーションは誤ったものであり、実際にはタンパク質をコードしているのではないか、といった議論は多く存在する。いくつかのlncRNAは、実際に生物学的意義のある機能を持つペプチドをコードしていることが判明している[34][35][36]。リボソームプロファイリング研究は、アノテーションされたlncRNAのうち40%から90%では実際には何らかの翻訳が行われていることを示唆しているが[37][38]、リボソームプロファイリングデータを解析する正確な手法に関しては意見の不一致がある[39]。さらに、lncRNAから産生されるペプチドの多くは非常に安定性が低く、生物学的機能を持たない[38]。
保存性
lncRNAの保存性に関する初期の研究からは、lncRNAは保存配列エレメントに富み[40]、置換率や挿入/欠失率が低く[41]、希少変異が少ないことが指摘されており[42]、その機能を維持する純化選択がはたらいていることが示唆された。しかしながら、脊椎動物のlncRNAに対するさらなる研究からは、lncRNAの配列は保存されているものの、その転写に関しては保存されていないことが明らかにされた[9][43][44]。言い換えると、ヒトのlncRNAの配列が他の脊椎動物で保存されている場合であっても、その生物のオーソロガスなゲノム領域でlncRNAの転写は起こっていない場合が多い。こうした観察に対しては、lncRNAの大部分が機能的なものではないことを示唆しているとの解釈がなされたり[45][46][47]、生物種間で迅速な適応選択が行われていることを示唆しているとの解釈がなされたりしている[48]。
lncRNAの転写のターンオーバーは当初予測されていたよりもはるかに速いが、それでも数百のlncRNAが配列レベルで保存されていることは着目に値する。遺伝子全長にわたって強い配列保存性がみられるlncRNA、転写産物の一部(5'末端、スプライス部位など)のみが保存されているlncRNA、ゲノム上のシンテニックな領域から転写されているが配列類似性はみられないlncRNAなど、lncRNAにみられるさまざまな選択のシグネチャーのカテゴリを明らかにする試みがいくつか行われている[49][50][51]。さらに、lncRNAの保存された二次構造を同定する試みも行われているが、現在のところこうした研究からは相反する結果が得られている[52][53]。
機能
哺乳類のlncRNAの大部分が機能的である可能性が高いことを示す証拠は蓄積している一方で[54][55]、それらの生物学的意義が実証されているものは比較的少数である。一部のlncRNAはlncRNAdbにおいて機能のアノテーションが行われているが[56][57]、その大部分はヒトのものである。他にも実験的証拠のあるlncRNAの機能は、LncRNAWiki(ヒトのlncRNAに関する、一般編集可能なwikiベースのオープンコンテントプラットフォーム)[58]において、機能発揮機構、疾患との関係に関するキュレーションが研究コミュニティによって行われており、LncBookからアクセスすることもできる[17]。文献ベースのlncRNAの機能発揮機構のキュレーションによると、lncRNAは転写調節に関与しているとの報告が広くみられる[17]。さらに大規模なシーケンシング研究からは、lncRNAと考えられていた転写産物の多くで実際にはタンパク質への翻訳が行われている証拠も得られている[59]。
遺伝子の転写の調節
遺伝子特異的転写
真核生物では、転写は緊密に調節された過程である。ncRNAはこの過程のさまざまな面に作用し、転写調節因子やRNAポリメラーゼII(RNAP II)、さらにはDNA二本鎖を標的として遺伝子発現を調節する[60]。
ncRNAは自身がコレギュレーターとして機能したり、転写因子の活性を変化させたり、コレギュレーターの結合や活性を調節したり、といったいくつかの機構で転写を調整する。例えばncRNAのEvf-2は、前脳の発生と神経発生に重要な役割を果たすホメオボックス転写因子Dlx2のコアクチベーターとして機能する[61][62]。Sonic hedgehogは、前脳の発生時にDlx5遺伝子とDlx6遺伝子の間に位置する超保存エレメントからEvf-2の転写を誘導する[61]。その後、Evf-2はDlx2転写因子を同じ超保存エレメントへリクルートし、Dlx2はDlx5の発現を誘導する。哺乳類のゲノムには、同じように転写され、かつエンハンサー機能を果たす超保存エレメントや高保存性エレメントが他にも存在し、Evf-2が脊椎動物の成長時に複雑な発現パターンを持つ発生遺伝子を調節する一般的機構の実例の1つであることを示唆している[63][64]。同様のノンコーディング超保存エレメントの転写と発現は、ヒトの白血病では異常が生じており、また結腸がん細胞ではこれらがアポトーシスに寄与していることが示されており、腫瘍形成に関与していることが示唆される[65][66]。
ncRNAの局所的な発現は転写プログラムをリクルートし、近接するタンパク質コーディング遺伝子の発現を調節する。近接するタンパク質コーディング遺伝子と反対方向に転写される多様なlncRNA(哺乳類ゲノム中の全lncRNAの約20%)は、多能性細胞において近接する必須発生調節遺伝子の転写制御に関与している可能性が高い[67]。
RNA結合タンパク質TLSは、CBP/p300ヒストンアセチルトランスフェラーゼに結合し、抑制標的であるサイクリンD1に対する活性を阻害する。サイクリンD1のプロモーターへのTLSのリクルートは、DNA損傷シグナルに応答して低レベルで発現し、5'調節領域に位置するlncRNAによって行われる[68]。さらに、これらの局所的なncRNAはTLSの活性を調節するリガンドとして協調的に機能する。広い意味では、この機構は哺乳類のプロテオームで最大のクラスの1つであるRNA結合タンパク質の機能を転写プログラムへと統合することを可能にするものである。また、新生lncRNA鎖はCBPの活性を増加させ、そのncRNAの転写を増加させることが示されている[69]。ある研究では、APOA1のアンチセンス方向のlncRNAは、エピジェネティックな修飾によってAPOA1の転写を調節することが発見されている[70]。
また、X染色体の不活性化を回避して行われる遺伝子の転写は、不活性化を回避する染色体ドメインにおけるncRNAの発現を介した現象である可能性が提唱されている[71]。
基本転写装置の調節
ncRNAはRNAP IIによる全ての遺伝子転写に必要とされる、基本転写因子を標的とする場合もある[60]。こうした基本転写因子には、プロモーター上で組み立てられる開始複合体の構成要素や、転写伸長に関与するものが含まれる。DHFR遺伝子の上流のマイナープロモーターから転写されたncRNAはメジャープロモーター内で安定なRNA-DNA三重鎖を形成し、転写コファクターTFIIBの結合を阻害する[72]。真核生物の染色体には数千のRNA-DNA三重鎖が存在しており、こうした遺伝子調節機構はプロモーターの利用の制御のために広く利用されている手法である可能性がある[73]。また、U1 ncRNAはTFIIHに結合してRNAP IIのC末端ドメインのリン酸化を促進することで転写を誘導する[74]。対照的に7SK ncRNAは、HEXIM1/2とともに、P-TEFbによるRNAP IIのC末端ドメインのリン酸化を防ぐ不活性複合体を形成することで転写伸長を抑制し[74][75][76]、ストレス環境下での伸長反応を全般的に抑制する。こうした例は、個々のプロモーターごとに特異的な調節様式を回避し、遺伝子発現全般に迅速な変化をもたらす手法となっている。
こうした迅速に全般的変化をもたらす能力は、ノンコーディング反復配列の迅速な発現においても明らかとなっている。ヒトのSINEの1種であるAlu配列やそれに類似したマウスのB1、B2エレメントはゲノム中に最も豊富に存在する可動性エレメントとなっており、それぞれヒトのゲノム約10%、マウスゲノムの約6%を占めている[77][78]。こうしたエレメントは熱ショックなどの環境ストレスに応答してRNAP IIIによってncRNAとして転写され[79]、RNAP IIに高い親和性で結合して活性のある開始前複合体の形成を防ぐ[80][81][82][83]。その結果、ストレスに応答して遺伝子発現の広範かつ迅速な抑制が行われる[80][83]。
AluのRNA転写産物の機能的配列の解析からは、このncRNAが明確なモジュール構造を持ち、いわばタンパク質のような転写因子としての機能を持つことが明らかとなりつつある[84]。Alu RNAには2つの「アーム」が存在し、そのそれぞれが1つのRNAP II分子を結合するとともに、それに加えて2つの調節ドメインがin vitroでRNAP IIによる転写の抑制を担っている[83]。これら緩やかな構造をとる2つのドメインはB1エレメントなど他のncRNAに連結することで、それらに抑制効果を付与することもできる[83]。Alu配列や類似した反復配列が哺乳類のゲノム中に多く広く分布しているのは、進化の過程でこうした機能的ドメインが他のlncRNAに取り込まれたことが理由の1つである可能性がある。機能的な反復配列ドメインの存在は、Kcnq1ot1、Xlsirt、Xistなどの既知のいくつかのlncRNAに共通した特徴である[85][86][87][88]。
熱ショックのほかにも、ウイルス感染[89]などの細胞ストレス時や一部のがん細胞[90]でSINE(Alu、B1、B2など)の発現は増加しており、同様に遺伝子発現の全般的変化を調節ている可能性がある。AluやB2 RNAのRNAP IIへの直接的結合は、転写を幅広く抑制する機構となる[81][83]。しかしながらこの全般的応答には例外があり、熱ショック遺伝子など誘導が行われている遺伝子の活発なプロモーターにはAluやB2 RNAは存在しない[83]。こうした個々の遺伝子を全般的抑制から除外する階層的調節にもまた、HSR1(heat shock RNA 1)と呼ばれるlncRNAが関与している。哺乳類細胞中でHSR1が不活性状態で存在しているかに関しては議論があるが、HSR1はストレスに際して活性化され、熱ショック遺伝子の発現を誘導する[91]。この活性化には温度上昇に応答したHSR1のコンフォメーション変化が関与しており、それによって転写アクチベーターHSF1との相互作用が可能となり、HSF1は三量体化して熱ショック遺伝子の発現を誘導する[91]。これらは、AluやB2 RNAが遺伝子発現を全般的に抑制する一方で、他のncRNAが特定の遺伝子の発現を活性化するという、ncRNAによる入れ子状の制御回路の例を示している。
RNAポリメラーゼIIIによる転写
基本転写因子やRNAP II自体と相互作用するncRNAの多く(7SK、Alu、B1、B2 RNAなど)はRNAP IIIによって転写されており[92]、これらの発現は調節標的であるRNAP IIとは共役していない。RNAP IIIは、tRNAや5S rRNA、snRNAなどのハウスキーピングncRNAに加えて、BC2やBC200、一部のmiRNAやsnoRNAなど、他のncRNAも転写する[92]。RNAP IIIによって転写されるncRNAの中にタンパク質コーディング遺伝子と配列相同性を持つ一群のncRNAが含まれることは、センス/アンチセンス相互作用に基づいてRNAP II依存的トランスクリプトームを調節するRNAP III依存的ncRNAトランスクリプトームの存在を支持している。具体的には、21A ncRNAはCENP-Fの発現を転写後段階で調節していることが知られている[93]。
転写後調節
転写調節に加えて、ncRNAは転写後のmRNAのプロセシングのさまざまな段階も制御する。miRNAやsnoRNAなどの低分子調節RNAと同様に、こうした機能には標的mRNAとの相補的な塩基対形成が伴うことが多い。相補的なncRNAとmRNAとの間での二本鎖RNAの形成は、トランスに作用する因子が結合するために必要なmRNA内の重要なエレメントを覆い隠すことで、pre-mRNAのプロセシングやスプライシング、輸送、翻訳、分解などの過程を変化させ、転写後段階で遺伝子発現に影響を与える可能性がある[94]。
スプライシング
mRNAのスプライシングは、自身の翻訳を誘導し、また自身がコードするタンパク質のレパートリーを機能的に多様化する。Zeb2のmRNAが効率的に翻訳されるためには、IRESを含む5' UTRのイントロンが保持されていることが必要である[95]。イントロンの保持は、イントロンの5'スプライス部位と相補的なアンチセンス転写産物の発現に依存している[95]。上皮細胞におけるZeb2アンチセンス転写産物の異所性発現はスプライシングを抑制してZeb2のmRNAの翻訳を誘導し、上皮間葉転換を誘導する[95]。同様に、Rev-ErbAαと呼ばれるアンチセンス転写産物は甲状腺ホルモン受容体ErbAa2のmRNAの選択的スプライシングを制御する[96]。
翻訳
ncRNAは翻訳時にも調節を行っている可能性がある。この性質は特に神経細胞で利用されており、シナプスの活動に応答して樹状突起や軸索でmRNAの翻訳を行うことで、シナプス可塑性の変化や神経ネットワークのリモデリングに寄与している。RNAP IIIによって転写されるBC1やBC200 ncRNAはもともとtRNAに由来し、それぞれマウスとヒトの中枢神経系で発現している[97][98]。BC1の発現はシナプスの活動とシナプス形成に応答して誘導され、神経細胞の樹状突起に特異的に標的化される[99]。BC1とさまざまな神経特異的mRNA上の領域との配列相補性からは、BC1が標的の翻訳抑制に関与していることが示唆されている[100]。実際に、BC1は樹状突起における翻訳抑制に関係し、線条体におけるドーパミンD2受容体を介した伝達効率を制御していることが示されており[101]、BC1 RNAを欠失したマウスは探索行動の低下と不安関連行動の増加といった行動変化を示す[102]。
siRNAによる遺伝子調節
二本鎖RNAの形成は一本鎖RNA中の重要なエレメントを覆い隠すだけでなく、ショウジョウバエやマウス卵母細胞における内因性siRNA(endo-siRNA)形成の基質ともなる[103]。これらはアンチセンスや反復領域などの転写産物間の相補性配列のアニーリングによってRNA二本鎖が形成され、Dicer2によってendo-siRNAへとプロセシングされることで形成されている可能性がある。また、分子内で伸長したヘアピン構造を形成するlncRNAもsiRNAへとプロセシングされる可能性があることがesi-1、esi-2転写産物で示されている[104]。こうした転写産物から形成されたendo-siRNAは、生殖系列においてゲノム内の可動性トランスポゾンエレメントの拡大の抑制に特に有用なようである。アンチセンス転写産物や偽遺伝子からのendo-siRNAの形成はRISCを介して機能的な遺伝子をサイレンシングする可能性があり、長鎖・短鎖RNAによるさまざまな調節を統合する重要なノードとして作用していることがXistとTsixの例で示されている[105]。
エピジェネティックな調節
ヒストンやDNAのメチル化、ヒストンのアセチル化、SUMO化などのエピジェネティックな修飾は染色体の生物学の多くの面に影響を与え、主にクロマチンドメインのリモデリングによって多数の遺伝子の調節に影響する[106][107]。RNAがクロマチンの不可欠な構成要素であることは以前から知られていたが[108][109]、RNAがクロマチン修飾経路に関与する方法が理解され始めたのは近年になってからである[110][111][112]。例えばncRNAのOplr16は、染色体内のルーピングとDNA脱メチル化酵素TET2のリクルートによって、幹細胞コア因子の活性化をエピジェネティックに誘導する[113]。
ショウジョウバエでは、lncRNAがTrithoraxタンパク質Ash1をHox調節エレメントへリクルートし、そのクロマチン修飾機能を指揮することでホメオティック遺伝子Ubxの発現を誘導する[112]。同様のモデルは哺乳類でも提唱されており、ヒトの発生過程を通じて持続するHox遺伝子の胚発現プロファイルには、強力なエピジェネティック機構が存在すると考えられている[111][114]。実際に、ヒトのHox遺伝子は数百種類のncRNAと関係しており、これらはヒトの発生の時間・空間軸の双方に従って順次発現し、ヒストンのメチル化やRNAポリメラーゼのアクセス性が異なるクロマチンドメインを形成する[111]。HOTAIRと名付けられたncRNAはHOXC遺伝子座に由来し、クロマチンのトリメチル化状態を変化させることでHOXD遺伝子座を40 kbにわたって転写抑制する。HOTAIRはPolycombクロマチンリモデリング複合体の作用をトランスに指揮してこの作用を果たし、細胞のエピジェネティック状態とその後の遺伝子発現を支配すると考えられている。SUZ12、EZH2、EEDなどのPolycomb複合体の構成要素にはRNA結合ドメインが存在し、これらを介してHOTAIRやその他の類似したncNRAに結合している可能性がある[115][116]。これはncRNAが汎用のクロマチン修飾タンパク質のセットの機能をゲノム上の特定の遺伝子座にリクルートするという好例であり、近年発表されたゲノム地図の複雑性を強調するものである[107]。タンパク質コーディング遺伝子と関係した多くのlncRNAは、クロマチン修飾の局所的パターンに寄与し、発生時に遺伝子発現を調節している可能性がある。タンパク質コーディング遺伝子の大部分にはアンチセンスパートナーが存在し、これらにはがんでエピジェネティックな機構によって高頻度でサイレンシングされている多くのがん抑制遺伝子も含まれる[117]。近年の研究では、白血病ではp15遺伝子とそのアンチセンスncRNAが反対の発現プロファイルを示すことが観察されている[117]。詳細な解析からは、p15アンチセンスncRNA(CDKN2BAS)は未解明の機構でp15のヘテロクロマチン化状態やDNAメチル化状態の変化を誘導し、p15の発現を調節することが示されている[117]。このように、がん抑制遺伝子と関連したアンチセンスncRNAの誤った発現はがん抑制遺伝子をサイレンシングし、がんに寄与している可能性がある。
インプリンティング
ncRNAによるクロマチン修飾は、インプリンティングの現象の中で初めて明らかになった。インプリンティングは、母親または父親由来の染色体のいずれか一方のアレルからのみ遺伝子が発現する現象である。一般的に、インプリンティング遺伝子は染色体上で密集して位置しており、このことはインプリンティング機構が個々の遺伝子ではなく局所的な染色体ドメインに対して作用することを示唆している。こうしたクラスターはlncRNAと関係していることも多く、ncRNAの発現は同じアレルの関連するタンパク質コーディング遺伝子の抑制状態と相関している[118]。実際に、Kcnq1ot1やIgf2r/AirといったncRNAのインプリンティングにおける重要な役割が詳細な解析により明らかにされている[119]。
Kcnq1遺伝子座のほぼすべての遺伝子は、父親由来で発現するアンチセンスncRNAであるKcnq1ot1を除いて母親由来の遺伝子が発現する[120]。Kcnq1ot1が切り詰められたトランスジェニックマウスは隣接遺伝子をサイレンシングすることができないことから、Kcnq1ot1が父親由来の染色体上の遺伝子のインプリンティングに重要であることが示唆される[121]。Kcnq1ot1は、Kcnq1ot1のプロモーター領域と重複するインプリンティング中心においてヒストンH3のリジン9番と27番のトリメチル化を指示することができ、この領域はKcnq1のセンス鎖のエクソン内に位置している[122]。HOTAIRの場合と同様に、Eed-Ezh2ポリコーム複合体が父親由来のKcnq1遺伝子座へ(おそらくKcnq1ot1によって)リクルートされ、そこで抑制的なヒストンメチル化によって遺伝子サイレンシングを媒介している可能性がある[122]。Igf2r遺伝子座の場合も、メチル化状態の異なるインプリンティング中心は、父親由来の染色体上でIgf2r遺伝子座近傍遺伝子のサイレンシングを担う長鎖アンチセンスncRNAであるAirのプロモーター領域と重なっている[123][124]。Igf2r遺伝子座におけるアレル特異的なヒストンメチル化の存在は、Airがクロマチン修飾を介したサイレンシングを媒介していることを示唆している[125]。
XistとX染色体不活性化
有胎盤類のメスでみられるX染色体の不活性化は、最も早くそして最もよく特性解析がなされたlncRNAの1つであるXistによって指揮される[126]。将来的に不活性化されるX染色体からのXistの発現とその後の不活性化X染色体のコーティングは、胚性幹細胞の分化の初期に生じる。Xistの発現に続いて、活性型クロマチンと関係するヒストンH3K9のアセチル化やH3K4のメチル化の喪失と、H4の低アセチル化、H3K27のトリメチル化[126]、H3K9の高メチル化、H4K20のモノメチル化、H2AK119のモノユビキチン化などの抑制的なクロマチン修飾の誘導といった不可逆的なクロマチン修飾の積み重ねが行われる。こうした修飾は、X連鎖遺伝子の転写サイレンシングと同時に行われる[127]。また、Xist RNAはヒストンバリアントmacroH2Aを不活性化X染色体へ局在させる[128]。Xist遺伝子座には、アンチセンス転写産物であるTsixなど他のncRNAも存在する。Tsixは将来的に活性化される染色体から発現し、endo-siRNAの形成によってXistの発現を抑制する[105]。これらのncRNAは協働し、メスの哺乳類では1本のX染色体だけが活性化されるよう保証されている。
テロメアのノンコーディングRNA
テロメアは哺乳類の染色体の末端領域に形成され、染色体の安定性と老化に必要不可欠であり、がんなどの疾患で中心的な役割を果たす[129]。テロメアは転写不活性なDNA-タンパク質複合体であると長らく考えられてきたが、2000年代後半にテロメアリピートがテロメアRNA(TelRNA)[130]またはTERRA(telomeric repeat–containing RNA)[131]として転写されている可能性が示された。こうしたncRNAの長さは一定ではなく、テロメア周辺領域のいくつかの遺伝子座から転写され、テロメアに物理的に局在する。これらとクロマチンとの結合は、これらがテロメア特異的なヘテロクロマチン修飾の調節に関与していることを示唆しており、テロメアの喪失から染色体の末端を保護しているSMGタンパク質によって抑制される[131]。さらに、TelRNAはin vitroでテロメラーゼの活性を遮断するため、テロメラーゼの活性を調節している可能性がある[130]。これらの研究は、テロメアのncRNAがテロメアの生物学のさまざまな側面に関与していることを示唆している。
DNA複製のタイミングの調節と染色体安定性
ASAR(asynchronous replication and autosomal RNA)はスプライシングやポリアデニル化を受けない非常に長い(~200 kb)ncRNAであり、正常なDNA複製のタイミングの決定と染色体安定性に必要である[132][133][134]。ASAR6、ASAR15、ASAR6-141の遺伝子座のいずれか1つを欠失させると、染色体全体で複製のタイミングの遅れと分裂期の凝縮の遅れ(DRT/DMC)という同じ表現型が引き起こされる。DRT/DMCは染色体分離のエラーを引き起こし、secondary rearrangementの頻度の増加と染色体不安定性をもたらす。Xistと同様、ASARはランダムな単一アレル発現を行い、アレル間でDNA複製が同期していない染色体ドメインに位置する。ASARの機能の機構は現在も研究中であるが、Xist lncRNAと類似した機構で、しかし常染色体内のより小さなドメインにのみ作用することでアレル特異的な遺伝子発現の変化を引き起こしていると予想されている。
また、DNA二本鎖切断(DSB)の不適切な修復は染色体組換えを引き起こし、がんの発生の主要因の1つとなっている。非相同末端結合(NHEJ)や相同配列指向性修復(HDR)など真核生物細胞におけるDSB修復の主要な経路のさまざまな段階において、多数のlncRNAが重要な役割を果たしている。こうしたRNA遺伝子の変異や発現の変化は局所的なDNA修復の欠陥をもたらし、染色体異常の頻度を増加させる。さらに、一部のRNAは長距離間の染色体組換えを刺激する可能性が示されている[135]。
老化と疾患
細胞生物学のさまざまな面におけるlncRNAの機能の発見は、それらの疾患における役割に関する研究へとつながった。マルチオミクス解析に基づくと、数万ものlncRNAが疾患と関係している可能性がある[17]。いくつかの研究はlncRNAがさまざまな病態に関与していることを示唆しており、神経疾患やがんに関与し協働していることを支持している。
老化や神経疾患の過程においてlncRNAの存在量が変化していることが最初に報告されたのは、アルツハイマー病患者と非アルツハイマー型認知症の患者の死亡直後の組織を用いた研究においてである[136]。この研究では、BC200と呼ばれる、霊長類の脳特異的なAluリピートファミリーの細胞質転写産物[137]に関する解析が行われた。
病態におけるlncRNAの発現異常を同定した関連研究は多くあるものの、それらの病因に対する役割はほとんど理解されていない。腫瘍細胞と正常細胞を比較した発現解析により、いくつかの種類のがんでncRNAの発現に変化が生じていることが明らかにされている。例えば、前立腺腫瘍ではPCGEM1(過剰発現している2種類のncRNAのうちの1つ)は増殖とコロニー形成の増加と相関しており、細胞成長の調節に関与していることが示唆されている[138]。MALAT1(NEAT2)はもともと初期段階の非小細胞肺がんの転移時にアップレギュレーションされているncRNAとして同定され、患者の生存率の低さに関する初期の予後マーカーとなっている[138]。また、MALAT1のマウスホモログは肝細胞がんで高度に発現していることが示されている[139]。前立腺がんでは、発現が腫瘍の分化度と相関するイントロン性のアンチセンスncRNAも報告されている[140]。がんでは多くのlncRNAで発現異常がみられるものの、それらの機能や腫瘍形成における役割は比較的不明点が多い。例えば、HIS-1やBICといったncRNAはがんの発生と成長の制御への関与が示唆されているものの、これらの正常細胞における機能は不明である[141][142]。がん以外の病態でも、ncRNAの発現は異常を示す。HEAT2やKCNQ1OT1などのlncRNAは心不全や冠動脈疾患などの心血管疾患の患者の血液で増加がみられ、心血管疾患イベントの予測因子となる[143][144]。PRINSの過剰発現は乾癬の感受性と関係しており、乾癬患者の非病変表皮では病変部や健常人の表皮よりもPRINSの発現が上昇している[145]。
ゲノムワイド解析により、超保存領域から転写されるncRNAの多くがヒトのさまざまながんで異なる発現プロファイルを示すことが明らかにされている[66]。慢性リンパ性白血病、大腸がん、肝細胞がんの解析では、これら3種類のがんの全てで正常細胞と比較して超保存ncRNAの発現プロファイルの異常が発見されている。超保存ncRNAの1つに関するさらなる解析からは、大腸がんでアポトーシスを緩和して多数の悪性細胞を増殖し、がん遺伝子のようにふるまっていることが示唆されている[66]。このようにがんにおいて明確な特徴を示す超保存部位の多くは、ゲノムの脆弱部位やがんと関係した領域に存在する。悪性化過程においてこうした超保存ncRNAの発現の異常がみられるのは、それらがヒトの正常な発生過程において重要な機能を果たしているためである可能性が高い。
多くの関連研究において、病態と関係した一塩基多型(SNP)がlncRNAにマッピングされている。例えば、心筋梗塞の感受性座位として同定されたSNPにはMIATと呼ばれるlncRNAがマッピングされている[146]。同様に、ゲノムワイド関連解析により同定された冠動脈疾患と関連した領域[147]にはANRILと呼ばれるlncRNAが含まれている[148]。ANRILはアテローム性動脈硬化の影響を受けた組織や細胞種で発現しており[149][150]、その発現の変化は冠動脈疾患の高リスクハプロタイプと関連している[150][151]。
トランスクリプトームの複雑性とその構造に関する我々の理解の進展は、病態と関連した多くの多型の機能的基盤の再解釈につながる可能性がある。特定の病態と関連したSNPの多くはノンコーディング領域に位置し、こうした領域内のノンコーディング転写の複雑なネットワークは多型の機能的影響の解明を特に困難なものにしている。例えば、ZFATのバリアントであるTR-ZFAT(truncated form of ZFAT)の内部とアンチセンス転写産物のプロモーター領域に位置するSNPは、mRNAの安定性を高めるのではなく、アンチセンス転写産物の発現を抑制することでZFATの発現を上昇させている[152]。
lncRNAの誤った発現は臨床的意義を持つタンパク質コーディング遺伝子の調節不全をもたらし、疾患に寄与する可能性がある。アルツハイマー病の病理に重要なBACE1遺伝子の発現を調節するアンチセンスlncRNAは、アルツハイマー病患者の脳のいくつかの領域で発現が上昇している[153]。また、ncRNAの発現の変化は遺伝子発現に影響を与えるエピジェネティックな変化を媒介し、疾患の病理に寄与する可能性もある。遺伝的変異によるアンチセンス転写産物の誘導はセンス遺伝子のDNAメチル化とサイレンシングをもたらし、βサラセミアを引き起こす[154]。
病理学的過程を媒介する役割に加えて、lncRNAはワクチン接種に対する免疫応答にも関与しており、このことはインフルエンザワクチンや黄熱ワクチンで示されている[155]。
出典
- ^ a b “Long Non-Coding RNAs in the Regulation of Gene Expression: Physiology and Disease”. Non-Coding RNA 5 (1): 17. (February 2019). doi:10.3390/ncrna5010017. PMC 6468922. PMID 30781588 .
- ^ “Visiting "noncodarnia"”. BioTechniques 54 (6): 301, 303–4. (June 2013). doi:10.2144/000114037. PMID 23750541. ""We're calling long noncoding RNAs a class, when actually the only definition is that they are longer than 200 bp," says Ana Marques, a Research Fellow at the University of Oxford who uses evolutionary approaches to understand lncRNA function."
- ^ “On the classification of long non-coding RNAs”. RNA Biology 10 (6): 925–933. (June 2013). doi:10.4161/rna.24604. PMC 4111732. PMID 23696037 .
- ^ Ransohoff, Julia D.; Wei, Yuning; Khavari, Paul A. (2018-03). “The functions and unique features of long intergenic non-coding RNA”. Nature Reviews. Molecular Cell Biology 19 (3): 143–157. doi:10.1038/nrm.2017.104. ISSN 1471-0080. PMC 5889127. PMID 29138516 .
- ^ Ma, Lina; Bajic, Vladimir B.; Zhang, Zhang (2013-04-15). “On the classification of long non-coding RNAs.”. RNA Biology 10 (6): 925–933. doi:10.4161/RNA.24604. PMC 4111732. PMID 23696037 .
- ^ a b “RNA maps reveal new RNA classes and a possible function for pervasive transcription”. Science 316 (5830): 1484–1488. (June 2007). Bibcode: 2007Sci...316.1484K. doi:10.1126/science.1138341. PMID 17510325 .
- ^ a b c d Carninci, P.; Kasukawa, T.; Katayama, S.; Gough, J.; Frith, M. C.; Maeda, N.; Oyama, R.; Ravasi, T. et al. (2005-09-02). “The transcriptional landscape of the mammalian genome”. Science (New York, N.Y.) 309 (5740): 1559–1563. doi:10.1126/science.1112014. ISSN 1095-9203. PMID 16141072 .
- ^ “Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution”. Science 308 (5725): 1149–1154. (May 2005). Bibcode: 2005Sci...308.1149C. doi:10.1126/science.1108625. PMID 15790807.
- ^ a b “The evolution of lncRNA repertoires and expression patterns in tetrapods”. Nature 505 (7485): 635–640. (January 2014). Bibcode: 2014Natur.505..635N. doi:10.1038/nature12943. PMID 24463510.
- ^ a b “The GENCODE v7 catalog of human long noncoding RNAs: analysis of their gene structure, evolution, and expression”. Genome Research 22 (9): 1775–1789. (September 2012). doi:10.1101/gr.132159.111. PMC 3431493. PMID 22955988 .
- ^ “An atlas of human long non-coding RNAs with accurate 5′ ends”. Nature 543 (7644): 199–204. (March 2017). Bibcode: 2017Natur.543..199H. doi:10.1038/nature21374. PMC 6857182. PMID 28241135 .
- ^ a b “Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses”. Genes & Development 25 (18): 1915–1927. (September 2011). doi:10.1101/gad.17446611. PMC 3185964. PMID 21890647 .
- ^ “Experimental validation of the regulated expression of large numbers of non-coding RNAs from the mouse genome”. Genome Research 16 (1): 11–19. (January 2006). doi:10.1101/gr.4200206. PMC 1356124. PMID 16344565 .
- ^ “HIPSTR and thousands of lncRNAs are heterogeneously expressed in human embryos, primordial germ cells and stable cell lines”. Scientific Reports 6: 32753. (September 2016). Bibcode: 2016NatSR...632753Y. doi:10.1038/srep32753. PMC 5015059. PMID 27605307 .
- ^ “Single-cell RNA-Seq profiling of human preimplantation embryos and embryonic stem cells”. Nature Structural & Molecular Biology 20 (9): 1131–1139. (September 2013). doi:10.1038/nsmb.2660. PMID 23934149.
- ^ “Single-cell analysis of long non-coding RNAs in the developing human neocortex”. Genome Biology 17: 67. (April 2016). doi:10.1186/s13059-016-0932-1. PMC 4831157. PMID 27081004 .
- ^ a b c d “LncBook: a curated knowledgebase of human long non-coding RNAs”. Nucleic Acids Research 47 (Database issue): D128–D134. (Jan 2019). doi:10.1093/nar/gky960. PMC 6323930. PMID 30329098 .
- ^ “GREENC: a Wiki-based database of plant lncRNAs”. Nucleic Acids Research 44 (D1): D1161–6. (January 2016). doi:10.1093/nar/gkv1215. PMC 4702861. PMID 26578586 .
- ^ “Genome-wide transcription and the implications for genomic organization”. Nature Reviews Genetics 8 (6): 413–423. (June 2007). doi:10.1038/nrg2083. PMID 17486121.
- ^ ENCODE Project Consortium; Birney, Ewan; Stamatoyannopoulos, John A.; Dutta, Anindya; Guigó, Roderic; Gingeras, Thomas R.; Margulies, Elliott H.; Weng, Zhiping et al. (2007-06-14). “Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project”. Nature 447 (7146): 799–816. doi:10.1038/nature05874. ISSN 1476-4687. PMC 2212820. PMID 17571346 .
- ^ “RNAsamba: neural network-based assessment of the protein-coding potential of RNA sequences”. NAR Genomics and Bioinformatics 2 (1): lqz024. (March 2020). doi:10.1093/nargab/lqz024. PMC 7671399. PMID 33575571 .
- ^ “Characterization and identification of long non-coding RNAs based on feature relationship”. Bioinformatics 41 (Database issue): D246–D251. (January 2019). doi:10.1093/bioinformatics/btz008. PMID 30649200.
- ^ “CPAT: Coding-Potential Assessment Tool using an alignment-free logistic regression model”. Nucleic Acids Research 41 (6): e74. (April 2013). doi:10.1093/nar/gkt006. PMC 3616698. PMID 23335781 .
- ^ “COME: a robust coding potential calculation tool for lncRNA identification and characterization based on multiple features”. Nucleic Acids Research 45 (1): e2. (January 2017). doi:10.1093/nar/gkw798. PMC 5224497. PMID 27608726 .
- ^ “lncRScan-SVM: A Tool for Predicting Long Non-Coding RNAs Using Support Vector Machine”. PLOS ONE 10 (10): e0139654. (2015). Bibcode: 2015PLoSO..1039654S. doi:10.1371/journal.pone.0139654. PMC 4593643. PMID 26437338 .
- ^ a b “Utilizing sequence intrinsic composition to classify protein-coding and long non-coding transcripts”. Nucleic Acids Research 41 (17): e166. (September 2013). doi:10.1093/nar/gkt646. PMC 3783192. PMID 23892401 .
- ^ “FEELnc: a tool for long non-coding RNA annotation and its application to the dog transcriptome”. Nucleic Acids Research 45 (8): e57. (May 2017). doi:10.1093/nar/gkw1306. PMC 5416892. PMID 28053114 .
- ^ “PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions”. Bioinformatics 27 (13): i275–i282. (July 2011). doi:10.1093/bioinformatics/btr209. PMC 3117341. PMID 21685081 .
- ^ “PLIT: An alignment-free computational tool for identification of long non-coding RNAs in plant transcriptomic datasets”. Computers in Biology and Medicine 105: 169–181. (February 2019). arXiv:1902.05064. Bibcode: 2019arXiv190205064D. doi:10.1016/j.compbiomed.2018.12.014. PMID 30665012.
- ^ “Pattern recognition analysis on long noncoding RNAs: a tool for prediction in plants”. Briefings in Bioinformatics 20 (2): 682–689. (2019). doi:10.1093/bib/bby034. PMID 29697740.
- ^ “PLncPRO for prediction of long non-coding RNAs (lncRNAs) in plants and its application for discovery of abiotic stress-responsive lncRNAs in rice and chickpea”. Nucleic Acids Research 45 (22): e183. (December 2017). doi:10.1093/nar/gkx866. PMC 5727461. PMID 29036354 .
- ^ “Prediction of plant lncRNA by ensemble machine learning classifiers”. BMC Genomics 19 (1): 316. (May 2018). doi:10.1186/s12864-018-4665-2. PMC 5930664. PMID 29720103 .
- ^ “Evolutionary analysis across mammals reveals distinct classes of long non-coding RNAs”. Genome Biology 17 (19): 19. (Feb 2016). doi:10.1186/s13059-016-0880-9. PMC 4739325. PMID 26838501 .
- ^ “A micropeptide encoded by a putative long noncoding RNA regulates muscle performance”. Cell 160 (4): 595–606. (February 2015). doi:10.1016/j.cell.2015.01.009. PMC 4356254. PMID 25640239 .
- ^ “mTORC1 and muscle regeneration are regulated by the LINC00961-encoded SPAR polypeptide”. Nature 541 (7636): 228–232. (January 2017). Bibcode: 2017Natur.541..228M. doi:10.1038/nature21034. PMID 28024296.
- ^ “Toddler: an embryonic signal that promotes cell movement via Apelin receptors”. Science 343 (6172): 1248636. (February 2014). doi:10.1126/science.1248636. PMC 4107353. PMID 24407481 .
- ^ “Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes”. Cell 147 (4): 789–802. (November 2011). doi:10.1016/j.cell.2011.10.002. PMC 3225288. PMID 22056041 .
- ^ a b “Many lncRNAs, 5'UTRs, and pseudogenes are translated and some are likely to express functional proteins”. eLife 4: e08890. (December 2015). doi:10.7554/eLife.08890. PMC 4739776. PMID 26687005 .
- ^ “Ribosome profiling provides evidence that large noncoding RNAs do not encode proteins”. Cell 154 (1): 240–251. (July 2013). doi:10.1016/j.cell.2013.06.009. PMC 3756563. PMID 23810193 .
- ^ “Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals”. Nature 458 (7235): 223–227. (March 2009). Bibcode: 2009Natur.458..223G. doi:10.1038/nature07672. PMC 2754849. PMID 19182780 .
- ^ “Functionality or transcriptional noise? Evidence for selection within long noncoding RNAs”. Genome Research 17 (5): 556–565. (May 2007). doi:10.1101/gr.6036807. PMC 1855172. PMID 17387145 .
- ^ “Mutations within lncRNAs are effectively selected against in fruitfly but not in human”. Genome Biology 14 (5): R49. (May 2013). doi:10.1186/gb-2013-14-5-r49. PMC 4053968. PMID 23710818 .
- ^ “Evolutionary dynamics and tissue specificity of human long noncoding RNAs in six mammals”. Genome Research 24 (4): 616–628. (April 2014). doi:10.1101/gr.165035.113. PMC 3975061. PMID 24429298 .
- ^ “Rapid turnover of long noncoding RNAs and the evolution of gene expression”. PLOS Genetics 8 (7): e1002841. (2012). doi:10.1371/journal.pgen.1002841. PMC 3406015. PMID 22844254 .
- ^ “Waste not, want not—transcript excess in multicellular eukaryotes”. Trends in Genetics 21 (5): 287–288. (May 2005). doi:10.1016/j.tig.2005.02.014. PMID 15851065.
- ^ “Transcriptional noise and the fidelity of initiation by RNA polymerase II”. Nature Structural & Molecular Biology 14 (2): 103–105. (February 2007). doi:10.1038/nsmb0207-103. PMID 17277804.
- ^ “Non-coding RNA: what is functional and what is junk?”. Frontiers in Genetics 6: 2. (2015-01-26). doi:10.3389/fgene.2015.00002. PMC 4306305. PMID 25674102 .
- ^ “Volatile evolution of long noncoding RNA repertoires: mechanisms and biological implications”. Trends in Genetics 30 (10): 439–452. (October 2014). doi:10.1016/j.tig.2014.08.004. PMC 4464757. PMID 25218058 .
- ^ “Evolutionary analysis across mammals reveals distinct classes of long non-coding RNAs”. Genome Biology 17: 19. (February 2016). doi:10.1186/s13059-016-0880-9. PMC 4739325. PMID 26838501 .
- ^ “Evolution to the rescue: using comparative genomics to understand long non-coding RNAs”. Nature Reviews Genetics 17 (10): 601–614. (October 2016). doi:10.1038/nrg.2016.85. PMID 27573374.
- ^ “Principles of long noncoding RNA evolution derived from direct comparison of transcriptomes in 17 species”. Cell Reports 11 (7): 1110–1122. (May 2015). doi:10.1016/j.celrep.2015.04.023. PMC 4576741. PMID 25959816 .
- ^ “Evolutionary conservation of long non-coding RNAs; sequence, structure, function”. Biochimica et Biophysica Acta (BBA) - General Subjects 1840 (3): 1063–1071. (March 2014). doi:10.1016/j.bbagen.2013.10.035. PMC 3909678. PMID 24184936 .
- ^ “A statistical test for conserved RNA structure shows lack of evidence for structure in lncRNAs”. Nature Methods 14 (1): 45–48. (January 2017). doi:10.1038/nmeth.4066. PMC 5554622. PMID 27819659 .
- ^ “Long non-coding RNAs: insights into functions”. Nature Reviews Genetics 10 (3): 155–159. (March 2009). doi:10.1038/nrg2521. PMID 19188922.
- ^ “Pervasive transcription of the eukaryotic genome: functional indices and conceptual implications”. Briefings in Functional Genomics & Proteomics 8 (6): 407–423. (November 2009). doi:10.1093/bfgp/elp038. PMID 19770204.
- ^ “lncRNAdb: a reference database for long noncoding RNAs”. Nucleic Acids Research 39 (Database issue): D146–51. (January 2011). doi:10.1093/nar/gkq1138. PMC 3013714. PMID 21112873 .
- ^ “lncRNAdb v2.0: expanding the reference database for functional long noncoding RNAs”. Nucleic Acids Research 43 (Database issue): D168–73. (January 2015). doi:10.1093/nar/gku988. PMC 4384040. PMID 25332394 .
- ^ Ma, Lina; Li, Ang; Zou, Dong; Xu, Xingjian; Xia, Lin; Yu, Jun; Bajic, Vladimir B.; Zhang, Zhang (2015-01). “LncRNAWiki: harnessing community knowledge in collaborative curation of human long non-coding RNAs”. Nucleic Acids Research 43 (Database issue): D187–192. doi:10.1093/nar/gku1167. ISSN 1362-4962. PMC 4383965. PMID 25399417 .
- ^ “Translation of small open reading frames within unannotated RNA transcripts in Saccharomyces cerevisiae”. Cell Reports 7 (6): 1858–1866. (June 2014). doi:10.1016/j.celrep.2014.05.023. PMC 4105149. PMID 24931603 .
- ^ a b “Non-coding-RNA regulators of RNA polymerase II transcription”. Nature Reviews Molecular Cell Biology 7 (8): 612–616. (August 2006). doi:10.1038/nrm1946. PMID 16723972.
- ^ a b “The Evf-2 noncoding RNA is transcribed from the Dlx-5/6 ultraconserved region and functions as a Dlx-2 transcriptional coactivator”. Genes & Development 20 (11): 1470–1484. (June 2006). doi:10.1101/gad.1416106. PMC 1475760. PMID 16705037 .
- ^ “Developmental functions of the Distal-less/Dlx homeobox genes”. Development 129 (19): 4371–4386. (October 2002). doi:10.1242/dev.129.19.4371. PMID 12223397 .
- ^ “In vivo enhancer analysis of human conserved non-coding sequences”. Nature 444 (7118): 499–502. (November 2006). Bibcode: 2006Natur.444..499P. doi:10.1038/nature05295. PMID 17086198 .
- ^ “Ultraconservation identifies a small subset of extremely constrained developmental enhancers”. Nature Genetics 40 (2): 158–160. (February 2008). doi:10.1038/ng.2007.55. PMC 2647775. PMID 18176564 .
- ^ “Cloning of the mRNA of overexpression in colon carcinoma-1: a sequence overexpressed in a subset of colon carcinomas”. Cancer Genetics and Cytogenetics 133 (1): 55–60. (February 2002). doi:10.1016/S0165-4608(01)00634-3. PMID 11890990.
- ^ a b c “Ultraconserved regions encoding ncRNAs are altered in human leukemias and carcinomas”. Cancer Cell 12 (3): 215–229. (September 2007). doi:10.1016/j.ccr.2007.07.027. PMID 17785203.
- ^ “Divergent lncRNAs Regulate Gene Expression and Lineage Differentiation in Pluripotent Cells”. Cell Stem Cell 18 (5): 637–652. (May 2016). doi:10.1016/j.stem.2016.01.024. PMID 26996597.
- ^ “Induced ncRNAs allosterically modify RNA-binding proteins in cis to inhibit transcription”. Nature 454 (7200): 126–130. (July 2008). Bibcode: 2008Natur.454..126W. doi:10.1038/nature06992. PMC 2823488. PMID 18509338 .
- ^ “Non-coding RNA: More uses for genomic junk”. Nature 543 (7644): 183–185. (March 2017). Bibcode: 2017Natur.543..183A. doi:10.1038/543183a. PMID 28277509.
- ^ “Regulation of the apolipoprotein gene cluster by a long noncoding RNA”. Cell Reports 6 (1): 222–230. (January 2014). doi:10.1016/j.celrep.2013.12.015. PMC 3924898. PMID 24388749 .
- ^ “Female-biased expression of long non-coding RNAs in domains that escape X-inactivation in mouse”. BMC Genomics 11: 614. (November 2010). doi:10.1186/1471-2164-11-614. PMC 3091755. PMID 21047393 .
- ^ “Repression of the human dihydrofolate reductase gene by a non-coding interfering transcript”. Nature 445 (7128): 666–670. (February 2007). doi:10.1038/nature05519. PMID 17237763.
- ^ “A monoclonal antibody to triplex DNA binds to eucaryotic chromosomes”. Nucleic Acids Research 15 (3): 1047–1061. (February 1987). doi:10.1093/nar/15.3.1047. PMC 340507. PMID 2434928 .
- ^ a b “U1 snRNA associates with TFIIH and regulates transcriptional initiation”. Nature Structural Biology 9 (11): 800–805. (November 2002). doi:10.1038/nsb862. PMID 12389039.
- ^ “Specific double-stranded RNA interference in undifferentiated mouse embryonic stem cells”. Molecular and Cellular Biology 21 (22): 7807–7816. (November 2001). doi:10.1128/MCB.21.22.7807-7816.2001. PMC 99950. PMID 11604515 .
- ^ “Inhibition of P-TEFb (CDK9/Cyclin T) kinase and RNA polymerase II transcription by the coordinated actions of HEXIM1 and 7SK snRNA”. Molecular Cell 12 (4): 971–982. (October 2003). doi:10.1016/S1097-2765(03)00388-5. PMID 14580347.
- ^ Lander, E. S.; Linton, L. M.; Birren, B.; Nusbaum, C.; Zody, M. C.; Baldwin, J.; Devon, K.; Dewar, K. et al. (2001-02-15). “Initial sequencing and analysis of the human genome”. Nature 409 (6822): 860–921. doi:10.1038/35057062. ISSN 0028-0836. PMID 11237011 .
- ^ Mouse Genome Sequencing Consortium; Waterston, Robert H.; Lindblad-Toh, Kerstin; Birney, Ewan; Rogers, Jane; Abril, Josep F.; Agarwal, Pankaj; Agarwala, Richa et al. (2002-12-05). “Initial sequencing and comparative analysis of the mouse genome”. Nature 420 (6915): 520–562. doi:10.1038/nature01262. ISSN 0028-0836. PMID 12466850 .
- ^ “Cell stress and translational inhibitors transiently increase the abundance of mammalian SINE transcripts”. Nucleic Acids Research 23 (10): 1758–1765. (May 1995). doi:10.1093/nar/23.10.1758. PMC 306933. PMID 7784180 .
- ^ a b “Evolution of microRNA genes by inverted duplication of target gene sequences in Arabidopsis thaliana”. Nature Genetics 36 (12): 1282–1290. (December 2004). doi:10.1038/ng1478. PMID 15565108.
- ^ a b “B2 RNA binds directly to RNA polymerase II to repress transcript synthesis”. Nature Structural & Molecular Biology 11 (9): 822–829. (September 2004). doi:10.1038/nsmb812. PMID 15300239.
- ^ “Characterization of the structure, function, and mechanism of B2 RNA, an ncRNA repressor of RNA polymerase II transcription”. RNA 13 (4): 583–596. (April 2007). doi:10.1261/rna.310307. PMC 1831867. PMID 17307818 .
- ^ a b c d e f “Human Alu RNA is a modular transacting repressor of mRNA transcription during heat shock”. Molecular Cell 29 (4): 499–509. (February 2008). doi:10.1016/j.molcel.2007.12.013. PMID 18313387.
- ^ “Modular RNA heats up”. Molecular Cell 29 (4): 415–417. (February 2008). doi:10.1016/j.molcel.2008.02.001. PMID 18313380.
- ^ “Challenging the dogma: the hidden layer of non-protein-coding RNAs in complex organisms”. BioEssays 25 (10): 930–939. (October 2003). doi:10.1002/bies.10332. PMID 14505360.
- ^ “Kcnq1ot1/Lit1 noncoding RNA mediates transcriptional silencing by targeting to the perinucleolar region”. Molecular and Cellular Biology 28 (11): 3713–3728. (June 2008). doi:10.1128/MCB.02263-07. PMC 2423283. PMID 18299392 .
- ^ “Chromosomal silencing and localization are mediated by different domains of Xist RNA”. Nature Genetics 30 (2): 167–174. (February 2002). doi:10.1038/ng820. PMID 11780141.
- ^ “Identification of new Xlsirt family members in the Xenopus laevis oocyte”. Mechanisms of Development 120 (4): 503–509. (April 2003). doi:10.1016/S0925-4773(02)00459-8. PMID 12676327.
- ^ “Expression of enhanced levels of small RNA polymerase III transcripts encoded by the B2 repeats in simian virus 40-transformed mouse cells”. Nature 314 (6011): 553–556. (1985). Bibcode: 1985Natur.314..553S. doi:10.1038/314553a0. PMID 2581137.
- ^ “Increased level of polymerase III transcribed Alu RNA in hepatocellular carcinoma tissue”. Molecular Carcinogenesis 42 (2): 93–96. (February 2005). doi:10.1002/mc.20057. PMID 15593371.
- ^ a b “Gene control by large noncoding RNAs”. Science's STKE 2006 (355): pe40. (October 2006). doi:10.1126/stke.3552006pe40. PMID 17018852.
- ^ a b “The expanding RNA polymerase III transcriptome”. Trends in Genetics 23 (12): 614–622. (December 2007). doi:10.1016/j.tig.2007.09.001. hdl:11381/1706964. PMID 17977614.
- ^ Mallardo, Massimo; Poltronieri, Palmiro; D'Urso, Oscar Fernando (2008-07-16). “Non-protein coding RNA biomarkers and differential expression in cancers: a review”. Journal of experimental & clinical cancer research: CR 27: 19. doi:10.1186/1756-9966-27-19. ISSN 1756-9966. PMC 2490676. PMID 18631387 .
- ^ “Posttranscriptional gene regulation by long noncoding RNA”. The Journal of Molecular Biology 425 (19): 3723–3730. (October 2013). doi:10.1016/j.jmb.2012.11.024. PMC 3594629. PMID 23178169 .
- ^ a b c “A natural antisense transcript regulates Zeb2/Sip1 gene expression during Snail1-induced epithelial-mesenchymal transition”. Genes & Development 22 (6): 756–769. (March 2008). doi:10.1101/gad.455708. PMC 2275429. PMID 18347095 .
- ^ “Inhibition of c-erbA mRNA splicing by a naturally occurring antisense RNA”. The Journal of Biological Chemistry 266 (33): 22083–22086. (November 1991). doi:10.1016/S0021-9258(18)54535-X. PMID 1657988 .
- ^ “Primary structure, neural-specific expression, and dendritic location of human BC200 RNA”. The Journal of Neuroscience 13 (6): 2382–2390. (June 1993). doi:10.1523/JNEUROSCI.13-06-02382.1993. PMC 6576500. PMID 7684772 .
- ^ “Dendritic location of neural BC1 RNA”. Proceedings of the National Academy of Sciences of the United States of America 88 (6): 2093–2097. (March 1991). Bibcode: 1991PNAS...88.2093T. doi:10.1073/pnas.88.6.2093. PMC 51175. PMID 1706516 .
- ^ “Activity-dependent regulation of dendritic BC1 RNA in hippocampal neurons in culture”. The Journal of Cell Biology 141 (7): 1601–1611. (June 1998). doi:10.1083/jcb.141.7.1601. PMC 1828539. PMID 9647652 .
- ^ “Dendritic BC1 RNA in translational control mechanisms”. The Journal of Cell Biology 171 (5): 811–821. (December 2005). doi:10.1083/jcb.200506006. PMC 1828541. PMID 16330711 .
- ^ “The brain cytoplasmic RNA BC1 regulates dopamine D2 receptor-mediated transmission in the striatum”. The Journal of Neuroscience 27 (33): 8885–8892. (August 2007). doi:10.1523/JNEUROSCI.0548-07.2007. PMC 6672174. PMID 17699670 .
- ^ “Role of a neuronal small non-messenger RNA: behavioural alterations in BC1 RNA-deleted mice”. Behavioural Brain Research 154 (1): 273–289. (September 2004). doi:10.1016/j.bbr.2004.02.015. PMID 15302134.
- ^ “An inside job for siRNAs”. Molecular Cell 31 (3): 309–312. (August 2008). doi:10.1016/j.molcel.2008.07.008. PMC 2675693. PMID 18691963 .
- ^ “An endogenous small interfering RNA pathway in Drosophila”. Nature 453 (7196): 798–802. (June 2008). Bibcode: 2008Natur.453..798C. doi:10.1038/nature07007. PMC 2895258. PMID 18463631 .
- ^ a b “Intersection of the RNA interference and X-inactivation pathways”. Science 320 (5881): 1336–1341. (June 2008). Bibcode: 2008Sci...320.1336O. doi:10.1126/science.1157676. PMC 2584363. PMID 18535243 .
- ^ “Epigenetics in development”. Developmental Dynamics 236 (4): 1144–1156. (April 2007). doi:10.1002/dvdy.21094. PMID 17304537.
- ^ a b “Genome-wide maps of chromatin state in pluripotent and lineage-committed cells”. Nature 448 (7153): 553–560. (August 2007). Bibcode: 2007Natur.448..553M. doi:10.1038/nature06008. PMC 2921165. PMID 17603471 .
- ^ “Chromatin architecture and nuclear RNA”. Proceedings of the National Academy of Sciences of the United States of America 86 (1): 177–181. (January 1989). Bibcode: 1989PNAS...86..177N. doi:10.1073/pnas.86.1.177. PMC 286427. PMID 2911567 .
- ^ “RNA is an integral component of chromatin that contributes to its structural organization”. PLOS ONE 2 (11): e1182. (November 2007). Bibcode: 2007PLoSO...2.1182R. doi:10.1371/journal.pone.0001182. PMC 2063516. PMID 18000552 .
- ^ “Integration of external signaling pathways with the core transcriptional network in embryonic stem cells”. Cell 133 (6): 1106–1117. (June 2008). doi:10.1016/j.cell.2008.04.043. PMID 18555785.
- ^ a b c “Functional demarcation of active and silent chromatin domains in human HOX loci by noncoding RNAs”. Cell 129 (7): 1311–1323. (June 2007). doi:10.1016/j.cell.2007.05.022. PMC 2084369. PMID 17604720 .
- ^ a b “Noncoding RNAs of trithorax response elements recruit Drosophila Ash1 to Ultrabithorax”. Science 311 (5764): 1118–1123. (February 2006). Bibcode: 2006Sci...311.1118S. doi:10.1126/science.1117705. PMID 16497925.
- ^ “Oplr16 serves as a novel chromatin factor to control stem cell fate by modulating pluripotency-specific chromosomal looping and TET2-mediated DNA demethylation”. Nucleic Acids Research 48 (7): 3935–3948. (2020). doi:10.1093/nar/gkaa097. PMC 7144914. PMID 32055844 .
- ^ “Transcriptional interference: an unexpected layer of complexity in gene regulation”. Journal of Cell Science 120 (Pt 16): 2755–2761. (August 2007). doi:10.1242/jcs.007633. PMID 17690303.
- ^ “Point mutations in the WD40 domain of Eed block its interaction with Ezh2”. Molecular and Cellular Biology 18 (10): 5634–5642. (October 1998). doi:10.1128/MCB.18.10.5634. PMC 109149. PMID 9742080 .
- ^ “Antisense transcription in the mammalian transcriptome”. Science 309 (5740): 1564–1566. (September 2005). Bibcode: 2005Sci...309.1564R. doi:10.1126/science.1112009. PMID 16141073.
- ^ a b c “Epigenetic silencing of tumour suppressor gene p15 by its antisense RNA”. Nature 451 (7175): 202–206. (January 2008). Bibcode: 2008Natur.451..202Y. doi:10.1038/nature06468. PMC 2743558. PMID 18185590 .
- ^ “Silencing by imprinted noncoding RNAs: is transcription the answer?”. Trends in Genetics 23 (6): 284–292. (June 2007). doi:10.1016/j.tig.2007.03.018. PMC 2847181. PMID 17445943 .
- ^ “The Air noncoding RNA: an imprinted cis-silencing transcript”. Cold Spring Harbor Symposia on Quantitative Biology 69: 55–66. (2004). doi:10.1101/sqb.2004.69.55. PMC 2847179. PMID 16117633 .
- ^ “LIT1, an imprinted antisense RNA in the human KvLQT1 locus identified by screening for differentially expressed transcripts using monochromosomal hybrids”. Human Molecular Genetics 8 (7): 1209–1217. (July 1999). doi:10.1093/hmg/8.7.1209. PMID 10369866.
- ^ “Elongation of the Kcnq1ot1 transcript is required for genomic imprinting of neighboring genes”. Genes & Development 20 (10): 1268–1282. (May 2006). doi:10.1101/gad.1416906. PMC 1472902. PMID 16702402 .
- ^ a b “Imprinting along the Kcnq1 domain on mouse chromosome 7 involves repressive histone methylation and recruitment of Polycomb group complexes”. Nature Genetics 36 (12): 1296–1300. (December 2004). doi:10.1038/ng1467. PMID 15516932.
- ^ “The non-coding Air RNA is required for silencing autosomal imprinted genes”. Nature 415 (6873): 810–813. (February 2002). Bibcode: 2002Natur.415..810S. doi:10.1038/415810a. PMID 11845212.
- ^ “Bidirectional action of the Igf2r imprint control element on upstream and downstream imprinted genes”. Genes & Development 15 (18): 2361–2366. (September 2001). doi:10.1101/gad.206201. PMC 312779. PMID 11562346 .
- ^ “Allele-specific histone lysine methylation marks regulatory regions at imprinted mouse genes”. The EMBO Journal 21 (23): 6560–6570. (December 2002). doi:10.1093/emboj/cdf655. PMC 136958. PMID 12456662 .
- ^ a b “X inactivation Xplained”. Current Opinion in Genetics & Development 17 (5): 387–393. (October 2007). doi:10.1016/j.gde.2007.08.001. PMID 17869504.
- ^ “The region 3′ to Xist mediates X chromosome counting and H3 Lys-4 dimethylation within the Xist gene”. The EMBO Journal 23 (3): 594–604. (February 2004). doi:10.1038/sj.emboj.7600071. PMC 1271805. PMID 14749728 .
- ^ “Histone macroH2A1 is concentrated in the inactive X chromosome of female mammals”. Nature 393 (6685): 599–601. (June 1998). Bibcode: 1998Natur.393..599C. doi:10.1038/31275. PMID 9634239.
- ^ “Telomere length, stem cells and aging”. Nature Chemical Biology 3 (10): 640–649. (October 2007). doi:10.1038/nchembio.2007.38. PMID 17876321.
- ^ a b “Developmentally regulated transcription of mammalian telomeres by DNA-dependent RNA polymerase II”. Nature Cell Biology 10 (2): 228–236. (February 2008). doi:10.1038/ncb1685. PMID 18157120.
- ^ a b “Telomeric repeat containing RNA and RNA surveillance factors at mammalian chromosome ends”. Science 318 (5851): 798–801. (November 2007). Bibcode: 2007Sci...318..798A. doi:10.1126/science.1147182. PMID 17916692.
- ^ “Asynchronous replication, mono-allelic expression, and long range Cis-effects of ASAR6”. PLOS Genetics 9 (4): e1003423. (April 2013). doi:10.1371/journal.pgen.1003423. PMC 3617217. PMID 23593023 .
- ^ “ASAR15, A cis-acting locus that controls chromosome-wide replication timing and stability of human chromosome 15”. PLOS Genetics 11 (1): e1004923. (January 2015). doi:10.1371/journal.pgen.1004923. PMC 4287527. PMID 25569254 .
- ^ “Reciprocal monoallelic expression of ASAR lncRNA genes controls replication timing of human chromosome 6”. RNA 26 (6): 724–738. (June 2020). doi:10.1261/rna.073114.119. PMC 7266157. PMID 32144193 .
- ^ “The Role of RNA in DNA Breaks, Repair and Chromosomal Rearrangements”. Biomolecules 11 (4): 550. (April 2021). doi:10.3390/biom11040550. PMC 8069526. PMID 33918762 .
- ^ “BC200 RNA in normal human neocortex, non-Alzheimer dementia (NAD), and senile dementia of the Alzheimer type (AD)”. Neurochemical Research 17 (6): 591–597. (June 1992). doi:10.1007/bf00968788. PMID 1603265.
- ^ “Primate brain-specific cytoplasmic transcript of the Alu repeat family”. Molecular and Cellular Biology 7 (9): 3324–3327. (September 1987). doi:10.1128/MCB.7.9.3324. PMC 367971. PMID 2444875 .
- ^ a b “Regulation of apoptosis by a prostate-specific and prostate cancer-associated noncoding gene, PCGEM1”. DNA and Cell Biology 25 (3): 135–141. (March 2006). doi:10.1089/dna.2006.25.135. PMID 16569192.
- ^ “A large noncoding RNA is a marker for murine hepatocellular carcinomas and a spectrum of human carcinomas”. Oncogene 26 (6): 851–858. (February 2007). doi:10.1038/sj.onc.1209846. PMID 16878148.
- ^ “Antisense intronic non-coding RNA levels correlate to the degree of tumor differentiation in prostate cancer”. Oncogene 23 (39): 6684–6692. (August 2004). doi:10.1038/sj.onc.1207880. PMID 15221013.
- ^ “Accumulation of miR-155 and BIC RNA in human B cell lymphomas”. Proceedings of the National Academy of Sciences of the United States of America 102 (10): 3627–3632. (March 2005). Bibcode: 2005PNAS..102.3627E. doi:10.1073/pnas.0500613102. PMC 552785. PMID 15738415 .
- ^ “Expression of the putative proto-oncogene His-1 in normal and neoplastic tissues”. The American Journal of Pathology 150 (4): 1297–1305. (April 1997). PMC 1858164. PMID 9094986 .
- ^ “Long noncoding RNAs in patients with acute myocardial infarction”. Circulation Research 115 (7): 668–677. (September 2014). doi:10.1161/CIRCRESAHA.115.303836. PMID 25035150.
- ^ “Identification and regulation of the long non-coding RNA Heat2 in heart failure”. Journal of Molecular and Cellular Cardiology 126: 13–22. (January 2019). doi:10.1016/j.yjmcc.2018.11.004. PMID 30445017.
- ^ “Identification and characterization of a novel, psoriasis susceptibility-related noncoding RNA gene, PRINS”. The Journal of Biological Chemistry 280 (25): 24159–24167. (June 2005). doi:10.1074/jbc.M501704200. PMID 15855153 .
- ^ “Identification of a novel non-coding RNA, MIAT, that confers risk of myocardial infarction”. Journal of Human Genetics 51 (12): 1087–1099. (2006). doi:10.1007/s10038-006-0070-9. PMID 17066261.
- ^ “A common allele on chromosome 9 associated with coronary heart disease”. Science 316 (5830): 1488–1491. (June 2007). Bibcode: 2007Sci...316.1488M. doi:10.1126/science.1142447. PMC 2711874. PMID 17478681 .
- ^ “Characterization of a germ-line deletion, including the entire INK4/ARF locus, in a melanoma-neural system tumor family: identification of ANRIL, an antisense noncoding RNA whose expression coclusters with ARF”. Cancer Research 67 (8): 3963–3969. (April 2007). doi:10.1158/0008-5472.CAN-06-2004. PMID 17440112.
- ^ “Susceptibility to coronary artery disease and diabetes is encoded by distinct, tightly linked SNPs in the ANRIL locus on chromosome 9p”. Human Molecular Genetics 17 (6): 806–814. (March 2008). doi:10.1093/hmg/ddm352. PMID 18048406.
- ^ a b “Functional analysis of the chromosome 9p21.3 coronary artery disease risk locus”. Arteriosclerosis, Thrombosis, and Vascular Biology 29 (10): 1671–1677. (October 2009). doi:10.1161/ATVBAHA.109.189522. PMID 19592466.
- ^ “INK4/ARF transcript expression is associated with chromosome 9p21 variants linked to atherosclerosis”. PLOS ONE 4 (4): e5027. (April 2009). Bibcode: 2009PLoSO...4.5027L. doi:10.1371/journal.pone.0005027. PMC 2660422. PMID 19343170 .
- ^ “SNPs in the promoter of a B cell-specific antisense transcript, SAS-ZFAT, determine susceptibility to autoimmune thyroid disease”. Human Molecular Genetics 13 (19): 2221–2231. (October 2004). doi:10.1093/hmg/ddh245. PMID 15294872.
- ^ “Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation of beta-secretase”. Nature Medicine 14 (7): 723–730. (July 2008). doi:10.1038/nm1784. PMC 2826895. PMID 18587408 .
- ^ “Transcription of antisense RNA leading to gene silencing and methylation as a novel cause of human genetic disease”. Nature Genetics 34 (2): 157–165. (June 2003). doi:10.1038/ng1157. PMID 12730694.
- ^ “Long noncoding RNAs are involved in multiple immunological pathways in response to vaccination”. Proceedings of the National Academy of Sciences of the United States of America 116 (34): 17121–17126. (August 2019). doi:10.1073/pnas.1822046116. PMID 31399544.