トライグラフ

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

C言語におけるトライグラフ (英語: trigraph) とは、ISO 646 に共通して含まれる文字だけでソースコードを書くための表記法である。

概要[編集]

C言語のソースコードはASCIIの文字セットを用いて表記されるが、ISO 646で自由に文字を割り当てられる領域の文字まで使う文法となっている。特に、括弧類が別の文字に置き換わっているとソースコードの表記がしづらくなるので、ISO 646で自由割り当てでない文字を3つ組み合わせることで、それらの文字を表すこととした。これがトライグラフである[1]

JIS X 3010-1993では「3文字表記」JIS X 3014:2003では「三つ組表示」としており、定訳がないことからもっぱら「トライグラフ」とカタカナで書かれる。

一覧[編集]

ISO 646 で文字が不定のコードは10あるが、そのうち「$」はC言語では使用しないため、トライグラフはそのうち9文字に規定されている[1]

トライグラフの一覧
トライグラフの表記 表される文字
??= #
??( [
??/ \
??) ]
??' ^
??< {
??! |
??> }
??- ~

処理[編集]

トライグラフの処理は、エスケープシーケンストークンの解釈に先立って行われる[1]ため、文字列内の表記も置き換わることとなる。文字列中にトライグラフと一致する3文字を書けるようにするために、単に?1文字を表すエスケープシーケンスである\?が用意されている[2]。例えば、"?\?="と書いた場合、トライグラフとしての処理は行われず、その後にエスケープシーケンスが展開され、"??="という文字列となる。また、文字列リテラルを2つの?の間で分離する、という回避法も存在する[3]

利用[編集]

コンピュータで利用可能な文字コードは拡張が続き、1984年には8ビットのISO 8859-1が、1990年代以降は16ビット以上のUnicodeが制定された。これらのコードでは最初の128文字がASCIIと一致しているため、トライグラフを使わなくてもすべての文字を表記できる。

GCC[4]Visual C++ 2010[5]など、明示的に有効にしなければトライグラフが無効となっている処理系もある。また、Borland C++ Compilerでは、コンパイル速度を上げるために、トライグラフ処理に専用のプリプロセッサを使うことになっている[6]。さらに、トライグラフの使用について警告を出すことのできる処理系もある[7][8][3]など、21世紀初頭に至っては、意図せずにトライグラフを書いてしまうことによる問題点が注意喚起なされる[3]ような状況と化している。

脚注[編集]

[ヘルプ]
  1. ^ a b c Trigraphs マイクロソフト(英語)、2011年4月25日閲覧。
  2. ^ Escape Sequences マイクロソフト(英語)、2011年4月25日閲覧。
  3. ^ a b c PRE07-C. "??" の繰り返しは避ける JPCERT/CC、2010年5月17日(2014年5月8日閲覧)。
  4. ^ C Dialect Options GCCマニュアル(英語)、フリーソフトウェア財団、2011年4月25日閲覧。
  5. ^ Visual C++ での互換性に影響する変更点 マイクロソフト、2011年4月25日閲覧。
  6. ^ Borland C++ Compiler FAQ エンバカデロ・テクノロジーズ、2011年4月25日閲覧
  7. ^ Warning Options GCCマニュアル(英語)、フリーソフトウェア財団、2011年4月25日閲覧。
  8. ^ コンパイラの警告 (レベル 4) C4837 マイクロソフト、2011年4月25日閲覧。