外字

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

外字(がいじ)とは、

  • 外国(特に欧米圏)の文字のこと。この意味の外字で印刷されている新聞を外字新聞という。
  • 活版印刷の用語である組版において、使用頻度が低いため、常用漢字人名用漢字とは別(外(ほか))のケースに収められていた活字をこう呼んでいた。
  • 文字コードなどの特定の文字集合に含まれない文字のことをいう。本項で詳述。

外字とは特定の文字集合(文字コードなど)に含まれない文字のことをいう。日本で一般には、JIS規格文字コード(通常はJIS X 0208、稀にJIS X 0213JIS X 0221)に含まれない文字のことをさし、「表外字」、「拡張漢字(ベンダ選定拡張漢字)」とも呼ばれる。常用漢字に含まれない文字のことを外字ということもある。

文字コードにおける外字[編集]

日本語1バイト文字集合における外字[編集]

PC98シリーズなどでは、JIS X 0201の文字以外に記号などが個別に定義されていた。これらは98文字などと呼ばれ、外字の一種である。

JIS X 0208における外字[編集]

1979年にJIS X 0208に含まれない文字を使用するために、未定義領域と呼ばれるエリアに独自の文字を作成する手段がとられていた。

メーカなどがシステムにあらかじめ組み込んでいた外字をシステム外字ベンダ定義文字と呼び、個々のユーザが作成した外字はユーザ外字ユーザ定義文字と呼ぶ。

ワードプロセッサなどでも、外字の作成が可能な製品も多数存在した。Microsoft Windowsの場合は、標準で附属する外字エディタというアプリケーションでユーザ外字が作成可能である。

一般にはShift_JISにおける0xF000〜0xFFFCの領域がユーザ外字領域として広く用いられてきた。

このユーザ外字領域にあらかじめ各種の文字を入れておいたフォントなどもあり、外字領域の文字しか含まれないフォントのことを外字フォントと呼ぶ。

JIS X 0208の1997年における改訂でこの未定義領域に外字を入れることが原則禁止された。

JIS X 0213における外字[編集]

2000年に規格化されたJIS X 0213では、Shift_JIS-2004(Shift_JISX0213)というShift_JISの符号化表現を拡張した規格が定義された。この文字コードでは、実装水準3(第3水準の文字までしか含まない)で実装する場合には、0xF000〜0xFFFCの領域を外字領域として使用してよいこととした。

JIS X 0221 (Unicode)における外字[編集]

Unicodeでは、外字エリアとして私用領域という名称でU+E000〜U+F8FF、U+000F0000〜U+000FFFFD、U+00100000〜U+0010FFFDに外字領域を設けてある。このうち、あとの2つは面単位で用意されているので、私用面と呼ばれる。

Windowsのユーザ外字領域であるShift_JISの0xF040〜0xF9FCはUnicodeのU+E000〜U+E757に順番に対応付けられている。(Shift_JISで0xF07Fなどの使用不可能なコードポイントは飛ばす。)

Windows付属の外字エディタではU+E758〜U+F8FFにも外字を作成可能であるが、そこに作成したものはUnicode環境でのみ使用可能となる。

WingdingsなどのシンボルフォントのグリフはUnicodeではU+F020〜U+F0FFの一部に対応付けられている。

ARIB外字や携帯電話の絵文字などこれまでは外字でしか使用できなかった文字についても、企業ロゴ等を除いて順次Unicodeに含めることが進められている。

DRCS外字[編集]

日本のデータ放送、文字放送、字幕放送などではDRCS外字という外字が使用可能である。ARIBの文字コードではJIS X 0208の文字やARIB外字などを使用できるが、これ以外に任意の外字が自由に使用可能である。ARIBの規格で任意の外字を送信する仕組みが仕様として規定されており、この仕様をすべての受信機がサポートしていることが保障されているため、自由な外字を使用することが可能となっている。

問題点[編集]

外字はその文字コード情報のみでは、あらかじめどのコードにどの文字を入れているかを同期させている場合と、上記DRCS外字を使用する場合を除き、別の環境とのデータのやり取りができない。

外字登録[編集]

ワープロ専用機ワープロソフトWindows などのオペレーティングシステムでは、ユーザが自分で外字を登録できるようになっている。

常用漢字表外字[編集]

常用漢字表に含まれない文字のことを表外字と呼ぶ。平成12年に表外漢字字体表国語審議会が発表し、常用漢字に含まれない漢字の字形のよりどころを規定した。

人名・地名用外字[編集]

人名を扱うシステムにおいて、人名用外字が使われている。日本の人名に使われる文字は住基ネット統一文字戸籍統一文字の中に殆ど含まれており、これらの文字は既にUnicodeへの標準化が進められている。現在、Unicodeで表せない人名用漢字は2000字未満となっている。ただし、変体仮名は未だUnicodeで標準化されていない。

また、中国語を表せないシステム(Unicode未採用または中国語フォント未使用など)において、中国や韓国の人名・地名を表すために多くの外字が使われている。

著名な外字集合[編集]

JIS X 0208の外字として使用された文字集合の一部は、標準化されたりデファクトスタンダードになった外字集合がある。

通産省外字
通産省がJIS X 0208外で必要な記号定めた外字集合であり、Macintoshなどで使用されている
Apple外字
Macintoshで使用される外字集合で、通産省外字などを含む
ARIB外字
社団法人電波産業会によりデータ放送などでの使用を規定した外字集合
人名外字
人名の苗字などで使用される漢字などを集めた外字
ラテ欄外字
ラジオやテレビの番組表用の外字集合
レコード用文字符号
レコード協会がRIS506-1996としてまとめた外字集合
iモード絵文字
DoCoMoのiモード用に作られた外字集合
EZweb絵文字
KDDIのEZweb用に作られた外字集合
SoftBank絵文字
SoftBankの携帯電話(当初はJ-Phone)用に作られた外字集合
歯科用外字
歯科用の記号をまとめた外字集合
ビブロス外字
もともとBiblosが定めていた外字集合で、一般化した
K-JIS外字
共同通信が定めた外字集合。
共同通信外字 (U-PRESS外字)
共同通信が定めた外字集合。Adobe-Japan1-6に多くが取り込まれた。

過去の外字集合[編集]

既にUnicodeに含まれるものなど。

IBM外字 
汎用機用にIBMが制定した外字集合であり、JIS X 0208に含まれない記号および漢字を定義した外字集合(IBM漢字・IBM拡張漢字)。Microsoft外字に含まれている。
NEC外字
汎用機用にNECが制定した外字集合であり、JIS X 0208に含まれない記号および漢字を定義した外字集合(NEC特殊文字、NEC選定IBM特殊文字)。Microsoft外字に含まれている。
Microsoft外字
MicrosoftのOS上でIBM外字とNEC外字を使用可能にした外字集合。JIS X 0221で「通用日本文字集合」として規格化された。
JIS2004外字
JIS X 0203:2004で規定された文字をJIS X 0208の外字として実装した外字集合

その他の外字[編集]

裁判所外字
裁判所で使われている外字[1]
エヌフォー外字集合[2]
漫画用外字
写研の写植記号に由来し、主に漫画で使われる外字。イワタアンチック体、GL-アンチックなどに搭載されている。

医学用[編集]

  • Win 外字辞書セット 医学バージョン[3]
  • エヌフォー外字DXオプションパック医学用[4]
  • エヌフォー外字DXオプションパック歯科用[4]

関連項目[編集]

出典[編集]

  1. ^ 第4回:弁護士の使う文字をペン越しに……の巻 大日本タイポ組合
  2. ^ 『CJKV日中韓越情報処理』 P.584 ケン ランディ著 小松章/逆井克己訳 2002年12月
  3. ^ Win 外字辞書セット 医学バージョン
  4. ^ a b エヌフォー外字DX オプションパック