拡張漢字

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

拡張漢字(かくちょうかんじ)とは、文字コード(漢字コード)において何らかの形でもとから含まれていた漢字に追加された漢字をいう。

ユニコードにおける拡張漢字[編集]

ユニコードにおける拡張漢字とは、最初(1993年5月)に制定されたユニコードの規格であるUnicode 1.0に存在したCJK統合漢字、20,902字に対してまとまった形で追加されていった漢字集合のことを言い、以下のものがある。

CJK統合漢字拡張A (CJK Unified Ideographs Extension A)[1]
1999年9月制定のUnicode 3.0(ISO/IEC 10646-1:2000に対応)において基本多言語面のU+3400-U+4DBFのブロック(Unicode 1.1までハングルを定義していた場所)に追加された6,582字。当初は6,584文字の予定であったが、そのうち2文字が互換漢字領域にあったため、互換領域の2文字を拡張Aとして扱うことにして、この2文字は追加集合からは削除された。主として使用頻度の低い漢字が含まれ、JIS X 0213に一部対応しており、地名や人名などに用いられる漢字が含まれている。
CJK統合漢字拡張B (CJK Unified Ideographs Extension B)[2]
2001年3月制定のUnicode 3.1(ISO/IEC 10646-2:2001に対応)において追加漢字面のU+20000-U+2A6FFのブロックに追加された漢字42,711字。Unicodeの拡張漢字集合では最も字数が多く、その大部分は日常ではまず用いられない漢字であるが、JIS X 0213に一部対応しており、地名や人名などに用いられる漢字が含まれている。また拡張B以降の集合には、かつてベトナムで用いられていたチュノムも含まれる。非常に膨大な漢字集合を極めて短期間のうちに定めたため、漢字の重複が多数見られる。
CJK統合漢字拡張C (CJK Unified Ideographs Extension C)[3]
2008年12月に発行されたISO/IEC 10646:2003 (UCS) の追補5に含まれており、Unicode 5.2(2009年10月制定)から対応。符号位置は、追加漢字面のU+2A700-U+2B7FFの範囲が予約されていたが、実際に追加されたのはU+2A700-U+2B734の4,149文字。
CJK統合漢字拡張D (CJK Unified Ideographs Extension D)[4]
2010年に発行されたISO/IEC 10646ではISO/IEC 10646:2010に含まれており、Unicode 6.0(2010年10月制定)から対応。符号位置は、追加漢字面のU+2B800-U+2F7FFの範囲が予約されていたが、実際に追加されたのはU+2B740-U+2B81Dの222字。
CJK統合漢字拡張E (CJK Unified Ideographs Extension E)[5]
2014年9月に発行されたISO/IEC 10646:2014に含まれており、Unicode 8.0(2015年6月制定)から対応。符号位置は、追加漢字面のU+2B820-U+2CEA1の5,762字。
CJK統合漢字拡張F (CJK Unified Ideographs Extension F)
拡張E以降に追加されることが計画されている漢字。Unicode、ISO/IEC 10646ともにどのバージョンから対応するのかは現時点では未定。符号位置は、追加漢字面のU+2CBE0-U+2EBEFが予定されている。文字基盤整備事業から提案された約1,800字や大蔵経テキストデータベース委員会から提案された約4,000字の収録が予定されている[6]。また拡張Fには、チワン語プイ語で用いられている伝統的な古壮字も含まれる予定。

JIS拡張漢字[編集]

JIS X 0213は、規格の正式名称が「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」であり、内容的にもJIS X 0208に対する拡張という性格を持っているためJIS拡張漢字と呼ばれる。

ベンダ選定拡張漢字[編集]

主としてメインフレームで使用するためのベンダごとの文字コードを作成した際にJIS X 0208 (JIS C 6226) に対して拡張する形で追加されたものをいう[7]。追加された文字をベンダごとに見ると共通する漢字も多いものの互換性はない。このうちNECにより追加されたものとIBMにより追加されたものについては(IBM漢字)としてそのシェアの大きさからWindowsに取り込まれて共通に使用することが出来るようになり、それ以後の規格の制定・改正にも影響を与えることになった[8]

その他の拡張漢字[編集]

フォントファイルの形で持つようになる以前のパソコンにおいて漢字を使用するためには漢字ROMチップ等のハードウエアを装備している必要があり、ハードウエアの増設によって使用できるようになる漢字を拡張漢字と呼ぶことがあった。

脚注[編集]

[ヘルプ]
  1. ^ CJK Unified Ideographs Extension A” (英語). Unicode Consortium. 2013年10月19日閲覧。
  2. ^ CJK Unified Ideographs Extension B” (英語). Unicode Consortium. 2013年10月19日閲覧。
  3. ^ CJK Unified Ideographs Extension C” (英語). Unicode Consortium. 2013年10月19日閲覧。
  4. ^ CJK Unified Ideographs Extension D” (英語). Unicode Consortium. 2013年10月19日閲覧。
  5. ^ CJK Unified Ideographs Extension E” (英語). Unicode Consortium. 2015年6月20日閲覧。
  6. ^ 「JIS X 0221:2014 解説 5 懸案事項」『JIS X 0221:2014』日本規格協会、2014年、p. 169。
  7. ^ 文字コード#ベンダごとの文字コードを参照
  8. ^ Microsoftコードページ932#NEC特殊文字・IBM拡張文字を参照

関連項目[編集]

外部リンク[編集]

  • CJK統合漢字拡張A-D対応フォント「Sun-ExtA」「Sun-ExtB」。Sun-ExtA.ttfに拡張Aが、Sun-ExtB.ttfに拡張B・C・Dが収録されている。
  • 花園明朝 ユーザーによるOTF版の開発 - HanaMinAFDKO-4.082.zipに「花園明朝 A Regular」「花園明朝 B Regular」、HanaMinExtAFDKO-4.082.zipに「花園明朝 AX Regular」「花園明朝 BX Regular」が入っており、名称にAと付いているものは拡張A、名称にBと付いているものは拡張B・C・Dに対応する。
  • VietUnicode (sourceforge.net) - CJK統合漢字拡張A・B対応フォント「HAN NOM A」「HAN NOM B」。hannom.zipまたはhannomH.zipに両方のフォントが収録されており、後者のほうが高品質。
  • BabelStone Fonts - CJK統合漢字拡張C・D対応フォント「BabelStone Han」
  • グリフウィキ - UCS全漢字。拡張A-E対応フォントをダウンロードできる。