KPS 9566

出典: フリー百科事典『ウィキペディア(Wikipedia)』

これはこのページの過去の版です。Gminky (会話 | 投稿記録) による 2016年2月11日 (木) 17:07個人設定で未設定ならUTC)時点の版であり、現在の版とは大きく異なる場合があります。

KPS 9566
各種表記
ハングル 국규 9566
漢字 國規 9566
英称 KPS 9566
テンプレートを表示

KPS 9566は、朝鮮民主主義人民共和国(北朝鮮)で使用される朝鮮語文字コードである。北朝鮮の国家規格で制定され、2003年に制定されたKPS 9566-2003が最新のものである。1993年に制定されたKPS 9566-93は、1997年以降の標準規格とは多くの部分で異なるため、ほとんど使われていない。

KPS 9566-2000をサポートする唯一の文字符号化方式としてEUC-KPがあるが、これはEUC-KRと似ており、KS X 1001をKPS 9566に変えたものである。しかしKPS 9566をサポートするプログラムがほとんど存在しないため、代わりにEUC-KRを使用しており、文字集合自体は国際標準などで参照用途として使用することが多い。

KPS 9566-2000のコード構成

0x2468等における太字の「金」の例
0x312Eにおける通常の「金」の例

KPS 9566-2000は94×94の文字集合であり、整列を除いた全体的な構造はKS X 1001と類似する。

  • 0x21 ~ 0x2C: 特殊文字領域(符号、絵文字、チョソングルの字母、平仮名片仮名ギリシア文字キリル文字など)
  • 0x2F: ユーザー定義領域
  • 0x30 ~ 0x4C: チョソングル領域(よく使われる2679字を北朝鮮の字母配列に従って配列されている)
  • 0x4D ~ 0x7E: 漢字領域(4653字をチョソングルの読音の順序に従って配列されている)
  • 0x4C行と0x7E行の0x50列からは、それぞれユーザー定義の領域B・Cとなっている。

KPS 9566-2000に割り当てられた8259字のうち、83字がUnicodeに収録されていない(いくつかはUnicode 4.0で追加された)。そのうち77字が特殊記号であり、あと6字は0x24行の0x68列から0x6D列まで配置された、重複するチョソングル(、つまり金日成金正日の名)である。この6字は太字になった状態で収録されている。

KPS 9566-2003のコード構成

KPS 9566-2003はISO/IEC 2022に準拠した94×94の文字集合ではないUHCに類似の方法で現代朝鮮文字すべてを収録している。その他、

  • ISO 8859-1にあり、KPS 9566-2000までにはなかった文字をすべて追加した。
  • Unicode 4.0で追加された文字に関してマッピングを変更した。
  • ケルビン度記号 (°K) をユーロ記号に差し替えた。

等の変更がある。

外部リンク