Shift_JIS-2004

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ナビゲーションに移動 検索に移動

Shift_JIS-2004は、日本の文字を符号化するのに使われる文字コードである。JIS X 0213の符号化方式のひとつである。JIS X 0213:2004の附属書1で定義されている。

JIS X 0208の符号化方式のひとつであるShift_JISと同様に、JIS X 0201の1バイト文字とJIS X 0213の2バイト文字とを組み合わせて運用する符号化方式である。Shift_JISの上位互換となっている。

JIS X 0213には94文字×94文字のが2つあるが、JIS X 0208の上位互換である第1面はShift_JISの第1バイト0xEFまでの範囲に収まる。面区点番号からShift_JIS-2004のバイト値を求める際、この範囲までの計算方法はShift_JISと同じである。Shift_JIS-2004ではさらに、第2面 (第4水準漢字) を収録するために、第1バイト0xF0から0xFCまでの範囲を用いる。2面で、区番号が1, 3, 4, 5, 8, 12, 13, 14, 15 のときは、第1バイトは (区番号 + 0x1DF) ÷ 2 − (区番号 ÷ 8) × 3 となる。区番号が78から94までのときは、第1バイトは (区番号 + 0x19B) ÷ 2 となる。こうしてJIS X 0213の11,233文字全てを2バイトで表現する。

なお、JIS X 0213の初版 (2000年) では、この符号化方式はShift_JISX0213と命名されていた。2004年改正で追加されたUCS互換漢字10文字の有無だけが異なるが、大きな違いではないためShift_JIS-2004と同一視されることもある。

計算方法[編集]

面区点番号からShift_JIS-2004の第1・第2バイトは以下の通り求められます。[1]

面番号を m、区番号を k、点番号を t とする。また、記号 ÷ は整数除算 (小数点以下切捨て)を表す。

第1バイト(S1)は、以下による:

  1. m = 1 で 1 ≦ k ≦ 62 のとき, S1 = (k + 0x101) ÷ 2.
  2. m = 1 で 63 ≦ k ≦ 94 のとき, S1 = (k + 0x181) ÷ 2.
  3. m = 2 で, k = 1, 3, 4, 5, 8, 12, 13, 14, 15 のとき, S1 = (k + 0x1df) ÷ 2 - (k ÷ 8) × 3.
  4. m = 2 で, 78 ≦ k ≦ 94 のとき, S1 = (k + 0x19b) ÷ 2.

第2バイト(S2)は、以下による:

  1. k が奇数の場合:
    1. 1 ≦ t ≦ 63 のとき, S2 = t + 0x3f.
    2. 64 ≦ t ≦ 94 のとき, S2 = t + 0x40.
  2. k が偶数の場合, S2 = t + 0x9e.

Windows-31Jとの非互換[編集]

Shift_JIS-2004は、Windows-31Jとは併用できない符号化方式である。

Shift_JIS Windows-31J Shift_JIS-2004
JIS X 0208 JIS X 0208 JIS X 0213に含まれる。
未定義 NEC特殊文字 (0x8740 - 0x879C) JIS X 0213に含まれる。
ただし、重複分は削除されている(「≒」「≡」「∫」「Σ」「√」「⊥」「∠」「∵」「∩」「∪」)。
「∑ (N-ARY SUMMATION)」はギリシャ大文字シグマ「Σ」で代用。
また、同領域に追加されている文字がある(「Ⅺ」「Ⅻ」)。
未定義 NEC選定IBM拡張文字 (0xED40 - 0xEEFC)は、JIS X 0213の1面で使用されており、併用できない。
未定義 ユーザー定義外字領域 (0xF040 - 0xF9FC)は、JIS X 0213の2面で使用されており、併用できない。
未定義 IBM拡張文字 (0xFA40 - 0xFC4B)は、JIS X 0213の2面で使用されており、併用できない。

関連項目[編集]

脚注[編集]

[ヘルプ]
  1. ^ JIS X 0213の代表的な符号化方式 § Shift_JIS-2004” (日本語). 2019年4月27日閲覧。 Hexadecimal numbers in the source have been converted to decimal for display.

外部リンク[編集]