ISO/IEC 6937
ISO/IEC 6937:2001, Information technology — Coded graphic character set for text communication — Latin alphabet(情報技術 — 文字コミュニケーションのためのコード化された図形文字集合 — ラテンアルファベット)は、ISO基本ラテンアルファベットにないラテン文字を表現するためにASCII(ISO/IEC 646)をマルチバイト拡張したものである。ITU-T(当時はCCITT)によってテレマティクスのために開発され、T.51として勧告された。1983年にISO標準となった。
特定のバイトコードが、ダイアクリティカルマークつきの文字のためのバイトとして使われる。第1バイトの値がダイアクリティカルマークの種別を表し、ASCIIの値を持つ第2バイトが、ダイアクリティカルマークがつく文字を表す。第1バイトと第2バイトは特定の組み合わせのみが許容され、第1バイトの解釈は第2バイトによって例外がある。ISO/IEC 6937ではダイアクリティカルマークつきの組み合わせ後の文字は1つもコード化されていない。ダイアクリティカルマークその物を表したい場合は、第2バイトにASCIIのスペースを入れる。
ISO/IEC 6937はヒュージ・マックレガー・ロス、ピーター・フェンウィック、ベルナルド・マルティ、レーク・ゼッケンドルフによって設計された。
ISO 6937/2ではラテン文字を使用する現代のヨーロッパの言語で使われている327の文字が定義されている。キリル文字・ギリシャ文字などのラテン文字ではない文字は含まれていない。ダイアクリティカルマークつきのラテン文字でも、ルーマニア語のȘ(Sコンマ)など一部は含んでいない。Sコンマについては、規格制定時にコンマビローとセディーユの区別をしていなかったので、コンマビローの代わりにセディーユを使用する。
IANAでは、ISO 6937/2のバージョンの違いに応じてISO_6937-2-25とISO_6937-2-addの2つの名称を与えている。ただし、この文字コードがインターネット上では使用されたことはない。
ISO/IEC 6937の右半分を指すISO/IEC 2022のエスケープシーケンスは ESC - R
(十六進数 1B 2D 52
)である[1]。
1バイト文字
[編集]ISO 6937/2の基本文字(0x00-0x7f)はISO 646に基づいているが、国際通貨記号(¤)に割り当てられていた0x24をドル記号($)に変更している。
!"#¤%&'()*+,-./0123456789:;<=>?@ ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_` abcdefghijklmnopqrstuvwxyz{|}
補足文字(0x80-0xff)には、字幅のあるおよび字幅のないの図形文字、追加記号と、将来の追加のための予約領域が含まれている。
2バイト文字
[編集]基本文字に含まれないアルファベットは2バイトでコード化する。第1バイトは「字幅のないダイアクリティカルマーク」(non spacing diacritical mark)で、第2バイトの基本アルファベットにそのダイアクリティカルマークをつける。例えば、アキュート・アクセントつきの小文字のe (é)は「[字幅のないアキュート・アクセント] + e」として表現される。
ISO 6937の「字幅のないダイアクリティカルマーク」は以下の13種類である。
種類 | コード | 第2バイト | 生成結果 |
---|---|---|---|
グレイヴ・アクセント | 0xC1 | AEIOUaeiou | ÀÈÌÒÙàèìòù |
アキュート・アクセント | 0xC2 | ACEILNORSUYZacegilnorsuyz | ÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź |
サーカムフレックス | 0xC3 | ACEGHIJOSUWYaceghijosuwy | ÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ |
チルダ | 0xC4 | AINOUainou | ÃĨÑÕŨãĩñõũ |
マクロン | 0xC5 | AEIOUaeiou | ĀĒĪŌŪāēīōū |
ブレーヴェ | 0xC6 | AGUagu | ĂĞŬăğŭ |
ドット | 0xC7 | CEGIZcegz | ĊĖĠİŻċėġż |
トレマ(ウムラウト) | 0xC8 | AEIOUYaeiouy | ÄËÏÖÜŸäëïöüÿ |
リング | 0xCA | AUau | ÅŮåů |
セディーユ | 0xCB | CGKLNRSTcklnrst | ÇĢĶĻŅŖŞŢçķļņŗşţ |
ダブルアキュート | 0xCD | OUou | ŐŰőű |
オゴネク | 0xCE | AEIUaeiu | ĄĘĮŲąęįų |
ハーチェク | 0xCF | CDELNRSTZcdelnrstz | ČĎĚĽŇŘŠŤŽčďěľňřšťž |
符号表
[編集]UnicodeでU+0300—U+036Fの範囲にある結合文字は、ISO/IEC 6937では0xC1—0xCFにあり、第1バイト(lead byte)としてのみ使用される。この範囲にあるダイアクリティカルマークがついた文字は、組み合わせ済みの文字とさてはコード化されていない。ダイアクリティカルマークの組み合わせで表現できない文字については、コード化されている。
例外的に、「セディーユつきの小文字のg」はアキュート・アクセント(0xC2)を第1バイトとする。これは、「セディーユつきの小文字のg」は、Ģ ģのように「g」の上にカンマを逆にしたものを付けた形になるためである。
Unicodeでは大文字のĐ(ストローク付きD)とÐ(エズ)を区別しているが、ISO/IEC 6937では区別せずに0xE2を割り当てている。小文字は字形が異なるため、ストローク付きD(đ)に0xF2、エズ(ð)に0xF3と別のコードを割り当てている。
凡例:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
_ | 00 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
_ | 116 |
17 |
18 |
19 |
21 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
_ | 2SP 0020 32 |
! 0021 33 |
" 0022 34 |
# 0023 35 |
$ 0024 36 |
% 0025 37 |
& 0026 38 |
' 0027 39 |
( 0028 40 |
) 0029 41 |
* 002A 42 |
+ 002B 43 |
, 002C 44 |
- 002D 45 |
. 002E 46 |
/ 002F 47 |
_ | 30 0030 48 |
1 0031 49 |
2 0032 50 |
3 0033 51 |
4 0034 52 |
5 0035 53 |
6 0036 54 |
7 0037 55 |
8 0038 56 |
9 0039 57 |
: 003A 58 |
; 003B 59 |
< 003C 60 |
= 003D 61 |
> 003E 62 |
? 003F 63 |
_ | 4@ 0040 64 |
A 0041 65 |
B 0042 66 |
C 0043 67 |
D 0044 68 |
E 0045 69 |
F 0046 70 |
G 0047 71 |
H 0048 72 |
I 0049 73 |
J 004A 74 |
K 004B 75 |
L 004C 76 |
M 004D 77 |
N 004E 78 |
O 004F 79 |
_ | 5P 0050 80 |
Q 0051 81 |
R 0052 82 |
S 0053 83 |
T 0054 84 |
U 0055 85 |
V 0056 86 |
W 0057 87 |
X 0058 88 |
Y 0059 89 |
Z 005A 90 |
[ 005B 91 |
\ 005C 92 |
] 005D 93 |
^ 005E 94 |
_ 005F 95 |
_ | 6` 0060 96 |
a 0061 97 |
b 0062 98 |
c 0063 99 |
d 0064 100 |
e 0065 101 |
f 0066 102 |
g 0067 103 |
h 0068 104 |
i 0069 105 |
j 006A 106 |
k 006B 107 |
l 006C 108 |
m 006D 109 |
n 006E 110 |
o 006F 111 |
_ | 7p 0070 112 |
q 0071 113 |
r 0072 114 |
s 0073 115 |
t 0074 116 |
u 0075 117 |
v 0076 118 |
w 0077 119 |
x 0078 120 |
y 0079 121 |
z 007A 122 |
{ 007B 123 |
| 007C 124 |
} 007D 125 |
~ 007E 126 |
DEL 007F 127 |
_ | 8128 |
129 |
130 |
131 |
132 |
133 |
134 |
135 |
136 |
137 |
138 |
139 |
140 |
141 |
142 |
143 |
_ | 9144 |
145 |
146 |
147 |
148 |
149 |
150 |
151 |
152 |
153 |
154 |
155 |
156 |
157 |
158 |
159 |
_ | ANBSP 00A0 160 |
¡ 00A1 161 |
¢ 00A2 162 |
£ 00A3 163 |
164 |
¥ 00A5 165 |
166 |
§ 00A7 167 |
¤ 00A4 168 |
‘ 2018 169 |
“ 201C 170 |
« 00AB 171 |
← 2190 172 |
↑ 2191 173 |
→ 2192 174 |
↓ 2193 175 |
_ | B° 00B0 176 |
± 00B1 177 |
² 00B2 178 |
³ 00B3 179 |
× 00D7 180 |
µ 00B5 181 |
¶ 00B6 182 |
· 00B7 183 |
÷ 00F7 184 |
’ 2019 185 |
” 201D 186 |
» 00BB 187 |
¼ 00BC 188 |
½ 00BD 189 |
¾ 00BE 190 |
¿ 00BF 191 |
_ | C192 |
̀ 0300 193 |
́ 0301 194 |
̂ 0302 195 |
̃ 0303 196 |
̄ 0304 197 |
̆ 0306 198 |
̇ 0307 199 |
̈ 0308 200 |
201 |
̊ 030A 202 |
̧ 0327 203 |
204 |
̋ 030B 205 |
̨ 0328 206 |
̌ 030C 207 |
_ | D― 2015 208 |
¹ 00B9 209 |
® 00AE 210 |
© 00A9 211 |
™ 2122 212 |
♪ 266A 213 |
¬ 00AC 214 |
¦ 00A6 215 |
216 |
217 |
218 |
219 |
⅛ 215B 220 |
⅜ 215C 221 |
⅝ 215D 222 |
⅞ 215E 223 |
_ | EΩ 2126 224 |
Æ 00C6 225 |
Đ 0110 226 |
ª 00AA 227 |
Ħ 0126 228 |
229 |
IJ 0132 230 |
Ŀ 013F 231 |
Ł 0141 232 |
Ø 00D8 233 |
Œ 0152 234 |
º 00BA 235 |
Þ 00DE 236 |
Ŧ 0166 237 |
Ŋ 014A 238 |
ʼn 0149 239 |
_ | Fĸ 0138 240 |
æ 00E6 241 |
đ 0111 242 |
ð 00F0 243 |
ħ 0127 244 |
ı 0131 245 |
ij 0133 246 |
ŀ 0140 247 |
ł 0142 248 |
ø 00F8 249 |
œ 0153 250 |
ß 00DF 251 |
þ 00FE 252 |
ŧ 0167 253 |
ŋ 014B 254 |
SHY 00AD 255 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
出典
[編集]- ^ Supplementary Set of ISO/IEC 6937:1992 The high-ASCII half of the character set. (The left-hand side is U.S. ASCII.)