ISO/IEC 8859-6
ISO 8859-6 (別名Arabic) は8ビットの文字コードで、ISO 8859規格の一部である。本来はアラビア文字を使う言語をカバーするために設計されたが、多くの必要なグリフが欠けており、それゆえ広く使われることもなかった。最近ではUnicodeに道を譲っている。この文字コードで書かれたテキストを表示するにはアラビア語の結合処理が必要である。
ISO_8859-6:1987 (その推奨MIME名であるISO-8859-6のほうが有名) はこの規格を (RFCには視覚 (左から右) 順序と記述されているにもかかわらず) 論理順序で使ったものと、C0 (0x00–0x1F) とC1 (0x80–0x9F) 部にISO/IEC 6429からの制御符号を使ったものからなるIANAキャラクタセットである。(ISO/IEC 6429やISO/IEC 2022からの) エスケープシーケンスは解釈されない。このキャラクタセットのテキストは論理順序なので、表示にはBiDi処理が必要である。このキャラクタセットにはiso-ir-127、ISO_8859-6、ECMA-114、ASMO-708、ArabicおよびcsISOLatinArabicという別名がある。名前の後ろに -e や -i を付けることによって、明示的もしくは暗黙に書字方向を指定したバージョンも存在する。
| ISO/IEC 8859-6 | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
| 0x | 未使用 | |||||||||||||||
| 1x | ||||||||||||||||
| 2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
| 5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
| 6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
| 7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
| 8x | 未使用 | |||||||||||||||
| 9x | ||||||||||||||||
| Ax | NBSP | ¤ | ، | SHY | ||||||||||||
| Bx | ؛ | ؟ | ||||||||||||||
| Cx | ء | آ | أ | ؤ | إ | ئ | ا | ب | ة | ت | ث | ج | ح | خ | د | |
| Dx | ذ | ر | ز | س | ش | ص | ض | ط | ظ | ع | غ | |||||
| Ex | ـ | ف | ق | ك | ل | م | ن | ه | و | ى | ي | ً | ٌ | ٍ | َ | ُ |
| Fx | ِ | ّ | ْ | |||||||||||||
上記の表で、20は通常のSPACE文字で、A0はNO-BREAK SPACEである。ADはSOFT HYPHENで、適合するWebブラウザでは何も表示されるべきでない。
符号値 0x00–0x1F, 0x7F, 0x80–0x9F, 0xA1–0xA3, 0xA5–0xAB, 0xB0–0xBA, 0xBC–0xBE, 0xC0, 0xDC–0xDF, および 0xF3–0xFF には、ISO/IEC 8859-6では文字が割り当てられていない。
符号値 0xEB–0xF2 には結合文字が割り当てられている。
外部リンク [編集]
- ISO/IEC 8859-6:1999 (英語)
- Standard ECMA-114: 8-Bit Single-Byte Coded Graphic Character Sets - Latin/Arabic Alphabet 2nd edition (2000年12月) (英語)
- ISO-IR 127 Right-Hand Part of Latin/Arabic Alphabet (1986年11月30日) (英語)