EBCDIC
EBCDIC (Extended Binary Coded Decimal Interchange Code) はIBMにより定義された文字コードである。ゾーン形式2進化10進数をベースにした二進化十進数(BCD、Binary-coded decimal)を拡張する形で作られたものである。読み方は「エビシディック」であり、この読み方は日本だけでなく、英語圏でも同様である。日本では「エビスディック」と読まれる事も多い。
7ビットで全文字を表現できない欠点があるため、GR表現を使ってJIS漢字と混在して表現出来ない。ゆえにASCIIと比べると非常に扱いにくい1バイトコードである。
現在でも各コンピュータベンダのメインフレーム及びオフコンにおいて使用されている。
[編集] 文字コードの配置
| 00 | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | A0 | B0 | C0 | D0 | E0 | F0 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | sp | & | - | 0 | ||||||||||||
| 1 | / | A | J | 1 | ||||||||||||
| 2 | B | K | S | 2 | ||||||||||||
| 3 | C | L | T | 3 | ||||||||||||
| 4 | D | M | U | 4 | ||||||||||||
| 5 | E | N | V | 5 | ||||||||||||
| 6 | F | O | W | 6 | ||||||||||||
| 7 | G | P | X | 7 | ||||||||||||
| 8 | H | Q | Y | 8 | ||||||||||||
| 9 | I | R | Z | 9 | ||||||||||||
| A | : | |||||||||||||||
| B | . | , | # | |||||||||||||
| C | < | * | % | @ | ||||||||||||
| D | ( | ) | _ | ' | ||||||||||||
| E | + | ; | > | = | ||||||||||||
| F | ? | " |
本来は上に示した表内の58文字のみが規定されているが、各社それぞれの拡張を行い、英小文字・半角カナ・一部記号を未定義の位置に追加していることがある。ただし、この場合は英小文字と半角カナを同時に利用できない。
また、これとは別に日立製作所が英小文字と半角カナ文字を同時に利用出来るように拡張をしたコードをEBCDIKと言うが、この他にもたくさんのベンダ毎の(英小文字と半角カナ文字が同時に利用できる)拡張コードが存在する。
- カナ拡張されたEBCDICコードの例(IBMによるカナ拡張の一例;コードページ:298の場合)
| 00 | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | A0 | B0 | C0 | D0 | E0 | F0 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | sp | & | - | コ | テ | ハ | ム | リ | { | } | ¥ | 0 | ||||
| 1 | ゥ | / | サ | a | j | ~ | ル | A | J | 1 | ||||||
| 2 | 。 | ェ | イ | シ | b | k | s | レ | B | K | S | 2 | ||||
| 3 | 「 | ォ | ウ | ス | c | l | t | ロ | C | L | T | 3 | ||||
| 4 | 」 | ャ | エ | セ | d | m | u | ワ | D | M | U | 4 | ||||
| 5 | 、 | ュ | オ | ソ | e | n | v | ン | E | N | V | 5 | ||||
| 6 | ・ | ョ | カ | タ | f | o | w | ゛ | F | O | W | 6 | ||||
| 7 | ヲ | ッ | キ | チ | g | p | x | ゜ | G | P | X | 7 | ||||
| 8 | ァ | ー | ク | ツ | h | q | y | H | Q | Y | 8 | |||||
| 9 | ィ | ア | ケ | ` | i | r | z | I | R | Z | 9 | |||||
| A | ¢ | ! | ¦ | : | ト | ヒ | メ | |||||||||
| B | . | $ | , | # | ナ | フ | モ | |||||||||
| C | < | * | % | @ | ニ | ヘ | ヤ | |||||||||
| D | ( | ) | _ | ' | ヌ | ホ | ユ | |||||||||
| E | + | ; | > | = | ネ | マ | ヨ | |||||||||
| F | │ | ¬ | ? | " | ノ | ミ | ラ |
ひらがなや漢字などが扱えるよう、さらなるコード拡張を独自に行なっている例もある。
が、EBCDICのコード拡張には、JIS漢字のような日本語を扱う為の標準規格が存在しない為に、アーキテクチャの異なるコンピュータ間での文字データのやり取りに、支障をきたす場合がある。
特に、JIS漢字に基づいて動作しているコンピュータとの記録媒体を介したやり取りや、インターネット越しの通信を行なう場合は、適切な文字コード変換ができないのが原因で文字化けなどの問題に繋がりやすい。
[編集] 制御文字コードの配置
EBCDICにおいてもASCIIと同様、通信処理の制御や周辺機器の制御などの目的に用いる文字コードが存在する。割り当て範囲は、16進数表現の00hから3Fhの間と0FFh。
- IBMによるカナ拡張の一例(コードページ:298)と組み合わせた場合のコード表
| 00 | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | A0 | B0 | C0 | D0 | E0 | F0 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | NUL | DLE | DS | (予約) | sp | & | - | コ | テ | ハ | ム | リ | { | } | ¥ | 0 |
| 1 | SOH | DC1 | SOS | (予約) | ゥ | / | サ | a | j | ~ | ル | A | J | 1 | ||
| 2 | STX | DC2 | FS | SYN | 。 | ェ | イ | シ | b | k | s | レ | B | K | S | 2 |
| 3 | ETX | DC3 | WUS | IR | 「 | ォ | ウ | ス | c | l | t | ロ | C | L | T | 3 |
| 4 | SEL | RES/ENP | BYP/INP | PP | 」 | ャ | エ | セ | d | m | u | ワ | D | M | U | 4 |
| 5 | HT | NL | LF | TRN | 、 | ュ | オ | ソ | e | n | v | ン | E | N | V | 5 |
| 6 | RNL | BS | ETB | NBS | ・ | ョ | カ | タ | f | o | w | ゛ | F | O | W | 6 |
| 7 | DEL | POC | ESC | EOT | ヲ | ッ | キ | チ | g | p | x | ゜ | G | P | X | 7 |
| 8 | GE | CAN | SA | SBS | ァ | ー | ク | ツ | h | q | y | H | Q | Y | 8 | |
| 9 | SPS | EM | SFE | IT | ィ | ア | ケ | ` | i | r | z | I | R | Z | 9 | |
| A | RPT | UBS | SM/SW | RFF | ¢ | ! | ¦ | : | ト | ヒ | メ | |||||
| B | VT | CU1 | CSP | CU3 | . | $ | , | # | ナ | フ | モ | |||||
| C | FF | IFS | MFA | DC4 | < | * | % | @ | ニ | ヘ | ヤ | |||||
| D | CR | IGS | ENQ | NAK | ( | ) | _ | ' | ヌ | ホ | ユ | |||||
| E | SO/LS1 | IRS | ACK | (予約) | + | ; | > | = | ネ | マ | ヨ | |||||
| F | SI/LS0 | IUS/ITB | BEL | SUB | │ | ¬ | ? | " | ノ | ミ | ラ | EO |
ASCIIと共通の機能名称を持つ制御文字コードがある反面、プリンタ等の基本的な改行制御に関わる制御文字コードの個数に差異があるといった違いもある。
EBCDIC:CR=Carriage Return、NL=New Line、LF=Line Feed、FF=Form Feed(計4種類)
ASCII:CR=Carriage Return、LF=Line Feed、FF=Form Feed(計3種類)
[編集] 外部リンク
- IBM Code Pages IBM社による各コードページの説明(英語、PDF形式)
- IBM CDRA Reference Appendix A. Encoding Schemes(IBMのコード化体系の説明、英語)
- IBM/System i Globalization/IBM Control Codes/Control character Mappings (IBM社による制御文字コードの説明文、英語)
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||