バイト (情報)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

バイト(Byte)は、デジタルコンピュータにおいて情報の大きさを表すために使われる単位である。

現今では、一般的には、1バイトは2進数の8桁、即ち8ビット(bit)を意味することがほとんどである。この場合、連続した256(28)個の整数(符号無しで0から255、符号付きで-128から+127、など)を表すことができる。

本来バイトとは、欧文文字1字分の文字コードを表現するために用いるビット数のことをいい、扱う文字種や、あるいはワードサイズをいくつかに分割することによって決められ、その大きさは処理系によって異なる。歴史的には5ビットから12ビットまであったといわれ、初期のコンピュータの多くでは6ビット、また7ビットや9ビットとして扱うコンピュータもあった(DEC PDP-10NEC ACOS-6など)。しかし、大型汎用機で市場を席巻したIBM System/360アーキテクチャが8ビットバイトを採用していたことや、1980年代以降8ビットマイクロプロセッサを用いたマイクロコンピュータが爆発的に普及したこともあり、一般的には1バイトは8ビットであると認識されるに至った。このため、例えば情報通信の分野などにおいて、情報量の単位として特に8ビットであることを明示する(曖昧さを無くする)必要がある場合は「オクテット」の語を用いる。

バイトは主にコンピュータ電子媒体の容量を表すために用いられる。また、メモリ空間におけるアドレス(番地あるいは座標) は通常1バイト毎に振られており、相対座標(オフセット)の単位としても使われる。

単位として用いられる場合には、Bと略記され、同様にビットは小文字のbと略記されることがあるが、SI接頭辞が付かない単なるバイトやビットにおいては、意味が通じなかったり、誤解を招いたりする恐れがあるため、それぞれByte(Bytes)、bit(bits)と表記されることが望ましい。大きな情報量を表現する場合にはキロ、メガなどの2進接頭辞またはSI接頭辞と共に使用される。1キロバイト(KB)は、場合によって1,000バイトとして扱われる場合と1,024(210)バイトとして扱われる場合がある。2進接頭辞を使って1キビバイト(KiB)と表記した場合は必ず1,024バイトである。

バイトは情報量が1バイトの情報自体を指しても使用される。例えば「指定のバイトを読む」、「バイトを処理する」と使用される。

1バイトを4ビット単位で処理する分野では、特に4ビット即ち1/2バイトをニブルと言う事がある。逆に2バイト、4バイトなどをワード(語)と言うことがある。

Shift_JISでは、半角の英数カナ文字1文字が1バイト、漢字などの全角文字は1文字が2バイトである。EUC-JPUTF-8においては、半角/全角といった文字幅ではバイト数が一定に決まらない。

関連項目[編集]

バイトの単位一覧
SI接頭辞 2進接頭辞
単位(記号) 慣用値 SI基準 単位(記号) SIとの(概数)
キロバイト (kB) 210 103 キビバイト (KiB) 210 2.400000%
メガバイト (MB) 220 106 メビバイト (MiB) 220 4.857600%
ギガバイト (GB) 230 109 ギビバイト (GiB) 230 7.374182%
テラバイト (TB) 240 1012 テビバイト (TiB) 240 9.951163%
ペタバイト (PB) 250 1015 ペビバイト (PiB) 250 12.589991%
エクサバイト (EB) 260 1018 エクスビバイト (EiB) 260 15.292150%
ゼタバイト (ZB) 270 1021 ゼビバイト (ZiB) 270 18.059162%
ヨタバイト (YB) 280 1024 ヨビバイト (YiB) 280 20.892582%