バイト (情報)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

バイト(Byte)は、デジタルコンピュータで情報の大きさを表すために使われる単位である。

1980年頃からは、1バイトは2進数の8桁、即ち8ビット(bit)を意味することが一般的である。この場合、連続した256(28)個の整数(符号無しで0から255、符号付きで-128から+127、など)を表すことができる。

概要[編集]

本来バイトとは、欧文文字1字分の文字コードを表現するために用いるビット数のことを言う。その大きさは8ビット固定ではなく、扱う文字種や、あるいはワードサイズをいくつかに分割することによって決められ、処理系によって異なる。歴史的には5ビットから12ビットまで存在したと言われる。DEC PDP-10NEC ACOS-6など、初期のコンピュータの多くでは6ビット、また7ビットや9ビットとして扱うコンピュータもあった。

しかし、大型汎用機で市場を席巻したIBM System/360アーキテクチャが8ビットバイトを採用していたことや、1980年代以降8ビットマイクロプロセッサを用いたマイクロコンピュータが爆発的に普及したこともあり、一般的には1バイトは8ビットであると認識されている。このため、例えば情報通信の分野などで、情報量の単位として曖昧さを排除し8ビットであることを明示する必要がある場合は、「オクテット」の語を用いる。

なお、2バイト、4バイトなどをワード(語)と言うことがある。また、1バイトを4ビット単位で処理する分野では、4ビットすなわち1/2バイトをニブルと呼ぶ。

バイトは主にコンピュータ電子媒体の容量を表すために用いられる。また、メモリ空間アドレス(番地あるいは座標) は通常1バイト毎に振られており、相対座標(オフセット)の単位としても使われる。情報量が1バイトの情報自体を指しても使われ、例えば「指定のバイトを読む」「バイトを処理する」などの言い回しに使用される。

単位として用いられる場合には、Bと略記され、同様にビットは小文字のbと略記されることがある。ただし、SI接頭辞が付かない単なるバイトやビットは、意味が通じなかったり、誤解を招いたりする恐れがあるため、それぞれByte(Bytes)、bit(bits)と表記されることが望ましい。大きな情報量を表現する場合にはキロ、メガなどの2進接頭辞またはSI接頭辞と共に使用される。1キロバイト(KB)は、場合によって1,000バイトとして扱われる場合と1,024(210)バイトとして扱われる場合がある。2進接頭辞を使って1キビバイト(KiB)と表記した場合は必ず1,024バイトである。

Shift_JISでは、半角の英数カナ文字1文字が1バイト、漢字などの全角文字は1文字が2バイトである。EUC-JPUTF-8は、半角/全角といった文字幅ではバイト数が一定に決まらない。

符号位置[編集]

Unicodeには全角幅での単位記号も収録されている。一部、Unicodeに含まれずMacJapaneseに収録。

記号 Unicode JIS X 0213 文字参照 名称
U+3385 - ㎅
㎅
キロバイト
U+3386 - ㎆
㎆
メガバイト
U+3387 - ㎇
㎇
ギガバイト
TB MacJapanese:0x865D
CSS:font-feature-settings='dlig' 1
テラバイト

関連項目[編集]

バイトの単位一覧
SI接頭辞 2進接頭辞
単位(記号) 慣用値 SI基準 単位(記号) SIとの(概数)
キロバイト (kB) 210 103 キビバイト (KiB) 210 2.400000%
メガバイト (MB) 220 106 メビバイト (MiB) 220 4.857600%
ギガバイト (GB) 230 109 ギビバイト (GiB) 230 7.374182%
テラバイト (TB) 240 1012 テビバイト (TiB) 240 9.951163%
ペタバイト (PB) 250 1015 ペビバイト (PiB) 250 12.589991%
エクサバイト (EB) 260 1018 エクスビバイト (EiB) 260 15.292150%
ゼタバイト (ZB) 270 1021 ゼビバイト (ZiB) 270 18.059162%
ヨタバイト (YB) 280 1024 ヨビバイト (YiB) 280 20.892582%