整数型

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

整数型(せいすうがた)は、コンピュータプログラムなどのデータ型の1つまたは1群であり、整数を取り扱う。コンピュータで扱うもっとも単純な部類のデータ型のひとつである。C言語Javaなどの多くのプログラミング言語では、整数型は固定長であり、その固定サイズで表現可能な範囲の、整数有限部分集合の要素を値とする型である。また多くの言語において、標準あるいは第三者によるライブラリにより、範囲に制限のない整数も扱うことができる。

パスカルによる機械式計算機などが数をその処理の対象としていたことを考えれば、計算機械の歴史において、整数を扱うことはコンピュータ以前からの存在である。

種類[編集]

精度[編集]

データ型としての整数とは無関係に(どんな種類の整数型であっても)、数値的に言えることとして、任意の実数から4捨5入で端数処理した場合の絶対精度は ±0.5 であり、相対精度はその値を x とすると ±0.5/x である。固定長の場合は表現可能な値の範囲に制限がある。精度に関しては「正確度と精度」の記事も参照。

固定長と可変長[編集]

多くのプログラミング言語における組み込みの整数型は固定長であり、通例8ビット、16ビット、32ビット、64ビットといった、8の倍数のビット幅を持つ。また、C言語int型は処理系依存となっており、レジスタワード幅などに合わせたサイズがよく用いられる。多くの場合、目的に合わせて、いくつかの固定長サイズの整数型がある(後述)。

一方、整数の任意の値を扱うことができる、可変長の整数というものもある。一般にプロセッサが直接扱うことはできないため、C言語ではライブラリを利用する。言語仕様としてそのようなデータ型が用意されている言語もあり、一部の言語では計算結果に応じてシームレスに固定長と切り替わる(プログラマからは隠蔽されている)。大きい数を扱えることから BigNum あるいは整数であることを示す BigInt、日本語では多倍長などといった名前で呼ばれている。任意精度演算の記事も参照のこと。

符号ありと符号なし[編集]

正負両方の整数を表せる符号あり整数型と、非負(0または正)の整数だけを表せる符号なし整数型とがある。固定長では、符号あり整数型は、負数を表せるかわりに、表せる値の範囲の約半分が負の側に移動する。

符号なし整数は、ビットの並びをそのまま数値として解釈するが、符号あり整数では、負の値の表現方法にいくつか種類が存在する。また、「グレイコード」など、ビットの並びをそのまま数値として解釈するのではない整数の表現法もいくつもある。

長さ[編集]

可変長の整数型は任意の長さとなる。固定長の整数型は、通例処理系の都合によって定義される。伝統的なC言語ではshort intlong intがあり、short intの長さはintの長さ以下であればよく、long intの長さはintの長さ以上であればよい、という緩い規定だった。しかし時代の変化により、のちのC/C++標準規格ではビット数を明確化した型名が用意されるようになった(#型名の節を参照)。nビット整数型、nバイト整数型といった用語もある。#データモデルも参照。

暗号などで1024ビットや2048ビットといった程度の大きさの整数を扱うことがある。プログラムを書くだけであれば可変長整数で扱えるが、暗号では通信のスループットやレイテンシのために性能を求める場合もあり、そういう場合にはそのようなサイズを特に扱うための関数やマクロ等を定義して使うこともある。

バイトのサイズやワードのサイズ(異なるバイトがあることについては「バイト (情報) 」の記事を参照)が文脈によって明確な場合に限られるが、バイト型、ワード型、ダブルワード型、などという言いかたでも明確に表現できる。なお、ワードのサイズが不明確な場合でも、(具体的なビット数は不明だが)少なくとも「ダブルワード」はワードの倍だということはわかる。

固定小数点[編集]

固定小数点表現は、整数のあるビットとビットの間に固定された小数点があるものとして扱うことによる小数の表現法であり、一般にプログラマが整数演算を適宜組み合わせながら実装する。

文字型[編集]

ASCII文字コード体系では、7ビットですべての文字を表現可能なことから、1文字を1バイトの整数型として扱うことが可能である。英語圏のみに限れば、ASCIIで十分であった。しかし、日本語・中国語・韓国語など、文字種別の多い言語では、1文字を1バイトで表現することは不可能であり、1文字を複数バイトで表す符号化方式(マルチバイトエンコーディング)が言語ごとに考案された。さらに国際化対応の観点から、言語別の符号化方式ではなく、統一されたユニバーサルな符号化方式としてUnicodeが考案された。Javaは当初、先進的な設計としてUnicode 1.0を取り入れ、char型をUCS-2を表現する16ビットの型としたが、のちにUnicode 2.0(1996年)で導入されたサロゲートペアのために、1文字にchar2個を費やす場合が発生することになった。国際化対応の観点からは、Unicode異体字セレクタのことなども考慮すれば、"文字"という概念を単純な整数型の一種として扱うのは無謀である。

なおC言語のchar型については、何があろうと sizeof(char) が1になる型と、標準で決められている。極端な例としては、メモリのアドレス付けがバイト単位ではなく、16ビットのワード単位のアーキテクチャでも、CHAR_BIT は16になるが、sizeof(char) は1で、32ビットのintsizeof(int) が2になる。このように、charという名前ではあるが「文字型」ではなく、メモリのアドレッシングの最小単位を示す型がcharである、という役割がある。なお、C/C++のワイド文字wchar_tは長さがchar以上であることが求められているだけであり、エンコーディングに関しても規定はない。

ポインタ[編集]

ポインタはメモリアドレスを抽象化した概念だが、ポインタ型と整数型は同一ではない。C言語において、ポインタから整数および整数からポインタへの変換は処理系定義である[1]。C/C++では、2つのポインタ間の減算の結果を格納する符号付き整数型として、ptrdiff_tが定義されている。C99およびC++11規格ではvoidへのポインタと相互変換可能な整数型として、intptr_tおよびuintptr_tが定義されている。

型名[編集]

符号 ビット数 バイト数 C/C++
(C99, C++11)
C/C++
(32ビット, LLP641)
C/C++
(LP641)
Java C# SQL92 VB(Ver6以前) COBOL(代表例)
8 1 int8_t signed char2 byte sbyte
16 2 int16_t short short short smallint, int2 Integer COMP-1(1から4桁)
32 4 int32_t int
long
int int int integer, int, int4 Long COMP-1(5から9桁)
64 8 int64_t long long long
long long
long long bigint, int8 COMP-1(10から18桁)
8 1 uint8_t unsigned char2 byte tinyint, int1 Byte BINARY-CHAR UNSIGNED(機種依存)
16 2 uint16_t unsigned short char ushort COMP-1(1から4桁)
32 4 uint32_t unsigned int
unsigned long
unsigned int uint COMP-1(5から9桁)
64 8 uint64_t unsigned long long unsigned long
unsigned long long
ulong COMP-1(10から18桁)

1 C99/C++11 では int64_t などの固定幅整数型が標準化されている。特にAPIなど、移植性や相互運用性が重視されるケースで有用である。

2 C/C++ では単なる char 型の符号有/無については規定されておらず、処理系によって異なる。

データモデル[編集]

C言語において、ビット数を標準で定めていない型に対する、具体的なビット数の割り当て方をデータモデルという。

特にマイクロプロセッサの64ビット化において、intlong(とlong long)とポインタの扱いが環境によって分かれたことから、それぞれを指す用語が広く使われている。多くの16/32ビット環境と Microsoft Windows 64ビット環境ではintlongが32ビットでポインタが64ビット、すなわち IL32P64(別名:LLP64)モデルが使用されている。また、Unix 系など多くの64ビット環境では I32LP64(別名:LP64)モデルが使用されている[2]

またその他の例としては、16ビット時代のパーソナルコンピュータ用などで、intが16ビットということがある。マイコン用などでintが8ビットというものもあった(ただし、これは標準が要求している値の範囲を満たさない)。GE-600シリーズなどでは1バイトが9ビットのためcharが9ビットで整数型は全て36ビット、またCrayのようにintまで64ビットだったILP64という例もある。

参照[編集]

[ヘルプ]
  1. ^ INT36-C. ポインタから整数への変換、整数からポインタへの変換
  2. ^ 64ビットになると何が変わる?――64ビットプログラミングのデータモデル (2/2)

関連項目[編集]