列挙型
列挙型(れっきょがた、enumerated type)とは、コンピュータプログラミングにおいて、プログラマが選んだ各々の識別子をそのまま有限集合として持つ抽象データ型である。列挙型は一般に番号順を持たないカテゴリ変数(カードの組のように)として使われる。実行時には、列挙型は整数で実装されることが多い(各々の識別子は異なる整数値を持つ)。
また列挙型は、整数を使用する場合と比較して、明示的にマジックナンバーを使用するよりもプログラムソースの可読性を改善するのに役立つ。言語によっては、列挙型の整数表現はプログラマに見えないようになっていることもあり、これによりプログラマが列挙値に対して算術演算を行うような乱用を防いでいる。
言語によっては、真偽値の論理型は、あらかじめ宣言された二値の列挙型とされている。
Pascalおよび類似言語
Pascalでは、列挙型は括弧で括られたリストで値を暗黙のうちに宣言できる:
var
suit: (clubs, diamonds, hearts, spades);
宣言は、それが多重変数として使われるように型別名宣言によく現れる:
type
cardsuit = (clubs, diamonds, hearts, spades);
card = record
suit: cardsuit;
value: 1 .. 13;
end;
var
hand: array [ 1 .. 13 ] of card;
trump: cardsuit;
列挙値の順序は書いた順番になる。列挙型は順序型 ordinal typeであり、prec、succ関数は、列挙の前または次の値を与え、 ord は列挙値を整数表現に変換する。しかし、標準Pascalでは数値型から列挙型への変換はできない。拡張されたPascalは拡張されたsucc関数経由でこの機能性を提供する。他のPascal派生言語の一部では、型キャストで変換可能なものもある。
Ada
Adaでは,Pascalとよく似た定義となるが"="の替りに"is"を用いる:
type Cardsuit is (Clubs, Diamonds, Hearts, Spades);
属性Pred, Succ, ValおよびPosに加えて,Adaには更に属性ImageおよびValueがあり,文字列変換を行うことができる(Image: 列挙値から文字列への変換,Value: 文字列から列挙値への変換)。
Cスタイルの言語と同様に,Adaでは列挙値として数値に何を用いるかを指定することができる:
for Cardsuit use (Clubs => 1, Diamonds => 2, Hearts => 4, Spades => 8);
Cスタイルの言語と異なり,Adaでは列挙値に割当てるビット数を指定することができる:
for Cardsuit'Size use 4; -- 4 ビット
さらに列挙値を配列の添字として用いることもできる:
Shuffle : constant array(Cardsuit) of Cardsuit :=
(Clubs => Cardsuit'Succ(Clubs), -- Clubsの"次の値"を指定: Diamondsになる
Diamonds => Hearts, -- 列挙リテラル: 直接Heartsを指定
Hearts => Cardsuit'Last, -- 列挙型の"最後の値"を指定: Spadesになる
Spades => Cardsuit'First -- 列挙型の"最初の値"を指定: Clubsになる
);
Modula-3と同様に,AdaではBooleanやCharacterは列挙型の一種に過ぎない(パッケージ"Standard"で既定義). Modula-3と異なり,Adaでは自前の文字型も定義することができる:
type Cards is ("7", "8", "9", "J", "Q", "K", "A");
構文的にCに似ている言語
C言語のオリジナルのK&Rに列挙型は存在しなかったが、ANSI標準 (C89)で追加された。Cでは、列挙は明示的にenumキーワードを宣言することで生成できる。それは構造体と共用体宣言を連想させる:
enum cardsuit {
CLUBS,
DIAMONDS,
HEARTS,
SPADES
};
struct card {
enum cardsuit suit;
short int value;
} hand[13];
enum cardsuit trump;
Cは列挙値の小さな整数表現を直接プログラマに晒す。整数と列挙値は自由に変換可能であり、列挙値でも全ての数値演算が可能となっている。結果として、列挙体に定義されていない値すら取りえることもある。事実、言語仕様によると、上記のコードはint型の定数としてCLUBS
、DIAMONDS
、HEARTS
、SPADES
を定義しているが、これらがその型の変数に保存されるときは、(暗黙裡に)enum cardsuit
に変換されるだけである。
Cでは、プログラマに明確に列挙定数の値を指定することも可能である。例えば、
enum cardsuit {
CLUBS = 1,
DIAMONDS = 2,
HEARTS = 4,
SPADES = 8
};
は、ビット演算によってenum cardsuit
として表現された一組の数学的な集合を許可する型を定義するために使われる。
Cの構文を受け継ぐ、型のない言語 (perlやJavaScriptなど)は一般に列挙型をもたない。
C++
C++はCから直接引き継いだ列挙型を持っている。しかし列挙定数は、int型ではなく基の列挙型となる(ただしint型へ昇格できる。整数から列挙型への変換には明示的なキャストが必要である)。このため、整数型と列挙型との間で多重定義できる。また、列挙型は利用者定義型の一種であるということから、列挙型に対しての演算子多重定義も可能となっている。
Java
JavaはJava SE (J2SE) version 5.0から宣言文法がCのそれに似ている列挙型を導入した:
enum Cardsuit { Clubs, Diamonds, Spades, Hearts }
...
Cardsuit trump;
Javaの型システムは、整数から分離された型として列挙を扱うが、(ordinal()
メソッドを使用してenum値の整数表現を取得できることを除き)enumと整数値との混合演算は許されていない。実際には、Javaのenum型は現に、数値型というよりもむしろ、コンパイラによって生成された特殊なクラスである。enum値はそのクラスのあらかじめ生成されたグローバルなインスタンスとして振る舞う。enum型はインスタンスメソッドとコンストラクタ(引数が各々のenum値を分割指定できる)を持つ。全てのenum型は暗黙のうちにEnum
抽象クラスを継承している。enum型を直接インスタンス化することは許可されない。
C#
C#プログラミング言語の列挙型はCのenumの意味する多くの"小さな整数"を保持する。いくつかの数値演算はenumでは定義されないが、enum値は明示的に整数に変換し元に戻すことができる。またenum変数はenum宣言によって定義されなかった値を保存できる。例として、
enum Cardsuit {
Clubs,
Diamonds,
Spades,
Hearts
};
が与えられたとき、式Diamonds + 1
とHearts - Clubs
は直接許可される(なぜならば、一連の値を通して進めるかまたは、多くのものが二つの値間を渡る方法を尋ねることは理にかなっている)が、Hearts * Spades
は理にかなっていないと考えられ、値が最初に整数に変換されるということだけが許可される。
VBA
VBAの列挙型は自動的に "整数"データ型に代入され、それ自身データ型にもなりうる:
Option Explicit
Enum MyEnumeratedType
myType1 = 1
myType2 = -1
End Enum
Sub EnumExample()
Dim a As MyEnumeratedType
a = myType1
MsgBox a
End Sub
関数型プログラミングにおける代数データ型
MLの血統(e.g., SML、OCaml、Haskell)である関数型プログラミング言語ではnullary constructorしかない代数データ型は列挙型を実装するために使うことができる。例えば(SMLシグニチャの文法):
datatype cardsuit = Clubs | Diamonds | Hearts | Spades type card = { suit: cardsuit; value: int } val hand : card list val trump : cardsuit
もし、実際にそのような表現が実装に必要とされるならば、これらの言語では、小さな整数表現は完全にプログラマから隠蔽される。一方で、Haskellは型が派生でき、型とIntとのマッピングを得る実装ができるEnum 型クラスを持つ。
Lisp
Common Lispは、型指定子 member を用いる, e.g.
(deftype cardsuit ()
'(member club diamond heart spade))
ここで定義された cardsuit型 は、シンボルclub、diamond、heart、spadeの集合となる。
(typep 'club 'cardsuit) ;clubは、cardsuit型か?
;=> T ;true
また、上記の型定義で利用した deftype は、表記を拡張することにも用いる
(deftype finite-element-set-type (&rest elements)
`(member ,@elements))
は、型指定子 member に finite-element-set-type という新しい名前を付ける。 これを用いて、
(deftype cardsuit ()
'(finite-element-set-type club diamond heart spade))
として、前述のcardsuitと同じものを定義することに利用できる。表記上似ていて紛らわしい member関数との混同を避けることに使えるだろう。 なお、CLOSの引数特定子には、型指定子memberに相当するものはないため、メソッドの定義(defmethod)で同様のことを実現する場合は、メンバー個々をeql特定子を用いて定義する必要があるだろう。
データベース
データベースによっては列挙型を直接サポートする。
MySQL
MySQLでは、テーブルが生成されるときの文字列として指定された許容量を持つ列挙型ENUMが存在する。0としての空文字列とともに値は数値インデックスとして保存される。最初の文字列には1が保存され、第二の文字列には2が保存される、etc...。値は数値インデックスまたは文字列として検索し保存することができる。
PostgreSQL
PostgreSQLでは CREATE ENUM 構文にて列挙型を定義できる。入出力は文字列として行うが、内部的にはシステムが割り当てた 4 byte の整数として保存される。列挙型の名前が長い場合には格納の効率が高まり、数値として処理できるため検索性能も向上する。