Unicode照合アルゴリズム

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索

Unicode照合アルゴリズム(ユニコードしょうごうアルゴリズム、: Unicode collation algorithm、略称: UCA)とは、2つのUnicode文字列を比較するアルゴリズムを定義したものである。これによって言語的に正しい大文字小文字変換、ソートが行える。

概要[編集]

Unicode照合アルゴリズムは、Unicodeテクニカル・レポート#10に規定されたアルゴリズムで、2つの文字列を比較する方式であり、カスタマイズ可能である。Unicodeで表現可能な文字および言語ならどんな種類のテキストでも、照合ないしソートの際にこのアルゴリズムが利用できる。

Unicodeテクニカルレポート#10は、デフォルトUnicode照合基本テーブル(Default Unicode Collation Element Table、略称DUCET)についても規定している。DUCETは言語ごとにカスタマイズ可能である。カスタマイズされたテーブルの一部は、共通ロケールデータリポジトリ(Common Locale Data Repository、CLDR)に収録されている。

オープンソースによる大規模なUnicode照合アルゴリズムのインプリメンテーションが、International Components for Unicode(ICU)計画によって行われている。ICUは地域化もサポートしており、CLDRをもとにしたUnicode照合の地域化がICUに含まれている。オンラインで参照できるICUロケールエクスプローラーを見れば、地域化の概要と相当数の各言語データがわかる。

関連項目[編集]

外部リンク[編集]