プロジェクト:カテゴリ関連/資料/ドイツ語版にみるカテゴリの整理法

カテゴリの整理について規定した正式なルールはありませんが、以下のガイドラインに留意してください。

基本情報[編集]

ウィキペディアにどのようなカテゴリがあるかについては、Wikipedia:カテゴリのページで説明されています。ここで簡単に説明すると、カテゴリとは、諸々の記事やカテゴリを秩序立てて整理することを可能にするシステムのことです。記事やカテゴリは複数のカテゴリに分類することができます。Category:男性およびCategory:著作家に分類された記事は、記事中で男性著作家について記述している記事であることを意味します。このようにカテゴリ名は、そのカテゴリ内で何を収集するかの基準として使用されます。カテゴリ名が明確でない場合には、カテゴリページの冒頭にその定義を明記する必要があります。また、カテゴリそれ自体にカテゴリが含まれている場合には、子カテゴリは親カテゴリの定義を継承した上で、個別の詳細な定義を明記します。

別のカテゴリの中にカテゴリを配置することによって、後者は前者のサブカテゴリ(下位カテゴリ)となり、前者は後者の上位カテゴリと呼ばれます(例: Category:男性Category:性別別の人物のサブカテゴリです)。ウィキペディアのカテゴリシステムでは、各カテゴリは他のカテゴリに従属させることができ、また、一つのカテゴリは複数のカテゴリに従属させることができるため、ウィキペディアのカテゴリ体系は全体としては階層構造をとりません。カテゴリ系統の一定の秩序を維持するために、カテゴリの分類ルールがいくつか合意されています。これらのルールに従って、カテゴリは多重階層的に整理される必要があります。しかし、カテゴリとそのサブカテゴリをどのように整理整頓すべきかについては、未だ体系的なガイドラインは示されていません。

主題分野[編集]

2004年には、ウィキペディアのカテゴリ体系は主題分野カテゴリの体系とすることが、利用者の意見によって決定されました。このことから、カテゴリツリーは、それぞれの主題分野にとって分別のある、テーマに関係した体系を表すべきであることがわかります。したがって、サブカテゴリの分類は、主として分野ごとのニーズに合わせて調整されなければなりません。これらは抽象的に定義することができないため、各分野の専門知識を持った利用者が議論して決める必要があります。ほとんどの分野では、カテゴリの体系は洗練されており、その詳しい様子はこちらから確認することができます。なお、関連する分野の利用者に相談することなく既存のカテゴリ体系の抜本的な変更を試みることはご遠慮ください。

各分野はそれぞれのカテゴリ体系を構築する上で一定の自由度を有しているとはいえ、記事が間接的に完全に間違った領域に分類されることがないよう、注意しなければなりません。そのため、サブカテゴリが他の分野やテーマに強く傾いた上位カテゴリに分類されないよう、細心の注意を払う必要があります。また、カテゴリをその上位と下位のカテゴリに同時に割り当てることはできません。

サブカテゴリの分類ルール[編集]

ウィキペディアには原則として科学的なニーズがありますが、科学的分野に直結しない領域も多数あります。この場合、学部に適用される規定による分類は不可能です。混沌としたカテゴリの増殖を避けるため、秩序ある体系を構築することが必要とされます。ここでも、合意によって分別のある体系が展開されるテーマが出てこない限り、次の基準が役に立つかもしれません:

部分集合関係の必然性[編集]

カテゴリの構造と利用は、読者にテーマ部類から関連する項目を引いてもらい、各種記事へのアクセスを可能にすることを目的としています。一般的には、カテゴリは階層的に整理されるべきです。カテゴリを他のカテゴリに含める際には、カテゴリ自体の属性ではなく、そのカテゴリの中に含まれるすべての記事の属性に従って分類されていることを確認することが重要です。原則として、カテゴリを分類する際に生まれるカテゴリ間の関係の定義の仕方は自由ですが、下位カテゴリと上位カテゴリの間に部分集合関係が成り立つことが要求される理由はいくつもあります。

多重階層システム[編集]

Wikipedia:カテゴリによると、カテゴリ系統は多重階層的であることが望ましいとされています。しかし、連想関係が許容されている場合には、ループ構造が発生することも少なくありません。多重階層構造は、そのような恣意的な関係を省くことでしか実現できません。

記事の分類ルール[編集]

Wikipedia:カテゴリによると、原則として、記事は同時に親カテゴリに入れてはいけないことになっています。これはもちろん、子カテゴリの要素が自動的に親カテゴリの要素とみなされる場合にのみ意味をもちます。しかし、これは下位カテゴリを上位カテゴリの部分集合とみなさなければ、形式的に矛盾したものになってしまいます。

カテゴリの引きやすさ[編集]

一般の読者のためだけでなく、記事のカテゴリ整理のためにも、カテゴリには階層的な見つけやすさが与えられるべきです。この発見可能性は、連想的なカテゴリ分類構造では与えられません。なぜなら、ある記事に適合するカテゴリは、当該の記事が適合しない定義を持つカテゴリの下に事実上どこにでも現れる可能性があるからです。この問題は、カテゴリ系統のパス内に複数の連想的分類が含まれており、問題のカテゴリから主要カテゴリまでに排他的な部分集合関係を持つパスが少なくとも1つ存在しない場合に特に深刻な問題となります。

ソフトウェア[編集]

純粋な部分集合関係が成立していないと、PetScanのようなツールの効能は大きく損なわれます。初期の実行可能なバージョンで、既にいくつかのWikiにおいて使用されているSemantic MediaWikiでさえも、下位カテゴリの中身を上位カテゴリに自動的に再帰的に繰り込む包含関係に依存しています。

カテゴリのタイプ[編集]

ウィキペディアのカテゴリシステムでは、カテゴリのタイプは確立されていません。しかし、実際には、これはカテゴリの補題と望ましい使用法または定義の指定から自然と発生しています。原則的には、次のようなタイプのものがあります:

オブジェクトカテゴリ(「の一つである」分類)[編集]

オブジェクトについて記述した記事は、オブジェクトカテゴリに分類されます。Category:河川に分類される記事は、すべて「河川の一つである」という分類基準を満たすものです。記事をサブカテゴリに分類する際は、同じオブジェクトタイプの記事のみをサブカテゴリに分類することが要求されます。これらのサブカテゴリは通常、交差集合を表しています(例: Category:ドイツの河川は河川とドイツの交差するところ、つまりドイツのすべての河川を表しています)。

Template:オブジェクトカテゴリおよび§オブジェクトカテゴリも参照。

テーマカテゴリ(「に属している」分類)[編集]

オブジェクトカテゴリとは対照的に、テーマカテゴリには、そのカテゴリのテーマに属しているすべての記事が含まれます。したがって、この分類方法では「テーマに属している」という基準に従います。Category:テーマとしての河川の一部であるCategory:ドナウ川は、ドナウ川をテーマとして扱う(「ドナウ川というテーマに属している」)すべての記事、たとえば、ドナウ渓谷美しく青きドナウなどの記事を含みます。

Template:テーマカテゴリおよび§テーマカテゴリも参照。

ファセットカテゴリ(サブカテゴリを持たないカテゴリ)[編集]

ファセットカテゴリは、記事オブジェクトの属性を記録するために使用されます。これを行うために、ファセットカテゴリはサブカテゴリを含まず、直接割り当てられた記事のみを含みます。ファセットカテゴリは、オブジェクトカテゴリまたはテーマカテゴリのいずれかです。

構造・メタカテゴリ[編集]

テーマカテゴリが他のテーマカテゴリに意味を持って配置できない場合は、カテゴリ体系を構造化するために供与するカテゴリに配置されます。このカテゴリツリーは、メタカテゴリであるCategory:主要カテゴリが起点となります。構造的なカテゴリのみがこのメタカテゴリに分類されています。

構造的なカテゴリの中には、テーマカテゴリとオブジェクトカテゴリが配置されていますが、記事は存在しません。

カテゴリの他のカテゴリへの分類[編集]

各カテゴリは、最上位カテゴリであるCategory:主要カテゴリを除いて、他のカテゴリに従属するものとします。その際は、以下の点に注意する必要があります:

オブジェクトカテゴリ[編集]

  • 各オブジェクトカテゴリは、親となるオブジェクトカテゴリまたはテーマカテゴリのサブカテゴリであること。
  • オブジェクトカテゴリとそのすべてのサブカテゴリでは、カテゴリの分類基準を満たす記事のみが分類されていること。たとえば、Category:河川とそのすべてのサブカテゴリでは、「河川の一つである」という条件を満たす記事のみを分類すること。
  • オブジェクトカテゴリがテーマカテゴリのサブカテゴリとして運用されている場合、そのオブジェクトカテゴリとすべてのサブカテゴリは、テーマカテゴリが掲げるテーマに一致する記事のみを含んでいなければならないこと(例: オブジェクトカテゴリのCategory:アルプス山脈の山はテーマカテゴリのCategory:アルプス山脈に属していますが、同じくテーマカテゴリのCategory:ドイツには属していません)。連想的分類によるCategory:ドイツへの関連付けは、カテゴリ体系では表されていません(これには正当な理由があります。詳細は上記参照)が、適度な知能を持つアルゴリズムさえあれば、数多くの記事とサブカテゴリを共有するカテゴリを介して、量的に表示することは可能です。

テーマカテゴリ[編集]

  • 各テーマカテゴリは、上位に置かれているテーマカテゴリまたはテーマ集カテゴリのサブカテゴリであること。
  • テーマカテゴリをオブジェクトカテゴリの一部として分類することはできません。オブジェクトカテゴリに含まれる記事には、テーマカテゴリに含まれる記事が通常は満たすことのない「○○は△△の一つである」という主張が成り立ちます(例: 記事『美しく青きドナウ』は「ヨーロッパの河川の一つである」という主張を満たしていないため、この記事を含んでいるCategory:ドナウ川Category:ヨーロッパの河川の下には分類できません)。
  • テーマカテゴリにカテゴリ名と同名の記事が存在する場合、その記事を適切なオブジェクトカテゴリに分類することができます。上記の理由により、この分類基準は同名のテーマカテゴリには適用できません(例: 記事「ドナウ川」はCategory:ヨーロッパの河川に属していますが、Category:ドナウ川はこれに属していません)。
  • テーマカテゴリのサブカテゴリは、さらにテーマカテゴリまたはオブジェクトカテゴリとすることができます。ただし、下位に配置されるテーマカテゴリは親テーマの範囲内に収まっていなければなりません。下位に配置されるオブジェクトカテゴリは、テーマカテゴリの部分集合を表しているものでなければなりません。

構造・メタカテゴリ[編集]

  • メタカテゴリは、他のカテゴリに従属しません(例: Category:主要カテゴリ)。
  • 構造カテゴリは、他の構造カテゴリに分類されるか、メタカテゴリに分類されます。

「誤った」部分集合または交差集合の分類事例[編集]

ここまで説明してきたサブカテゴリの分類ルールによれば、サブカテゴリの要素は自動的に上位カテゴリの要素とみなされるので、サブカテゴリは常に上位カテゴリの部分集合であるべきです。カテゴリ分けをする際は、直接のサブカテゴリも間接のサブカテゴリも含めて、分類するカテゴリの中身全体を常に考慮しなければなりません。これは、分類したいカテゴリの定義によって決定された項目群の部分集合でなければなりません。

事例1
文学の分野では、著作家の記事はCategory:著作家に登録されています。このカテゴリの定義によれば、「文学作品の著者の一人である」という基準に合致する人物伝記事のみを登録対象としているとのことです。したがって、記事「カール・マイ」は、このカテゴリに属していますが、カール・マイに関係するいろいろな記事を収集しているCategory:カール・マイはこのカテゴリには属しません。銀の猟銃(彼の小説に登場する道具)は著作家ではありません。
事例2
#特定の地域のカテゴリを参照。
事例3
記事「シチリア・マフィア委員会」は、テーマカテゴリのシチリア島(シチリア島に属する記事)に分類することができますが、Category:シチリア島Category:テーマとしての島というテーマカテゴリに分類することは、前記の記事が島というテーマに属していないため、このような分類の仕方は賢明ではありません。

循環参照に陥らない[編集]

カテゴリの分類は循環参照の関係になってはいけません。循環参照とは、上位カテゴリが直接または間接的に自らの下位カテゴリの一つにサブカテゴリとして割り当てられたときに発生するものです。というわけで、ひとつながりになっていないか、カテゴリを「ぐるっと一周」するようにクリックしてみましょう。上位カテゴリがそのサブカテゴリに直接的に割り当てられている場合は発見しやすいですが、間接的に割り当てられている場合はツールを使用しないと発見するのは難しいでしょう。このような分類は、前述した誤った部分集合の分類ミスがあった場合に発生する可能性があります。

2006年5月6日の状態

上記の例では、Category:行事文化Category:祭事と風俗に分類したことによって、循環参照の関係に陥ってしまっています。

カテゴリ名に基づく分類[編集]

カテゴリの名前に基づいてカテゴリを他のテーマカテゴリやオブジェクトカテゴリに分類する例がしばしば見受けられます。しかし、これは分類の対象となるカテゴリに直接・間接に属している内容のすべてが、上位カテゴリの定義に合致していることを意味するものではありません。後者が与えられていない場合、この意味でカテゴリを分類するのは間違っています。

たとえば、Category:ドイツは同名の国に関するすべての記事を収集していますが、そこに含まれる記事は(1つを除いて)国について記述していないので、Category:ドイツCategory:国の下に分類するのは、この意味で間違っています。Category:国に属するべきは、記事「ドイツ」のみです。

部分集合関係を欠いたカテゴリの再編成[編集]

上位カテゴリと下位カテゴリの間に真の部分集合関係になっていないカテゴリ構造がしばしば見られます。利用者にとってカテゴリ間の関係がさほど重要ではなく、下位カテゴリも別のカテゴリに正しく分類されている場合には、カテゴリを置き換えずにこれを省くことができます。

しかし、利用者の観点からカテゴリ間の関係が望ましいものであると考えられる場合は、カテゴリの編集可能な部分(ページ本文)で、分類されているカテゴリを一方向または双方向の「関連カテゴリ」として参照させる方式に置き換えるのが穏当です。

分類されるべきカテゴリの割り当て先に適したカテゴリが一つもない場合、分類されるべきカテゴリは以下のように取り扱うことができます:

  • カテゴリの定義を変更し、(必要に応じて)名前も変更します。
  • 新しいカテゴリを作成して真の部分集合を作り、それに応じて記事を再配列します。
  • (必要な議論を取りまとめた後に)新たに主要カテゴリを作成します。
  • 削除を検討します。

部分集合関係を欠いた状態の許容可能性[編集]

特に、主題分類を意図したカテゴリでは、サブカテゴリを部分集合にするという要件が実施不可能な場合があります。ここでは、部分集合関係とは異なるカテゴリの分類の仕方が許容できるかどうかを評価するために、判断基準をいくつか挙げます。

許容可能性に対する指摘:

  • 間接的に誤って分類される記事は多数あります。これは、再帰的にサブカテゴリに含まれるすべての記事も考慮されます。
  • 記事は隣接する主題分野だけでなく、完全に間違った分野にも間接的に分類されていることがあります。
  • オブジェクトカテゴリは(テーマカテゴリとは対照的に)分類の影響を受けます。オブジェクトカテゴリでは、不正確な分類をすると、将来のSemantic MediaWikiのクエリ実現性に深刻な影響を与える可能性があるので、より正確に分類を行う必要があります。
  • 誤った分類は間接的には多くのカテゴリで発生するものです。

具体的な事例に基づく説明[編集]

特定の都市のカテゴリ[編集]

都市についてのテーマカテゴリでは、たとえば、Category:カイロカイロをテーマとしたすべての記事を収集します。このカテゴリをCategory:エジプトの都市に分類することは、一見すると当然のように思えますが、Category:エジプトの都市はエジプトの都市のオブジェクトカテゴリなので、そのような分類を行うのであれば、Category:カイロに含まれる記事はすべて、都市について記述している記事でなければなりません。しかし、テーマカテゴリのCategory:カイロの場合はそうではないので、そのような分類はできません。そのため、Category:カイロは、テーマに沿って記事を収集しているカテゴリの下に分類する必要があります。この目的のためには、テーマカテゴリのCategory:エジプトを使用することができます。

特定の地域のカテゴリ[編集]

Category:シレジアについて見てみましょう。シレジアはかつてドイツの一部であったため、これはテーマカテゴリのCategory:ドイツに分類される可能性があります。しかし、ここに間違いがあるのです。なぜならば、このような分類を認めるとすると、ポーランドとチェコの記事も(この観点でシレジアはこれらの国とも共通項があるので)ドイツの下に分類されることになるわけですが、それらはこのカテゴリには分類されていません(これはCategory:ドイツで決定した事項で、そうでなければ、それらをそのように呼ぶことはなかったでしょう)。ここでの間違いは、カテゴリを記事と同様の方法で分類しようとして、そのカテゴリに含まれているすべての記事も同じく自動的に分類していることになるということを忘れてしまうことです。ここでの解決策は、Category:ドイツCategory:シレジアの一つ上の階層、すなわちCategory:ヨーロッパの下のカテゴリツリーのどこかに、記事「シレジア」(カテゴリではなく!)を分類することです。ですから、真の部分集合または交差集合を従属させるときは、他のものを含む集合と混交しないように注意深く編成する必要があります。

特定の河川のカテゴリ[編集]

記事と同名のカテゴリが存在する場合には、特に注意が必要です。たとえば、記事「ドナウ川」は(いくつかの中間カテゴリを介して)オブジェクトカテゴリのCategory:河川に属しています。しかし、同名のテーマカテゴリであるCategory:ドナウ川は、オブジェクトカテゴリのCategory:河川に分類してはいけません。なぜならば、このテーマカテゴリに含まれる記事「ウェルテンブルクのドナウ渓谷」は河川ではなく渓谷であり、同様に『美しく青きドナウ』も音楽作品の一つであって河川ではないからです。