Wikipedia:井戸端/subj/カテゴリ編集の指針は実践の場にどうあるべきか

カテゴリ編集の指針は実践の場にどうあるべきか[編集]

現行のWikipedia:カテゴリの方針において、

ある記事に対してカテゴリを設定する際は…(中略)…「xx」(記事)とは何であるか、を考えます。(中略)記事の主題に少しでも関連するものをすべて貼る必要はありません。 — Wikipedia:カテゴリの方針#カテゴリ編集の指針「カテゴリを付与・追加する場合」

と説明されていますが、実際には、高山病Category:山が貼ってあったり、軍艦の事故Category:海が貼ってあったり、水力発電Category:河川が貼ってあったりする例が後を絶ちません。基本「〈記事名〉は〈カテゴリ名〉である。」と言える関係にある記事に対してカテゴリを付与するというのが、カテゴリの方針の趣旨ではなかったのでしょうか。私には、どうも「記事の主題に少しでも関連するものをすべて貼」っているように思えてなりません。個々のカテゴリをタグか何かと勘違いしている利用者がいやしないだろうかと心配になります。もちろん、いわゆる「キーワード指向」のカテゴリ(タグ的運用を指向するカテゴリ)が存在していることも存じ上げていますが、そういったカテゴリは(全体から見れば)例外的な存在だと私は認識しており、カテゴリの第一義は「分類指向」であったはずです。たとえば、水系Category:河川である、火山Category:山であると言えるでしょう。また、この「キーワード指向」「分類指向」という表現も、正確な理解のためになっていないように思われます(論理的でないし、直観的でもない)。各々、英語版では「トピックカテゴリ」「セットカテゴリ」、ドイツ語版では「テーマカテゴリ」「オブジェクトカテゴリ」と呼ばれているようです(あえて日本語に直すならば、「話題(“と言えば”)カテゴリ」と「集合(“は…である”)カテゴリ」といったところでしょうか)。直にWikipedia‐ノート:カテゴリの方針に提議しようと思ったのですが、段取り八分とも言いますし、事前に広く皆様の現状認識と反応を伺いたかったので、問題点の整理も兼ねて、こちらに話題として投稿させて頂きました。ご意見、ご感想がございましたら、よろしくご回答のほど、お願い致します。--Doraemonplus会話2019年8月16日 (金) 11:59 (UTC)[返信]

コメント 2点。現実問題としてWikipediaは誰でも編集できちゃう(ルールや合意を無視する人でさえ)ので、どうしようもない、てとこはありますよね。熟慮して編集する人より、なんにも考えない人のほうが圧倒的に手数が多いですし。特にカテゴリまわりは正直そういう方によって混沌になってますね。
もう1点、これは私とDoraemonplusさんの意見が違うところ。私は「分類が第一義のはず」とは考えません。「キーワード指向のカテゴリ」も普通に問題ないカテゴリの使用法と考えます。「タグ」的にトピックを四方八方から集めることができるのは、紙の辞典では難しいですが、デジタル辞典ならではの利点かと。
私は「分類」に過度に拘る方・きれいなツリー構造に拘る方は現実をみないで困ったことを引き起こす、と思っています。たとえば「○○神社」。旧跡でありサクラの名所であり建物が歴史的建造物で社宝が重文で境内は公園でもあり航海の神と学問の神が祀られていて源平合戦にも関係する、みたいな場合には、いろんなカテゴリに入れたいです。「神社」だけに放り込まれて「歴史」や「観光地」や「建造物」からアクセスできないのは不便と思います。
まあ、ここらへんは「少しでも関連する」の「少し」閾値の違いでしょうかね。
「キーワード指向/分類指向」という表現がどうなんだ、というのは、まあ、確かに。これに限らず、Wikipediaの古い時期に定められた用語は、ちょっとこう・・・ということは多々ありますね。それを今から改めるのはタイヘンですけれど。--柒月例祭会話2019年8月16日 (金) 12:27 (UTC)[返信]
(追伸)高山病や水力発電について。「山に関する何か」「川に関する何か」であることと、個別の山座だけを集めたカテゴリ・個別の河川記事だけを集めたカテゴリ、をきっちり分ける、という方向で整理するのはありでしょうねえ。今は「山」という漠然としたものなので、山に関連していてサブカテゴリにも分類不能なものが残っている、という感じではあります。--柒月例祭会話2019年8月16日 (金) 13:05 (UTC)[返信]
コメント カテゴリ内をそのインスタンスでまとめ、「topic-of」や「subject-in」な関係なものはトピックカテゴリにまとめたいという考えでしょうか。それができるカテゴリもあれば、わざわざしなくても良いカテゴリもあるという感じですね。たとえば概念の大きい「山」というカテゴリは、関連するトピック記事も含まれるカテゴリで、「山」だけを集めたカテゴリは下位カテゴリの「各国の山」などになります。この場合「山」カテゴリを山だけ集めたカテゴリに変更して、トピックカテゴリを新たに作る、などという手間に必要性は感じません。すっきりした構造化をしたいのなら、それはウィキデータに任せ、ウィキペディアのカテゴリは検索補助のような扱いでも良いのではないでしょうか。--Afaz会話2019年8月17日 (土) 13:54 (UTC)[返信]
当初「分類指向」と「キーワード指向」の区別や分離を提案するつもりが、どうやらあまりに難しいテーマに足を踏み入れてしまったようで、お返事が遅れました。
そんな中、2つの要点を見出しました。1つは、過去ログWikipedia‐ノート:カテゴリの方針/ 2012年までの過去ログ#関連が深いキーワードにおける「上位の概念」とは何か?に出てくる、概念の内包[1]外延[2]という面。もう1つは、利用者‐会話:Bcjp/WPJ カテゴライズ 立ち上げ準備室#カテゴリとは!で述べられる、カテゴリは、階層構造(ツリー構造)を強いるものではないということです。
以上の2つのノートを読んで、現行のカテゴリの方針は方針文書でありながら意外と柔軟な(自由な)姿勢をとっていると認識するに至りました。
1つ目の要点の具体例を挙げると、神社という概念の外延は伊勢神宮出雲大社春日大社靖国神社などを指し、神社という概念の内包は「日本固有の神々を祀るための場所。宗教建築であり、礼拝施設であり、文化財であり、時に桜の名所であり、観光地である。」というものです。「キーワード指向」というのは、この概念の内包(性質)から抽出した「キーワード」をもって分類する指向を表していると解釈できます。一方、「分類指向」と呼んでいるのは、概念の外延(対象)から成る集合を範疇(カテゴリ)として分類する指向を意味していると解釈できます。少なくとも私はそう読みました。広い意味では、「キーワード指向」も「分類指向」も分類を示していますが、基礎となる作法が異なるといえます。記事とカテゴリの結びつきは概ねこの考え方で説明可能だと思います(ただし、特殊な例として「同名の記事を含むカテゴリ」は、Category:富士山のようにキーワードに少しでも関連する項目を広く含めているものもあれば、Category:出雲大社のように対象を分祠と関連の深い神社に絞っていて関連の度合いが明瞭になっているものもあり、全体の運用の実態に規則性はみられません)。Wikipediaは誰でも編集できちゃうので仕方ないと言われれば、どうしようもないですね。
次に2つ目の要点について。カテゴリの一群を一つの体系と捉えるとき、個々のカテゴリとカテゴリの結びつきは非常に複雑です。en:WP:CAT#Category tree organizationの図を参照していただくとご理解いただけるかと思いますが、カテゴリの体系は巨視的に捉えればツリー構造になっていません。このことから、おっしゃる通り「分類」に過度に拘るとか、きれいなツリー構造に拘る必要はないことがうかがえます。割とラフでもいいようですね。カテゴリの体系の全体像を把握するのは困難ですが、ドイツ語版などにはde:Vorlage:Kategoriegraphなるテンプレートがあって、周辺のカテゴリとの結びつきを可視化(グラフ化)することができるようです。jaWPにも導入できたら便利かもしれません。
「山に関する何か」「川に関する何か」に関しては、上述した内包と外延で解くなら、内包の方面ですね。ドイツ語版では、de:Kategorie:Berg(山)とde:Kategorie:Berg als Thema(テーマとしての山)、de:Kategorie:Fluss(川)とde:Kategorie:Fluss als Thema(テーマとしての川)はきっちり分離されています(そうはなっていないカテゴリも一定数あるようですが)。前述のコメントでも紹介した通り、ドイツ語版はオブジェクトカテゴリとテーマカテゴリをかなり厳しく区別していますが、jaWPはどちらかというと、より緩い英語版からの影響が大きいので、ドイツ語版流のシビアにカテゴリを分離しての運用方針は馴染まないですかね。今はウィキデータという便利なデータベースもあることですし、将来的には項目同士の相互関係はウィキデータで構造化されるようになるのでしょうか。--Doraemonplus会話2019年8月17日 (土) 14:43 (UTC)[返信]
コメント 追伸 また、ja:WP:CGには明示されていませんが、英語版ではen:WP:CATVとして記事とカテゴリの間にもWP:VWP:POVが求められています。「少しでも関連する」からといって闇雲にカテゴリをベタベタと貼り付けることは認められていないようです。ここまで考えてみますと、私が求めているのは、実は、単に分類の正確性というより、カテゴリの内容の品質を保証する何らかの仕組みであると言い換えられるかもしれません。--Doraemonplus会話2019年8月17日 (土) 14:52 (UTC)[返信]
コメント 続報 {{カテゴリグラフ}}をドイツ語版から移植、作成しました。これを用いて、Category:富士山の上位カテゴリグラフのようにカテゴリ構造を視覚化できます。カテゴリの体系の見通しをよくするために役立てて頂ければ、と思います。--Doraemonplus会話2019年8月18日 (日) 08:08 (UTC)[返信]

情報 最近またカテゴリ体系の在り方について思うところがあり、久しぶりに読み返しに来ました。以前、Afazさんがウィキデータとかインスタンスとかのお話をされていたのに関連して、d:Wikidata:SPARQL_tutorial/ja#インスタンスとクラスをここに備忘録として記しておきます。--Doraemonplus会話2020年7月13日 (月) 06:55 (UTC)[返信]

  • コメント 井戸端なのでざっくばらんに語ります。(全部読んでませんが)isとhasとか形而上学ですねー。
  • 完全な私見ですけど、ウィキペディアにおける「カテゴリ」は、今にして思えば設計に不備があったんだろうと思います。私は「分類指向のカテゴリ」と「キーワード指向のタグ」みたいな表現をしてますけど、ウィキペディアではその2つの役割を「カテゴリ」でやろうとして、こんがらかった。
  • そのうえカテゴリLTAみたいのがいて、全体の長期的な目論見を顧みずに好き勝手やるし、おまけに記事と違ってカテゴリの場合、広範囲で弄くり回されたのを復旧するのが困難というところがあって、カオスになっちゃってる。--柒月例祭会話2020年7月13日 (月) 07:35 (UTC)[返信]

コメント 雑感ですけれど、だいたい当たってると思います。「分類指向」と「キーワード指向」というのは、いずれも現行のWikipedia:カテゴリの方針#カテゴリの定義に明記されているカテゴリの作法ですが、その両方を求めて混ぜこぜに実装した結果、どちらの使い方をするにも中途半端な状態になっている感があります(また、前記カテゴリの定義の「3. カテゴリはウィキペディアの骨組みの意味を持ちます」もどこか忘れられてるような…)。率直に言ってしまえば、ウィキペディアのカテゴリの多くは「みんなの雰囲気」で「なんとなく」作られてる印象です。

  • Wikipediaのカテゴリは「分類指向」に基づく完全な階層構造にはなっていないにもかかわらず、カテゴリ同士の関係を上位・下位の関係でしか定義できないために、結果として見かけ上の「カテゴリツリー」が出来上がってしまっています。
  • ところが、Wikipediaのカテゴリを一度でもカテゴリツリーを通して見てしまうと、カテゴリ体系の全体像について見誤ることになるのです。
  • たとえば、Template:カテゴリグラフを通してCategory:富士山を中心としたカテゴリの体系を視覚化してみると、こちらのような図式になり、ツリー構造というより網の目構造に見えます。この図式に気づいてしまうと、いよいよ分類指向でカテゴリをどうにかしようと考えるのが誠に馬鹿らしくなってさえきます。かといって、キーワード指向に傾斜してウェブのようなノード間関係を目指すにも、カテゴリの上位・下位の関係に縛られて不自由するのは目に見えています。

結局、ウィキペディアのユーザーの皆様がカテゴリ機能に何を求めているのか、どのような使い方ができたら便利だろうか、それを知ることから始めないといけないようです。原点に立ち返ると、カテゴリのヘルプページの一行目に明記されている、索引の自動生成機能が本来のカテゴリの役割となるでしょうか。他言語版のカテゴリ解説ページを読んで、各言語版がカテゴリ機能についてどのように認識しているのか、調査してみるのも面白そうです。そして、この問題が解決した先には、再びLTA問題が待ち受けているんでしょうね。最初からカテゴリはそういうものと割り切って、潔くウィキデータの充実に注力したほうが労力を無駄にしなくて済むかもしれませんね。--Doraemonplus会話2020年7月13日 (月) 11:19 (UTC)[返信]

コメント 続報 その後の調査で、前回のコメントで吐露した「分類指向を追求するのが馬鹿らしい」というやりきれなさは、複合主題の分類に適したファセット分類法という分類法を用いることによって、概ね解消できると期待されることが、ドイツ語版ウィキペディアのカテゴリの方針を読むうちに分かってきました。そして、ファセット分類法に関する文献「情報組織化の基盤としてのファセット分類法」などを読むに、カテゴリの本質はインデクシング(索引作成)にあり、索引著作物としてのカテゴリそのものの分類(階層化)は二の次であることを再確認できました。先のドイツ語版方針文書に明記されているとおり、ドイツ語版では既にカテゴリ体系の作成にファセット分類法が採用されているようです。この分類法の実践については、当方は未だ理解不足であるため回答できかねますが、次に示すCategory:日本の山 (Q7237744)をサンプルとした2つのカテゴリグラフを比較すると視覚的な理解の助けとなろうかと思われますので、ご紹介させていただきます。見比べていただきたいのは、日本語版の「Category:日本の山」の上位カテゴリ系統のグラフと、そのドイツ語版のカウンターパートである「Kategorie:Berg in Japan」の上位カテゴリ系統(日本語訳)(翻訳元のクリック可能なグラフはこちら)です。どちらがより優れたカテゴリ体系といえるでしょうか。また、個々のカテゴリを一編の索引と見たとき、項目索引として有用な(すなわち、たとえば検索者が日本の山から特定の山の記事にたどり着きやすい)のはどちらでしょうか。「キーワード指向」についても、連想ゲーム式の分類は止め、きちんとした主題分析に基づく分類に近づけていけたら、トピックカテゴリの使い勝手も向上するのではないかと愚考いたします。いずれにしても、現状の日本語版のカテゴリ体系は迷路のようで扱いにくく感じられるので、いつかファセット分類法を適用できたらなと思いを巡らせる次第です。大規模な変革になりますが、カテゴリ体系の改善を望んでいる潜在的な利用者は意外と多いんじゃないかと思っています。近いうちに、井戸端に新規の話題としてカテゴリシステムに関する意見募集をかけようかと考えています。--Doraemonplus会話2020年7月15日 (水) 09:16 (UTC)[返信]

返信 ドイツ語版ではカテゴリに関する議論が深まっていて、大きな合意がなされているということなんでしょうね。各論ではいろいろあるとは思いますが、総論として大きな方向が定まり、きちんと維持運用されているというのは大したものだと思います。(私の経験では、いくら決めても、守らない人に対処できないというのがJAWPの現状)--柒月例祭会話2020年7月17日 (金) 09:04 (UTC)[返信]
返信 ドイツ語版があれほどまでに統率の取れたカテゴリ“索引”体系を維持できている制度的な背景は、いろいろ考えられまして、先述したカテゴリの方針文書群の充実以外では、ざっと眺めたところ、
といったものがあります。この体制に至るまでには、きっと熱い議論と周到な計画と冷徹な実行があったのでしょう。日本語版で今からこれを真似するのは、不可能とは申しませんが、極めて骨の折れる困難な事業になると思います。協力者が少なくとも数十人単位は集まらないと厳しいでしょうね。--Doraemonplus会話2020年7月18日 (土) 14:06 (UTC)[返信]

コメント 手始めにプロジェクト‐ノート:山#「Category:山」系統の再編提案を提起しました。--Doraemonplus会話2020年7月17日 (金) 08:03 (UTC)[返信]