Wikipedia:井戸端/subj/索引の存在の意味ありますか?

索引の存在の意味ありますか?[編集]

索引ってありますよね?何の意味があるのですか? また50音の中でも多いのと少ないものがあります。 これはその頭文字の言葉のwiki上の登録数と比例してるのですか? また、索引からたどっていけるwikiに載ってる固有名詞とたどっていけないものがあります。 これはどうしてでしょうか?中途半端にする意味ありますか?--以上の署名のないコメントは、たけたけし会話投稿記録)さんが 2012年8月7日 (火) 08:22‎ (UTC) に投稿したものです。[返信]

  • コメント 索引は、昔存廃についての議論があったようです。結果「存続」ということになりましたが、百科辞典に「索引」がなかったら百科辞典たりえないと思うのですが、たけたけしさんは如何お考えでしょうか。こちらから注文を2つ。Mediawikiには、推奨されるスタイルがあります。推奨される書式に従ってご投稿下さい。なお、この井戸端を含むノートページ及び会話ページでは署名が必要とされています。--~~~~と入力しますか編集画面左上のアイコンを押していただきますとたけたけし会話) 2012年8月7日 (火) 08:22(UTC)と表示されます。以上の点、よろしくお願いします。さて本題に戻りますが、索引の編集はボットが行うわけではなく手動で行われているので、どうしても中途半端になってしまうところがあります。つまり、まだ現在の索引では「不完全」ということです。(具体的には、赤リンクが残っていたり、最近新設されたページがまだ掲載されてなかったりということです。)しかし、それを少しずつ修正していけばいつか百科辞典の「総索引」たりえるページになると思っています。ですから、現在中途半端な状態でも今後の成長を見込んで現在は、いわば「スタブ」状態で残されていると思っています。2つ目の御質問ですが、確かに頭文字となる語数が少ない文字もあります。しかし、頭文字となる語数が多い単語は大体その文字から始まるページの数が多く、(例:-113ページ)少ない単語は大体その文字から始まるページ数の数が少ないのです(例:-2ページ、-各1ページ、他英数字・記号は1を除いて1ページ、1のみ2ページ)これは、あなたが実際に50音順に並んでいる百科辞典の「総索引」に割かれているページ数を見れば分かります。以上でお分かりいただけましたでしょうか。なお、まだ掲載されていないページの掲載や、肥大化しすぎたページの分割などの編集及び削除されたページの除去など、索引の完成度を上げる編集は大歓迎です。--Psjk2106会話2012年8月7日 (火) 10:06 (UTC)[返信]
    • コメント Psjk2106さんは、百科事典の索引を使ったことはあるのでしょうか。jawpにおけるWikipedia:索引は、通常の百科事典にある索引とは異なるものですが、その点について理解できていますか。--氷鷺会話2012年8月7日 (火) 11:28 (UTC)[返信]
      • コメント私はウィキペディアにおける索引を使ったことはなく、検索システムがあれば良いと思います。現在の状況は調べていないので不明ですが、過去に、索引に掲載されていない記事も結構あるんだと思った事があります。このような状況であれば、「索引に掲載されていない=記事が存在しない」とは言えず、検索のほうが分かりやすいと考えます。いろいろな記事名を加筆して索引が完全になれば存在意義はあると思いますが、その時間があるのか、加筆が追いつくのかという疑問があります。だったら索引を無くすのも良いのではないでしょうか。--Sun250ba会話2012年8月7日 (火) 12:22 (UTC)[返信]
  • コメント 索引への掲載を半自動化するBotを計画しています(性質上、全自動は無理ですが)。一度現状に追いつけば、あとは変化した分だけを追えばいいので、持続可能になるのではないのでしょうか。--Jkr2255 2012年8月7日 (火) 12:39 (UTC)[返信]
    • コメントそういう事でしたら索引があっても問題はないと思います。--Sun250ba会話2012年8月8日 (水) 13:57 (UTC)[返信]
    • コメント まぁ、そもそも「要らないのでは」という話ですし、メンテナンスにかかる労力が軽減されるとしても、あまり変わらないのでは。半自動化できるとしても、そもそも必要性のない無駄なデータであれば廃止したほうが良いでしょうし、誰かがそれをする時間が(わずかでも)かかるのであれば、それよりは他の作業なり、執筆なり、記事を読むなりしていただいたほうがまだウィキペディアのためになるでしょう。--氷鷺会話2012年8月9日 (木) 15:06 (UTC)[返信]
  • 情報 いま調べてみたところ、索引ページからリンクしている標準空間のページは659,347ページでした。トップページに「約 818,095 本の記事があります。」とあるので、15万ページほどが未登録ということになります(ただ、もちろんこの中には表記ゆれやショートカットのリダイレクトなど、索引掲載の必要がないものもあるとは思いますが)。--Jkr2255 2012年8月9日 (木) 14:30 (UTC)[返信]
    • コメント メインページに表示されている記事数にはリダイレクトを「含まない」ので、未登録分は「15万ページ以下」ではなく「15万ページ以上」となります。--氷鷺会話2012年8月9日 (木) 15:02 (UTC)[返信]
  • 提案 カテゴリ化を提案します。標準名前空間の全項目に __HIDDENCAT__ [[Category:総索引]] を貼り付けて機能する、カテゴリ機能を利用した総索引を試作してみました user:akaniji/Category:総索引。カテゴリ機能を利用すれば抜けはほぼ皆無になりますし、メンテナンスもbotで全自動化できると思います。いかがでしょうか。なお、現在はuser名前空間下にあるため、機能していません。一応、他のウィキにて試験済みで、結果は良好です。--Akaniji会話2012年8月12日 (日) 06:54 (UTC)[返信]
    • コメント カテゴリでは読みが一つに限定されるので代用はできないでしょう。 現状の索引は手動なので、漏れがある代わりに複数の読みがある場合にそれぞれの個所に登録できます。例えば金 (曖昧さ回避)は、Wikipedia:索引 こんWikipedia:索引 きんおよびWikipedia:索引 かねの3か所に登録されています。このように複数個所への登録ができない限りカテゴリは代用になりません。--アルビレオ会話2012年8月13日 (月) 00:16 (UTC)[返信]
      •  読みの問題であれば、それは紙の百科事典と同様にリダイレクトを置くことで解消できるのではないでしょうか。リダイレクトの方針の変更が必要にはなるかもしれませんが、金 (きん) / 金 (かね) / 金 (こん)のようなリダイレクトページを作成し、それぞれに読みのデフォルトソートを埋め込みます。他の例を出せば、複数読みのある「仮名」について言えば、仮名 (文字)のデフォルトソートは「かな」、仮名 (通称)は「けみよう」、そして今のところ登録のない「かめい」は仮名 (かめい)仮名へのリダイレクトとして作成し、リダイレクトページに「デフォルトソート:かめい」を登録するような感じです。--Akaniji会話2012年8月13日 (月) 05:18 (UTC)[返信]
        • (流れからここに書きます)リダイレクトページを作れば確かに解決するのですが、リダイレクトページを作る手間と、それが漏れることを考えるとかえって余計な作業になると思います。リダイレクトページで解決するものであればそもそも索引の登録漏れもなかったでしょう。
Akanijiさんの提案は、結局デフォルトソートが索引のキーになるのですよね。細かい問題点が2つあります。一つはデフォルトソートが設定されていないページがそれなりにありそうだ、ということ。もう一つはデフォルトソートは完全な読みではなく、濁点・半濁点や長音が省かれている、ということです。これから索引のためにデフォルトソートを完全な読みにするのは無理な話でしょう。ただ、索引の登録漏れを補う手段の一つとしてデフォルトソートから登録するのは良い考えだと思います。--アルビレオ会話2012年8月13日 (月) 20:51 (UTC)[返信]
リダイレクトを作る手間が発生するのは仰る通りです。ですが、読みが複数ある項目は、現行手動ゆえに取りこぼしている数(80万項目中15万項目以上)に比べれば、遥かに少ないでしょう。一字項目では該当する項目があると思いますが、二字以上の項目で読みが複数あるものは、相当に数少ないのではないでしょうか。
次に、ソートキーについて。濁音や半濁音・長音符は、並び替えの順位においては低位で扱うのが、紙の辞典では比較的普通ではないでしょうか。ソートキーから濁音と半濁音等を外しているのはunicode順でソートされる都合ですが、仰る通り、このために例えば、坂と嵯峨を並び替える際、もしかしたら嵯峨が先にくるかもしれません、が、まず同一ページ中には出てきます。読者の利用にあたって不都合はほとんどありませんし、手動更新ゆえの15万項目超の漏れに比較すれば些細なことで、修正の必要はないと思います(詳細は省きますが、濁点や半濁点をソートキーに含めるとぐちゃぐちゃになります)。また、ソートキーが登録されていないページが相当数あるのは仰る通りです。登録がなければ、漢字項目は漢字を見出しとしてソートされてしまいます。しかしながら、これ自体が解決の筋道です。というのも、ひとつのカテゴリに全項目が集約されることで、漢字を見出しとして、デフォルトソートが登録されていない項目が一覧として出てきてくれるわけです。あとは単純作業で、その一覧にあるものにソートキーを入力していけばいいので、単純明快、作業もはかどります。もともとソートキーの抜けは以前からの懸案でもありましたから、今回のカテゴリ化で修正のしやすさが向上するとすれば、一石二鳥というものでしょう。なお、全自動化目次が軌道に乗れば、20%もの漏れがある索引を「索引」と称したままメインページに掲示するのは読者の混乱のもとになりますので、メインページの索引は全自動化目次に差し替え、手動索引は全自動化目次を補う参考文書の歴史的文書としてアーカイブされることになると思います。--Akaniji会話2012年8月14日 (火) 04:15 (UTC)[返信]
Akanijiさんの提案が、索引の登録漏れの対策としては有効であり、ソートキー抜けの対策としても有効であることはわかります。しかし、Wikipedia日本語版へのインパクトが大きく、賛同者がもっと大勢あらわれないことには採用できないでしょう。私個人としても、合意が取れてカテゴリ化することになった場合は協力しますが、現時点での採用には懐疑的です。
まず、Wikipedia:即時削除の方針のリダイレクト2-3を廃棄する必要があります。これについては索引をカテゴリ化することの合意を取ることの一部になるでしょうから、合意さえ取れればあまり問題は無いかもしれません。
次に、一つの表記に複数の読み方がある記事の扱いについての合意が必要でしょう。現時点でソートキーが設定されていない記事には、花街(かがい、はなまち)のように複数の読み方があるため、あえてデフォルトソートを設定していない可能性があります。前に出した金 (曖昧さ回避)に対して金 (きん) / 金 (かね) / 金 (こん)のリダイレクトページを作る案では、結局金 (曖昧さ回避)はデフォルトソートが設定されないままとなります。かといって複数の読み方がある記事で、そのうちの一つをデフォルトソートに設定しようとすると、多数の記事でデフォルトソートの選択に関して議論になり、多大な労力を要することになる危険があります。(それこそ手作業で索引の登録漏れをなくそうとするよりも大きな労力になるかもしれません)
最後にデフォルトソートと索引で、順序が大きく変わるものをどうするかの問題があります。最大の問題は人名で、デフォルトソートは原則姓・名の順であるため、例えばハンス・アイスラーのデフォルトソートは「あいすらあ はんす」であり、現時点での索引が「はんす」に登録されているのと全く違うところになります。そのほかにも「バ行」と「ヴ行」の扱い、長音の扱いについても現状の索引とかなり離れた場所になる可能性があります。
他にも私が気付いていない問題が残ってる可能性が高く、より多くの人のコメント・賛同が必要でしょう。--アルビレオ会話2012年8月19日 (日) 00:22 (UTC)[返信]
IRCで相談していていろいろと変更点が。1点目:せっかく全部に貼り付けるなら[[category:総目次]]ではなくて{{全ページ}}のようなテンプレートを貼り付けたほうが、後々便利そう。
2点目:テンプレートを貼り付けていくなら、標準名前空間に限定する必要はない。名前空間を判定して出力できるから、例えば名前空間別に今後何かしたい時に便利。ソースは
{{namespace detect | main = [[category:総目次]]}}
という感じで考えています。--Akaniji会話2012年8月13日 (月) 05:18 (UTC)[返信]
  • コメント 私も索引の存在意義について気になりましたので、こちらに書かせて頂きます。
いつも私は新しいページの監視をしていますが、新規作成された記事を索引で調べてみると該当しないパターンがほとんどです(見落としている記事もあるかもですが)。
記事が作成されたらor索引に掲載されていない記事を勝手にbotがしてくれるというロボットはないのでしょうか?
あと、索引を見ていると一言解説がありますが、それは不必要ではないかなと思います。
何にせよ記事が作成されて索引に記事名を追加するという正直いうと”面倒”な動作は誰もしないと思います…。私もそうですし…。
この際索引を廃止にするか、botを作るかだと私は思います。議論のさなか横槍を入れ、申し訳ありません。--じぶろ会話2012年8月21日 (火) 07:06 (UTC)[返信]
コメント すでに何点かは出ているものもありますが、索引が存在するメリットを挙げると
  • 百科事典に索引が存在するのは当然である。
  • 読みが複数ある記事を検索できる。
  • 正確な読みがわかっていれば検索機能で記事を見つけることができるが、あいまいにしかわかっていない場合は検索機能では記事を見つけられず、索引で探す方が便利である。
  • (本来の目的ではないが)正しい読み方ではない読み方が一部で使われている場合、その読み方でも(登録されていれば)記事を見つけることができる。例 「じゅっち」→十地(じっち)
  • 索引を眺めていると面白い。
といったところでしょうか。そのメリットのなかには、手動で登録するからこそ実現できているものがあります。--アルビレオ会話2012年8月22日 (水) 22:02 (UTC)[返信]
  • コメント第2版投稿者です。私は概ねアルビレオさんの意見に賛同いたします。Akanijiさんのカテゴリ化は、容認はしますが積極的な賛成はできません。理由は、冒頭でたけたけしさんが仰っているように、ひらがなにはその文字から始まる単語が多い物と少ない物があること。従って、カテゴリが肥大化したり、過剰なカテゴリが生まれたりするというムラが出る可能性があるからです。(もし肥大化したカテゴリを分割してくれるボットがあるならその限りではありませんが)また○○氏というときにまるまるという読みと、まるまるうじという読みの二つがあるなど、読みが複数あり、しかも一つの記事にまとめられている場合(例:愛甲氏)にどう対処するかという問題が生じてくるためです。(手動索引なら、2箇所に同じ記事を書くことで回避できます。)--Psjk2106会話2012年9月2日 (日) 04:46 (UTC)[返信]
  • コメント 索引に項目として掲載されていない標準名前空間のページの一覧を作成しました。利用者:Burthsceh/索引にない標準名前空間のページをご覧ください。少し古くなりましたが、約半数が掲載されていないので、十分役に立つと思います。お時間がある方は、これらの索引への掲載作業をお願いします。--Burthsceh会話2012年9月3日 (月) 09:07 (UTC)[返信]

コメント 関連する話題「Wikipedia:井戸端/subj/ウィキデータを活用した索引の整備の実現可能性について」を投稿しました。ご意見をお聞かせください。--Doraemonplus会話2017年12月18日 (月) 14:45 (UTC)[返信]