Wikipedia:井戸端/subj/利用者ページの検索避けのためのシステム開発

システム開発の依頼手続きについて[編集]

すいません。えーと、Wikipediaのシステム開発の依頼手続きについて知らないので、ご教授いただけないかと。

今回依頼したいのは、「利用者ページがサーチエンジンに検索されないようにする」ためのシステム開発です。具体的には、記事空間以外のページのヘッダにサーチエンジンのロボットを避けるタグを埋め込むように依頼したい。

これは、具体的にはとあるブロックされたユーザの行いをめぐる議論から出てきたものです。具体的には、当該ユーザが実在の人物の名前を使ってソックパペットを作りまくりブロックされまくったため、実在の人物名で検索するとそのブロック結果が表示されたページが高位置に表示されてしまうという問題が生じています。

Wikipediaのシステム(今回はアカウント管理系)については詳しくないんですが、ページの消去・アカウントの抹消などの対処は、おそらくWikipediaの基本システムや運営哲学への悪影響が大きすぎます。また、Wikipediaは百科事典を作ろうというプロジェクトですから記事空間が検索結果の高位置に表示されることは歓迎すべきことですが、利用者ページなどが高位に検索される必要は全くありませんし、メリットもありません。まあ、他に管理者が特定のページに対してサーチエンジンのロボット避けタグを埋め込めるようにするなどの方法はあり得ると思いますが、もろもろ考えると「記事空間以外のページには一括してロボット避けタグを埋め込む」あるいは「利用者ページには一括してロボット避けタグを埋め込む」などの手法がいちばん楽で実効的なものであるように思われます。

つきましては、現状2つほどお智慧を拝借したいことがあります。

  1. いちお、この問題を解決するための提案内容について、なんらかの合議を行うべきでしょう。それはどこでやればいいだろうか。
  2. また、案がまとまったら、それをシステム開発者に依頼せにゃなりませんが、それはどういう手続きでやればいいでしょうか。

お知恵をお持ちの方、よろしくお願い申し上げます。なお、上記問題はそれなりに緊急性があるので、ちょっと急いでおります。--Nekosuki600 2007年4月16日 (月) 08:03 (UTC)[返信]

2.だけ。 Bugzilla。ただ、この内容で開発者を説得できるかと考えると、難しいように思います。現状、それらのページがGoogleで行為にランクされてしまうデメリット(?)より、Googleで検索できるメリットのほうが勝っていると感じます。特に日本語版は検索があんまり精度良くないので。Tietew 2007年4月16日 (月) 08:12 (UTC)[返信]
1.だけ。特に必要ないですが、要求仕様が絞られていたほうが実現は早いでしょうね。メールでやるなら wiki-tech に出すのがいいかと思います。一方、すでにエクステンションとして実装されているがWikimediaではアクティブにしていないということなどもあるので、ラフな形でも Bugzilla へ先に要望としてあげてしまうという手もあります。ご参考になれば幸いです。--Aphaia 2007年4月16日 (月) 08:54 (UTC)[返信]
周辺読んでみたらこの機能実装済みみたいです。あとは理由ですね。Tietew 2007年4月16日 (月) 09:49 (UTC)[返信]
一律に利用者ページ名前空間からクローラをはじくのは、Tietewさんの言うとおり少し抵抗があります。個人の方が管理されている、プロジェクト運営上有用なリストなどがありますので。また、Category:Netanotaneの操り人形だと疑われるユーザーといったCategory空間のような記事空間に準ずるページにも当該利用者名は表示されています。ここまでを一括で除外するのはかなり無理がある気がします。対案としては、該当しそうな利用者ページは、Wikipedia:利用者ページの削除依頼に出して削除した上で白紙化保護してしまったら、いかがでしょうか?編集ページなどはロボット除けされているので、サーチエンジンが拾うことはなくなると思います。
なお、ロボット除外については、robots.txtで既に個別プロジェクトからの依頼で除外ルールを設定しているようですので、ある程度合理的な理由で合意が形成されれば、Bugzilla経由の依頼で通るように思います(Wikipedia:SDU/新規作成が禁止されたページについてはここで設定済みのURL規則を利用してロボット除外を実現してますね)。ご参考まで。--Masao 2007年4月16日 (月) 09:22 (UTC)[返信]
いま見てたら、de 等では削除依頼やブロック依頼等のサブページを対象にしていますね。固有名詞の入る可能性のあるWikipedia文書のサブページをことごとく対象にしている感があります。Categoryについては、命名規則をかえて Category:操り人形だと疑われるユーザー/xx のようにしておけば、カテゴリ自体をロボット避けするのは今後楽なのじゃないかしら。
利用者ページ全般については、私も賛成しかねますが、これ自体はコミュニティで合意が取れるかがまず問題ではないでしょうか(Bugzilla の議論で蹴られる可能性もあります。コミュニティから要望があるといっても開発日程とあわないとか緊急性を認めないという理由で放置される bug も多々あります)。いずれにせよ依頼は合意をまとめてからになりますから、緊急に対策してくれというのは無理でしょう。それで、個々のページについては、Masaoさんのいうように、検索対象にならない工夫を個々にするのが早いのじゃないかと思います。--Aphaia 2007年4月16日 (月) 10:09 (UTC)[返信]
ちなみに削除依頼ページのrobots.txtへの追加は2週間かかっています。これは某所からの依頼で行ったものなのですが、依頼者の方には待ってもらいました。Tietew 2007年4月16日 (月) 10:23 (UTC)[返信]
この拡張 を導入するのは技術的・制度的に難しいのでしょうか? この拡張が入ると利用者権限で対処可能なので、事あるごとにサーバー管理者様のお手を煩わせずにすむと思うのですが。--excl-zoo (会話/履歴) 2007年4月16日 (月) 12:59 (UTC)[返信]
その手の政策的な判断が出来る人は日本語版にはいないと思います。Wikitech-l などで議論をはじめるか、直接 Bugzilla で要望するのがよいかと思います。--Aphaia 2007年4月16日 (月) 13:06 (UTC)[返信]
荒らしや編集合戦を誘発することが容易に想像できるのでその拡張を入れることは反対です。Tietew 2007年4月17日 (火) 10:20 (UTC)[返信]

ここまでのまとめ。

  1. すでにそういうシステムは実装されている。
  2. しかしま、そういう設定をするという合意形成はむずかしそうである。
  3. ところで、ページ単位でのクロール避けは可能。多少の時間はかかるが。

そしたらまあ、利用者ページを軒並み検索からはずさせるというようなややこしい合意形成はやめて、問題が生じている利用者ページについて robot.txt に登録する方向で考えるというのがよろしいような。とりあえず現状のソックパペット群の利用者ページだけ、さっさと始末するという方向で考えましょう。--Nekosuki600 2007年4月16日 (月) 11:25 (UTC)[返信]

で、具体的にはどうすりゃいいでしょうか。Tietewさんにお願いしちゃっていいですか。問題のユーザのソックパペットのうち、実名風のものだけでかまわないんですが。--Nekosuki600 2007年4月16日 (月) 11:31 (UTC)[返信]

こういう検索をしてこのページがヒットする辺り、削除している意味すら無くなっているので、考慮すべきテーマではある気はしますね。--٢١٩.١٧٤.١٥٨.٢٢٥ 2007年4月16日 (月) 14:15 (UTC)[返信]

Nekosuki600さんのご要望にはお応え致しかねます。robots.txtに個別ページを含めるなんて嫌です。あと156cmは無関係のページが荒らされること問題なので、別に検索に引っかかるからといってどうということもないです。
というか、何でもかんでも{{indefblockeduser}}貼ってるのをナントカしたほうがいいじゃないでしょうか。あれは他の利用者への注意喚起用にあるわけなので、投稿履歴のない利用者に貼っても意味がないものです。Tietew 2007年4月17日 (火) 10:20 (UTC)[返信]
あーわかりました。とりあえず本件についてはTietewさんはあてにしないで考えます。--Nekosuki600 2007年4月17日 (火) 10:47 (UTC)[返信]
無関係のページが荒らされることが問題」…それは違います。最初から無関係のページへの荒しネタであったのであればTietewさんの仰る通りですが、事の発端は「関係のあるページ」で記入しては消し、記入しては消すが繰り返された結果として「荒しのネタ」になった訳です。(荒しは勿論批難されるべきですが、その原因が記事を消す側にもあったのは否定出来ないケースであると、客観的に見て、思います)--٢١٩.١٧٤.١٥٨.٢٢٥ 2007年4月17日 (火) 15:38 (UTC)[返信]
その「関係のあるページ」ってどのページのことをおっしゃっているんでしょうか?--202.94.140.34 2007年4月20日 (金) 08:11 (UTC)[返信]
まぁ落ち着いてください。Tietewさんの直近のコメントですが、個人攻撃色が強い感情的です。「個人的に嫌だから要望に応えられない」という風にしか読めません。落ち着きましょう。さて、本題のほうですが、当然ながら基本方針として「荒らしをのさばらせない」ということが根本的に重要です。基本的にこのような場合には親告された場合には何とか対応できる必要があると思います。すなわち、その本名の人が現れて、「このような不名誉な利用者ページが出てくるのはまかりならん」といわれた場合に、管理側にそれに対応する術があるのかどうかということです。管理の内実については残念ながら存じておりませんので、そのような用意があるのかご教示いただけると幸いです。--Ich57 2007年4月18日 (水) 13:20 (UTC)[返信]
別にTietewさんのコメントに個人攻撃色など見られませんが。むしろ貴君のコメントのほうが個人攻撃的だと思えます。--202.94.140.34 2007年4月20日 (金) 08:04 (UTC)[返信]
個人攻撃的との言い回しに反応する人がいらっしゃるので変更いたしました。それはともかく、私の発言は摩擦を避けよう(落ち着きましょう)と提案しているだけですから個人攻撃的では決してないと考えております。--Ich57 2007年4月20日 (金) 13:20 (UTC)[返信]

えーと。なんでこんなとこでもめてんの。

ご要望にはお応え致しかねます」というのはどういう立場での発言か不明です。もしや「自分は要望を取り次ぐルートを知っているが、取り次ぐほどの労をとりたくない」という意味であれば、たしかにNekosuki600さんがおっしゃるように「じゃあほかあたるよ」という話で終わりです。個人攻撃だなんだというほどのことではないでしょう。強いて言えば、その取り次ぐルートを教えておいてから議論の場から離れていただきたいですが。ついでに「その手の…判断が出来る人は日本語版にはいない」といった発言も、どういう立場での発言か不明です。ウィキペディアでは、判断するのは利用者の議論によって成り立つコミュニティですから、「日本語版にはいない」というのは「日本語版には議論ができるひとがいない」と言う意味ととれます。

で、Nekosuki600さんは「開発」と述べていらっしゃいますが、具体的にどういうレベルでの「開発」を求めていらっしゃるでしょうか。たとえば、robots.txt へどういうパターンを登録するかといったことを議論して決定することも「開発」にはちがいないですが、extension を組み込むことや、さらには新規の extension を開発することも、開発にはちがいありません。この「開発」のイメージがはっきりしないため、議論の終着点のイメージもひとによって技術的な解決だったり政策的な解決だったりするようにおもいます。

なお、いずれにしても今回のご提案が、即時に結果をもたらすとはお考えにならないほうがよいかとおもいます。とりあえず急ぐのでしたら、個人の独断で Developers にメールでも書いて robots.txt にいれてもらえばいいんじゃないでしょうか。robots.txt であれば、設定の回復や調整はあとでも可能ですから、文句がでたら、あらためてじっくり議論して、どのような方針をとるかつめていけばいいとおもいます。 --Hatukanezumi 2007年4月21日 (土) 12:09 (UTC)[返信]

「その手の…判断が出来る人は日本語版にはいない」について誤解があるようなので。私がここで想定しているのは Wikimedia Foundation がもっている各ウィキの技術的な設定です。サーバ管理者がその判断を行うのであり、かつコミュニティからの要望をサーバ管理者はすべて取り上げるわけではありません。そして日本語プロジェクトにはその意味での管理者はいません。ですのでいないと申し上げました。ご参考までに。--Aphaia 2007年4月26日 (木) 09:19 (UTC)[返信]


いやあ。当初なんかシステム開発をしないとだめかなあと思っていたんですが、すでに実装はされているらしいし、robot.txt への記載でもいけそうだし、開発はいらんかなと。
で、おれとしてはWikipediaがなんらかの被害を受けないようにするためには考えておいた方がいいと思いましたのでこの節を立てたのですが、その必要性を強く求めていたひとはこちらに誘導しても出てこないし、何かがあったら真っ先に被害を受けそうな管理者が消極的だし、おれ的にはもうどうでもいいというか、おまえら勝手にやってろって感じ。
少なくともまあなんだね。「積極的な支持者は現れなかった」「管理者のひとりは明確に反対した」という記録が残りましたから、このままフェードアウトしても異論はありません。なお後日、おれが懸念表明をした問題が顕在化したときには、対処を求めたくせに支持しなかったやつ・明確に反対したやつには、猛烈な批判を浴びせる。それはもちろん当然のこととして。--Nekosuki600 2007年4月21日 (土) 13:27 (UTC)[返信]
猛烈な批判を浴びそうな者ですが、とりあえず関わった者としては利用者ページの検索避けに対する何らかの対処は必要と考えます。せめてロボット検索にひっかからないようになれば、削除された不適切なユーザー名がGoogleでトップに来る、という問題が避けられると考えます。現状では削除しても模倣者にネタを提供する可能性も否定できません。--Preacher 2007年4月23日 (月) 09:55 (UTC)[返信]


参考資料[編集]

ドイツ語版でのある議論de:Wikipedia:Meinungsbilder/Nichtindizierung von Diskussionsseiten durch Suchmaschinen(ドイツ語)と、その結論をもとにした依頼MediaZilla:4937(英語)
類似の事例と思うのでご紹介します、が、問題の発端や議論の内容は難しそうなので(なんちゃって)割愛しますスミマセン。議論、投票を経て具体的に索引化を禁止するよう要求された対象はこのとおり(ファイル自体には不備の指摘あり)、おもに、「Wikipedia名前空間のある部分」(これは緊急?)と、いわゆる「ノートページ全体」(これは予防線?)の2種だったようです。開発者側の報告によると、結局、プロジェクトページについてはrobots.txtへの記載が行われ、ノートページについてはmetaタグが追加されました。たしかに今観察した限り、ドイツ語版のノートページには相応のmetaタグが入っているようです。以上拾い読み的ですが、ご参考まで。Mulukhiyya 2007年4月23日 (月) 09:32 (UTC)[返信]