Wikipedia:編集フィルター/一覧/大きなサイズの増減

ナビゲーションに移動 検索に移動

大きなサイズの増減の過去ログ

大きなサイズの増減[編集]

作成済 作成済
目的 サイズの大きな変更に対して、これを検出し、荒らしやテスト投稿などの確認を行ないやすくする。
理由 荒らしやテスト投稿は、比較的サイズの増減の大きいものが多く、通常、これらは専用のツール(IRCやバンダルファイターなど)を使って対処されていますが、これをフィルターにかけて検出することで、より防止しやすくなると考えられます。
フィルター 編集フィルター#20変更履歴一致記録

--青子守歌会話/履歴 2010年9月25日 (土) 14:54 (UTC)

コメント 目的としてはとりあえず「検出する」ということで、対処操作はタグ付けを想定していますが、警告を入れべきどうか、そして、発動条件も、サイズの閾値をいくつにするか(いくつぐらいがいいのか)、対象の利用者グループはどうするのか(全員か、非自動承認利用者か、投稿回数などで決めるのか)、提案はしていますが、仕様は非常に曖昧です。公開・非公開に関しては、閾値があるので、非公開にすべきという意見と、特に悪意を持った利用者への対応は想定しなくていいから公開で良いという意見があるかと思います。みなさんからのご意見をお待ちしてます。--青子守歌会話/履歴 2010年9月25日 (土) 14:54 (UTC)
コメント ページの分割や統合、大量の加筆などでもこのフィルターにひっかかるのでしょうか。もしそうでしたら問題のない投稿でもフィルターにひっかかったという記録が残りますよね。あと、閾値についてですが、悪意のある利用者ならそれよりわずかに小さいサイズの変更を行いフィルターを回避する可能性があります。あまり小さくしても意味はないでしょうし、まず閾値をいくつにするかが難しいところだと思います。--長月みどり 2010年9月25日 (土) 20:11 (UTC)
コメント もちろん、それらに対しても発動しますので、フィルター記録にはそれらが残ります。が、フィルター記録はあくまで「記録」でしかないので、それがそのまま「何かまずい操作をした」ということとは等価ではありませんから、そこまで気にする必要はないです(もしフィルター記録に残すことすらダメとなった場合、フィルターの作成や修正などの運用効率が大幅に低下し、最悪の場合、機能が形骸化してしまうでしょう)。閾値に関しては難しいところですが、既に動いているツールがいくつぐらいに設定されているのかが参考になるかと思います。公開については、まずとりあえず公開にしておいて、あまりにも悪意を持った利用者の操作が多そうな場合は、非公開にする手もあります。ただし、非公開にしておくと、悪意を持った利用者は「これはどうかな?これはどうかな!?」とやりかねないので、その辺りはよく考慮すべきことかと思います。--青子守歌会話/履歴 2010年9月26日 (日) 02:40 (UTC)
賛成 IRCの#wikipedia-ja-articlesチャンネルでLinky-rcが発する「VANDAL ALERT: -1205 bytes」のような注意をRCで表示させるということであれば、賛成します(IRCクライアントをインストールしていない方もブラウザでご覧いただけます)。フィルターを意識して荒らすようなLTA編集の検出はこのフィルターではあきらめ、初心者のいたずらを検出することを主眼にしたらいいと思います。それ以外の、大量加筆、問題記述の除去、分割や統合、ノートへの長文意見もこのフィルターでピックアップされますが、結果として多くの人が見ることになるのはむしろ歓迎してよいことと考えられます。ただ、検出結果は千差万別で良い編集も含まれるため「警告は入れない」とすべきでしょう。またRC上で誤解を招かないよう「穏当なタグを用いる」のがよいと思います。たとえば・・・
  •  Tag:大きな増減
  •  Tag:大きな加筆  と  Tag:大きな除去
など。閾値は最初、2000ないし3000バイトとしておき、フィルターの稼働状況を見て加減するのがよいと思います。--miya 2010年9月26日 (日) 14:46 (UTC)
コメント 3000バイトはUTF-8日本語で1000文字ぐらいということで、反応しすぎかなという気もします。10k~30kバイトぐらいでもいいのでは。--崎山伸夫 2010年11月11日 (木) 11:57 (UTC)
賛成 警告には根拠がないですが、タグを付けるだけなら問題ないと思います。タグを付けることで、「最近の更新」で検索できるようになれば(オプション・フォームの修正も必要なのでしょうが)、探しやすくなるものもあると思います。閾値についても根拠はありませんが、荒らしなどに惑わされずに、運用しながら増減させることは必要な調整でしょう。--Frozen-mikan 2010年9月26日 (日) 15:07 (UTC)
コメント 閾値について、例えば24時間観測でいいので、どれほどのサイズの増減があるのか、特別:最近の更新から拾って度数分布表などにまとめて、統計をとった方がよいかと思います。--青子守歌会話/履歴 2010年9月27日 (月) 03:02 (UTC)
コメント 増減の「減」の方ですが、提案者自身がこんなこと言うのもなんですが、削除関連や白紙化などへの対応が難しいように思います。何を回避すべきか、考える必要があるのではないでしょうか。--青子守歌会話/履歴 2010年10月1日 (金) 13:40 (UTC)
コメント タグ付けだけなら、削除関連や白紙化でも問題は起きないと思いますし、初版投稿者による白紙化がタグで検出されることも有用だと思います。試作してみれば、何を回避すべきかも見えてくるのではないでしょうか。--miya 2010年10月20日 (水) 09:28 (UTC)
コメント 導入や議論などお疲れ様です。別の目的で動かしたbotの副産物でサイズ増減の統計が取れましたのでご報告いたします。2011年02月10日 13:02:01 UTC - 2011年02月12日 13:02:01 UTCの48時間のものです。サイズは1k = 1000バイトです。(利用者:Igitur/加筆・新着記事ダイジェスト#統計としてしばらく毎日自動更新する予定です)
新しい記事のサイズ統計
サイズ 0~ 500~ 1k~ 2k~ 3k~ 4k~ 5k~ 6k~ 7k~ 8k~ 9k~ 10k~
頻度 217 43 156 119 52 28 19 23 12 9 9 29 716


最近の更新のサイズ増減統計
サイズ ~-10k -10k~ -9k~ -8k~ -7k~ -6k~ -5k~ -4k~ -3k~ -2k~ -1k~ -500~ 0~ 500~ 1k~ 2k~ 3k~ 4k~ 5k~ 6k~ 7k~ 8k~ 9k~ 10k~
頻度 12 3 5 10 10 14 13 21 52 154 179 5638 21482 787 447 145 49 30 19 17 15 8 3 26 29139
当初の目的とは違うのかもしれませんが、もし大きな増加をタグで一覧できるようになればWikipedia:最近大幅加筆された記事への報告を促進できるのではないかと期待しております。タグ付けまでならまずは試してみても良いのではないでしょうか。
タグの名称なのですが、サイズが増加しているから加筆とは限らず(除去のリバートや有害物の貼り付けもあります)、減少していても情報源を伴う有意義な加筆や少なくとも整理である場合も少なくないようです。タグにはニュアンスを一切与えず、「大幅なサイズ増加」「大幅なサイズ減少」などとした方が良いように思います。単なるサイズ増減のフラグであれば対応を難しく考える必要もないでしょうし。--Igitur 2011年2月12日 (土) 17:04 (UTC)
コメント データ提供ありがとうございます。実のところ、私自身はすでに増減についてのデータは手元で取得して解析してありました。おおむね同じ傾向が見られます。ただし、この中で果たしてどのあたりが問題のある編集とみなされるのかについて検討がまだなので、提出(コメント)をためらっていました。付与する対処操作としきい値の公開or非公開にもよると思いますので、まずそちらを詰めてから、具体的なしきい値の検討に入った方がよいだろうとも思います。--青子守歌会話/履歴 2011年2月12日 (土) 20:49 (UTC)

対処操作と発動条件[編集]

あらためて仕切り直しの意味で節を分けます。本フィルターについては、対処操作はタグ付けのみ(通知文もなし)、発動条件(フィルターのしきい値)は非公開で作成することを提案します。タグ名は、フィルター名と同様「大幅なサイズの増減」を提案します。--青子守歌会話/履歴 2011年2月12日 (土) 20:49 (UTC)

賛成 その条件にて、改めて賛成表明します。--miya 2011年2月27日 (日) 14:05 (UTC)

長いこと反対意見は出ていませんし、明日あたりにこの条件で作成します。そして、1週間後、問題がなければタグ付けを行ないます。--青子守歌会話/履歴 2011年2月27日 (日) 15:15 (UTC)

報告 編集フィルター#20変更履歴一致記録で作成しました。--青子守歌会話/履歴 2011年2月28日 (月) 21:55 (UTC)
報告 フィルター#20の第204版差分)で、サイズの大幅な増減タグタグが付与された最近の変更を付ける対処操作を付与しました。--青子守歌会話/履歴 2011年3月11日 (金) 00:35 (UTC)
(コメント)新規記事にもこのタグが付けられていますが、個人的には新規記事という目印があれば十分だと思います。 kyube 2011年3月14日 (月) 03:10 (UTC)
(コメント) kyubeさんの意見に同じく。先日私が新規作成した記事(30KB越え)に対して発動しましたが、
  1. 翻訳記事であればこのクラスのサイズはありがち
  2. 私の参加した頃とは異なり最近は新規記事に対する監視の目はそれなりに働いているので、タグ付けによって(タグ付けがない状況に比べて)荒らし検出をより効果的にできるかというと疑問
  3. 荒らし検出という目的で且つ新規投稿に限定して考えれば、サイズの小さいもの(1文のみ、など)も(具体的な数字を持っていませんが)結構ありがちかなと推測しており、荒らし検出という目的に沿ったものとならないのではという疑問
といったあたりの理由から総合判断して、荒らし検出という目的を考えれば、新規記事には不要ではないかと思います。--NISYAN 2011年3月22日 (火) 15:50 (UTC)
チェック フィルター#20の第213版差分)で新規作成を除外にしました。--青子守歌会話/履歴 2011年4月5日 (火) 10:11 (UTC)

コメント 気になったことを2つ挙げます。

  1. 利用者ページにもこのフィルターを働かせる必要があるのか
  2. 現在の閾値は適切なのか

皆さんはどう思いますか。 --プログラムノート/履歴/ログ 2012年1月7日 (土) 13:12 (UTC)

議論が止まって久しいですけれど、ここに問いかけがあるのに気が付いたので、1言だけ。私は、利用者ページは対象から外した方がよろしいかと思います。特に、利用者の下書きページのサイズの増減は、監視する必要性を全く感じません。--G-Sounds会話) 2013年8月8日 (木) 18:00 (UTC)
なお、ユーザーページについては自分のページを編集した時だけ発動対象から除外するという処理でもよろしいかと思います。要するに他のユーザーによるイタズラの検出の一助にするための措置です。
ただ、1週間考えてみましたけれども、ユーザーページをこのフィルタで監視しておく意味は、今述べた他のユーザーによるイタズラ検出の一助にすることくらいしか無いように思えます。しかも、他のユーザーによるイタズラの検出には、各ユーザーページの他者による編集を監視するようにすれば良いと思いますので、わざわざこの「大きなサイズの変化」フィルタによる監視は必要ないと考えます。
というわけで、ユーザーページについては「大きなサイズの変化」フィルタの監視対象から外してしまうのが、効率が良いと私は考えます。--G-Sounds会話) 2013年8月15日 (木) 15:15 (UTC)

ここに書いて良いことか分かりませんが、発動条件に関して版指定削除(特に要約欄も利用者名も消去された場合)になった版は検出除外およびログからも表示除外にすることを要望します。某LTAのせいでまともな形の大幅加筆やリダイレクトからの長文記事化、並びに他者による白紙化などの荒らしを発見しにくくなることもあります。--K-iczn会話) 2015年4月27日 (月) 15:44 (UTC)

コメント フィルターは編集を行った時点でのみ発動するもので、後から内容を再確認しているわけではないため、発動条件で削除されたかどうかは判定できません。
ログエントリの削除はオーバーサイトグループに属する利用者のみが実施できます。オーバーサイト個人宛とかOTRSでオーバーサイト依頼を飛ばしてください。こっちも気付けば勝手に削除しますが、管理者と違ってそんなに人数が多くはないので、放っておけばいつか対処されることを期待しないでください。素っ気ない言い方かもしれませんが、人間が時間と手間を掛けるものなので、例えば全員が多忙なら誰もフィルター記録なんてチェックできません。よろしくお願い致します。--Marine-Bluetalkcontribsmail 2015年4月27日 (月) 17:12 (UTC)

上で提案がありますが、利用者空間は除外した方がいいように思います。日によっては半分以上が利用者sandboxの編集という事もありますし、そもそも利用者空間なら万が一荒らしが発生しても気づきやすく、かつ影響が小さいので荒らし検出用としては意義が薄いのではないでしょうか。--Karasunoko会話) 2016年6月17日 (金) 13:19 (UTC)

コメント G-SoundsさんとKarasunokoさんによる賛成があり、かつ数年間にわたって反対者が現れなかったことにより合意がとれたとして、変更の実施を予告いたします。ただし、間が空いてしまっているので、猶予期間として3日程度待つとします。--ネイ会話) 2017年5月5日 (金) 15:19 (UTC)

チェック 宣言通りフィルターを編集しました。1週間ぐらいテストしましょう。--ネイ会話) 2017年5月11日 (木) 02:22 (UTC)

コメント その後、特に問題ない模様なので、日曜辺りにでも過去ログ化します。--ネイ会話) 2017年5月29日 (月) 17:31 (UTC)