利用者:MomijiRoBot


MomijiRoBot このアカウントはBotです.
(会話 · 投稿記録)
運用者: Momijiro会話
使用申請: 申請済み
フラグ: 有り (確認
作業内容: MomijiRoBot 機能を参照
動作間隔: 10秒
動作する時間帯: 不定
自動/手動: 自動(手動起動)
プログラミング言語: C#
その他: 自主規制(1日(0:00-24:00 JST)あたり稼働上限、延べ180分)の下運用

MomijiRoBot 機能

注記:日付はすべてJST基準

1.Check Wikipediaに基づくメンテナンス(雑草取り)

問題の報告は公の場であるプロジェクト‐ノート:ウィキ文法のチェックまでお願い致します。

ID# Priority 処理内容 詳細参照先 Bot処理開始
16 high Unicode制御文字(invisible)の内、Check Wikipedia #16に例示されている  (ZERO WIDTH NO-BREAK SPACE)、 ‎ (RIGHT-TO-LEFT MARK)、​ (ZERO WIDTH SPACE) のみ除去  Wikipedia:Bot/使用申請 20160816
2 high HTMLタグの修正 </br> → <br />, <br clear="all" /> → {{clear}} など プロジェクト‐ノート:ウィキ文法のチェック 20160827
2 high HTMLタグの修正 <br style="clear:both" /> → {{clear}} など プロジェクト‐ノート:ウィキ文法のチェック 20160904
34 high テンプレート要素{{PAGENAME}} を記事名に置換。 プロジェクト‐ノート:ウィキ文法のチェック 20160906
64 middle 文字列完全一致の場合、無用なパイプを除去 [[リンク|リンク]] → [[リンク]] プロジェクト‐ノート:ウィキ文法のチェック 20160906
2 high 孤立したspanタグの自己完結形 <span/> を除去。隠しカテゴリCategory:Pages using invalid self-closed HTML tagsも参照。 プロジェクト‐ノート:ウィキ文法のチェック 20160907
2 high パラメータ誤り(style属性値が clear:center)のbrタグを除去 プロジェクト‐ノート:ウィキ文法のチェック 20160907
2 high パラメータ誤り(clear both,style all)を{{clear}}に置換 プロジェクト‐ノート:ウィキ文法のチェック 20160907
2 high <br/と >の間の改行文字(\n)除去 プロジェクト‐ノート:ウィキ文法のチェック 20160908
17 middle カテゴリ重複除去 プロジェクト‐ノート:ウィキ文法のチェック 20160908
64 middle リンクのパイプ内修飾をリンク全体修飾に置換。基本的な置換パターン[[リンク|'''リンク''']] → '''[[リンク]]'''。アポストロフィ個数は1~8個の範囲のみ許し、他はスキップ。 プロジェクト‐ノート:ウィキ文法のチェック 20160914
1 low テンプレート内での Template: 名前空間名指定を除去。置換パターンは {{Template:テンプレート名…}} → {{テンプレート名…}} プロジェクト‐ノート:ウィキ文法のチェック 20160917
59 low テンプレートの値の終わりにある改行タグ(<br>,<br />など)を除去。基本的な置換パターンは{{テンプレート名<br>|引数1<br>|引数2<br>}} → {{テンプレート名|引数1|引数2}} プロジェクト‐ノート:ウィキ文法のチェック 20160923
9 low 1行中の複数のカテゴリを各行に分離(カテゴリ直前に改行コード(\n)が無ければ挿入)する。デフォルトソートも同様 プロジェクト‐ノート:ウィキ文法のチェック 20160925
2 high 孤立した(small類で唯一使用)smallタグの自己完結形 <small/> を除去。その他の<small/>はソース確認の上、除去または</small></code>への置換処理。隠しカテゴリCategory:Pages using invalid self-closed HTML tagsも参照。 プロジェクト‐ノート:ウィキ文法のチェック 20161002
48 low 自記事へのリンク(セルフリンク)を太字に置換。基本的な置換パターンは[[自記事名]] → '''自記事名'''。パイプ付リンクは [[自記事名|表示名]] → '''表示名''' プロジェクト‐ノート:ウィキ文法のチェック 20161004
64 middle 全体が英アルファベットのみで語頭の大文字・小文字違いは表示が変わらないようにパイプ除去。例示[[Wiki|wiki]] → [[wiki]]、[[wiki|Wiki]] → [[Wiki]] プロジェクト‐ノート:ウィキ文法のチェック 20161107
54 low 箇条書き末尾の<br>除去 プロジェクト‐ノート:ウィキ文法のチェック 20161110
11 low スート文字実体参照を文字へ置換。&clubs; → ♣, &diams; → ♦, &hearts; → ♥, &spades; → ♠ 無し 20161117
11 low 面積・体積単位に含まれる文字実体参照をHTMLタグに置換。例示 m&sup2; → m<sup>2</sup>、m&sup3; → m<sup>3</sup>。単位はmm,cm,m,km,in,ft,miなど。初出位置にはなるべく単位ページへのリンクを付す。例 km&sup2; → [​[平方キロメートル|km<sup>2</sup>]]など。記事に含まれる単位記号のCJK互換文字(たとえば平方メートル#符号位置)はなるべく他の適切な表現に置換。例、㎡ → m<sup>2</sup>など​ 無し 20161117
41 low <big>を等価な bigテンプレートに置換。基本パターン<big>文字列</big> → {{big|文字列}}。編集根拠はen:Wikipedia:HTML5#Obsolete elements and attributes。等価なタグへ置換も可能だが直観的に「文字を大きくする」ことが分かりにくいので採用しない。終了タグ</big>を持たないものはスキップ。
ネスト(入れ子)になったbigタグを持つ記事は処理スキップ。∵必要性を再検討すべき
無し 20161120
22 low Categoryに含まれる無用な空白を除去。()で示される分野名直前のスペース(0x20)および | 以降のソートキー先頭のスペース(0x20)は意味を持つので除去しない 無し 20161122
91 middle 外部リンクとして記述されたwikipediaへのリンクをwikilinkへ置換。例、[http://en.wikipedia.org/wiki/ARTICLE_TITLE DISPLAY_NAME] → [[:en:ARTICLE_TITLE|DISPLAY_NAME]]。スキップ条件(暫定)exteranal mediaテンプレートを持つ記事。 無し 20161122
27 low 数値文字参照文字実体参照に置換。&#8211; → &ndash; のみ。記事選別実行。 無し 20161127
40 low fontタグを等価な fontテンプレートに置換。基本パターン<font size="3" color="red" face="times, serif">文字列</font> → {{font|文字列|size=medium|font=Times, serif|color=red}}。

編集根拠はen:Wikipedia:HTML5#Obsolete elements and attributes。 終了タグ</font>を持たなければスキップ。fontタグ内でのsizeパラメータは1-7の整数値のみが合法。fontテンプレート値への変換はレンダリング・ニュートラルとなるよう 1 → x-small, 2 → small, 3 → medium, 4 → large, 5 → x-large, 6 → xx-largeとする(7はfontテンプレート定数値なし)。 fontタグ内のem, px, pt, %値指定は本来非合法だが救済。


(注)colorパラメータをもつウィキリンクは既定色優先が仕様(指定色は表示されない。色表示必要ならリンクを除去方)

無し 20161127
廃止 20161213
11 low 文字実体参照をHTMLタグ表現に置換。&sup2; → <sup>2</sup>。記事選別実行 無し 20161129
103 low パイプマジックワードを垂直バーへ置換。{{!}} → |。記事(またはテンプレート)選別実行 無し 20161130
11 low 文字実体参照をHTMLタグ表現に置換。&sup3; → <sup>3</sup>文字実体参照を文字に置換。&yen; → ¥、&times; → ×、&ldquo; → “、&rdquo; → ”。記事選別実行 無し 20161202
64 low «[[A|B]]でAとBが等しい時[[B]]へ置換する»、において「AとBが等しい」の定義を以下の通り拡張した(従来からの処理は完全に包含)。

Aのアンダースコア(0x5F)はスペース(0x20)として扱う。Bのアポストロフィ修飾は外して判断(これは別途リンク全体の修飾に変換する)。AとBは「先頭1文字」と「その後」に分けて、「先頭1文字」の大文字・小文字は同じと扱う(1st letter case insensitive 。ラテン文字以外にギリシア文字キリル文字なども同様)。「その後」の部分は文字列完全一致(文字種は問わない。改行以外の空白文字も可)。

  • 例示(従来基準で処理されなかったもののみ)
    • [​[Br-2_152mmカノン砲|Br-2 152mmカノン砲]​] → [​[Br-2 152mmカノン砲]​]
    • [​[Welcome-muzik|'''welcome-muzik''']​] → '''[​[welcome-muzik]​]'''
    • [​[S軌道|s軌道]​] → [​[s軌道]​]
    • [​[Ω-7脂肪酸|ω-7脂肪酸]​] → [​[ω-7脂肪酸]​]
  • whitelist送りの基準 手作業 
    • 末尾がピリオドの固有名詞 例示 [[乙三|乙三.]]。リンゴ娘. Yu-Pan. など
    • 末尾がdouble quoteの固有名詞 例示 [[DOG DAYS|DOG DAYS"]]

(備忘)eswiki限定仕様 B末尾のpunctuationの追出し

例示

  • [​[xxx|xxx.]] → [​[xxx]].
無し 20161203
3 high <ref> </ref>脚注は有るが出力する節を持たない記事に節「脚注」と{{Reflist}}を挿入(正確には、==脚注==\n{{Reflist}}\n\nを挿入)。事後の段組み変更を容易にするためReflistを採用(たとえば{{Reflist|2}}で簡単に2段にできる)。必須ではない脚注ヘルプは挿入対象としない。
挿入箇所を以下に示す(数字は優先順位)。
  1. 「外部リンク」節
  2. DEFAULTSORT(DEFAULTSORT前にテンプレ(群)がある場合その直前、たとえばAimai,Normdaten,Navbox,記事Stubなど。\n付加)
  3. Category(テンプレ(群)がある場合の扱いはDEFAULTSORTと同様。\n付加)
  4. 記事末


編集根拠はHelp:脚注Wikipedia:スタイルマニュアル (レイアウト)#記事の構成 、など。なおスタイルマニュアルでは「参考文献」節の前に置くのが正しいが意図的に無視。∵#3でリストアップされている記事のrefは一般に乏しい情報しか持たない(重要性が低い)ため。また外国語版の編集にも対応できるよう「関連項目」節の直前への挿入は廃止。(∵ReferencesがSee Alsoの前に来ることは無いen:Wikipedia:Manual of Style/Layout)。脚注節が既にある記事は原則処理スキップ(つまり既存の脚注節に{{Reflist}}だけ追加する処理は行わない。∵脚注節位置が誤っている事例多発)。ただし記事最末尾に脚注節が有るケースについては脚注節を適切な位置に移動した上で{{Reflist}}付加

無し 20161208
改訂20170104
91 middle 表示文字列を持たない外部リンク形式のウィキペディアリンクは[:国コード]のみ表示。例、[1][:en]
外部リンクでないにも関わらず#91にリストアップされているもの(例えば Cite web テンプレ内の url パラメータにもhitしている)しか含まない記事はリストから除去。
無し 20161210
83 middle 第1節のレベル(Lv: 節に付した片側=の数)が2(Lv2)で無ければLv2に修正。修正後次節との「段差」が2段以上となる場合は#25と同じ処理を行う。段差が1段の場合、次節以降のレベル修正は行わない。∵テストラン時、先頭見出しのみLv3とされているケースがあったため
編集根拠はHelp:セクションWikipedia:スタイルマニュアル (見出し)Help:ページの編集#見出し
無し 20161216
7 middle 第1節のレベル(Lv: 節に付した片側=の数)が2(Lv2)でなく、かつ他の節がすべて同レベルの記事について全てLv2に修正
編集根拠はHelp:セクションWikipedia:スタイルマニュアル (見出し)Help:ページの編集#見出し
無し 20161216
(bot flagなし)
25 middle 節レベル(Lv: 節に付した片側=の数)が上がる場合の「段差」が2段以上ある場合(例、Lv2の次がLv4)、直下は段差が1段になるようレベルを下げる。その配下の節も同じレベル数下げる。例示、Lv2直下のLv4はLv3に、そのLv4配下のLv5はLv4に…(以下同様)
編集根拠はHelp:セクションWikipedia:スタイルマニュアル (見出し)Help:ページの編集#見出し
無し 20161217
40 low fontタグを等価なspanタグに置換
  • 執筆中
無し 20161228以降
11 low HTML文字参照の最終処理
  • 執筆中
無し 20161229以降
104 middle ref nameへの引用符(U+0022)付加。他の約物(U+0027、U+201C、U+201Dなど)はU+0022に置換する
  • 例示
    • <ref name=ref名> → <ref name="ref名">
    • <ref name='ref名'> → <ref name="ref名">
    • <ref name=“ref名”> → <ref name="ref名">
無し 20170118
63 middle smallタグの除去
  • <ref>,<sup>,<sub>タグ内の<small>xxx</small>がある場合、<small>と</small>タグ除去(内側small)
  • <small></small>の間に<ref>,<sup>,<sub>タグが有る場合、<small>と</small>タグ除去(外側small)
無し 20170119
62 high <ref>内の不完全URIにhttp://を補充
  • www. … → http://www.
無し 20170315
56 low アスキーアートの矢印(執筆中)
  • 置換処理してはならないものをwhitelist送りにして除去する(手作業)
    • プログラミング言語の演算子
    • 酵素の系統名 例示: (1->4)-α-D-グルカン 1-α-D-グルコシルムターゼ
    • 特定の負値より小さいことを示す 例示: 融点 <-15°C
    • ヒエログリフ表現
      • <hiero>タグ 例示: <hiero><-𓇋-𓏠:𓈖-𓏝:𓏏*𓊪-></hiero>
      • {{lang|egyp|A}}テンプレート 例示: {{lang|egyp|<-𓍘𓇌𓏭𓀰->}}
無し bot編集外
68 off jawikiにおいて無意味な :ja: prefix除去。priority offであるがinsource:検索結果に基づき#68として処理
  • [[:ja:A]] → [[A]]
  • [[:ja:A|B]] → [[A|B]]

HTMLコメント内は対象外(仮リンク処理のコメント多数有り。これは除去禁止)

無し 20170401
85 low whitelist送りの基準 (執筆中)
  • Navboxのヘッダが空(表示文字列が無い場合)<div class="NavHead"></div>
    これは除去不可
無し 未定
43 high whitelist送りの基準
  • mathテンプレート、familytreeテンプレートを含む記事。

∵Check Wikipediaプログラムの抽出失敗。ダブルブレイス · 範囲を正規表現のみで抽出しようとしているがネスト(入れ子)では本来無理。

無し bot編集外


2.WP:BOTREQ作業

処理内容 詳細参照先 処理期間
Infobox内の空のnowikiタグ<nowiki></nowiki>を除去
スキップ条件(暫定)
1. <nowiki></nowiki>の直前文字がスペースまたは=ではない
2.<nowiki></nowiki>の直後文字が空白文字以外(\S)
差分:WP:BOTREQ 20161009
-