コンテンツにスキップ

Help:Pywikipediabot/copyright.py

Copyright.pyHelp:Pywikipediabotフレームワークの一部であり、著作権的に疑わしい文章をグーグル、ヤフー、ライブサーチで検索することのできるスクリプトです。

グーグルで検索する場合、pyGoogleモジュール([1])とGoogleのAPIライセンスキー([2])が必要です。しかし現在は配布されていません(2006年から)。

ヤフーで検索する場合、pYsearchモジュール([3])とYahoo AppID([4])が必要です。

ライブサーチを使用するのであれば、SOAPpyモジュール([5])とAppID([6])が必要です。

構成

[編集]

使用する前に、あなたのuser-config.pyに一つ以上のライセンスキーを書き込む必要があります。:

yahoo_appid = 'Key'
msn_appid = 'Key'

引数

[編集]
引数名 説明 デフォルト値
-g グーグル検索を使用します。
-ng グーグル検索を使用しません。
-y ヤフー検索を使用します。
-ny ヤフー検索を使用しません。
-maxquery 指定されたクエリ数で停止します。 25
-new 新しいページのみを対象とします。
-repeat
-output 外部出力が有効となります。指定されたファイルに結果を付け足します。 出力先:'copyright/output.txt'
-file ローカルなテキストファイルから与えられたすべてのページで動作します。すべてのウィキリンクを読み込み使用します。"-file:filename"として与えることも可能です。
-cat 指定したカテゴリにあるすべてのページで動作します。"-cat:categoryname"として与えることも可能です。
-subcat ページが-catによって指定されている時、サブカテゴリも読み込むように設定します。-catが与えられていなければ、この引数に効果はありません。
-page 指定したページのみをチェックします。"-page:pagetitle"として与えることも可能です。"-page:title1 -page:title2"のように複数回使用することも出来ます。
-ref あるページにリンクしているすべてのページで動作します。"-ref:referredpagetitle"として与えることも可能です。
-filelinks ある画像にリンクしているすべてのページで動作します。"-filelinks:ImageName"として与えることも可能です。
links あるページからリンされているすべてのページで動作します。"-links:linkingpagetitle"として与えることも可能です。
-start 与えられたページから処理を開始し、wikiのすべてのページで動作します。
-namespace:n 動作する名前空間を指定します。"-namespace:0,2,4"のようにすることも可能です。

すべての Bot で利用可能なグローバル引数

-lang:xx Bot を稼動させたいウィキの言語コードを設定します(日本語であれば "ja")。これはウィキメディア・コモンズのための "-lang:commons"を除く user-config.py(における言語コード)の設定をオーバーライドします。
-family:xyz Bot を稼動させたいウィキペディア、ウィクショナリー、ウィキメディア・コモンズ…といったウィキ・ファミリーを設定します。これは user-config.py における設定をオーバーライドします。
-help Bot の解説やコマンド引数などのヘルプ文書を表示します。
-log ログファイルの出力を有効にします。logs サブディレクトリに保存されます。
-log:xyz ログファイルをファイル名 xyz として出力を有効にします。
-nolog ログファイルの出力を無効にします(もし、user-config.py における設定が使用可能であれば)。
-putthrottle:n
-pt:n
動作間隔。Bot がページの編集を保存してから次の保存までの時間を秒数で指定します。

使用例

[編集]

50の新しい記事をチェックしたい時:

python copyright.py -new:50

クエリ値の制限なしにあるカテゴリのページをチェックしたいとき:

python copyright.py -cat:"Wikipedia featured articles" -maxquery:0