Wikipedia:井戸端/subj/CC-BY-SAの帰属表示の書き方は?

CC-BY-SAの帰属表示の書き方は?[編集]

CC-BY-SA がしばらく前に利用可能となりましたが、帰属表示の書き方がよくわからないので教えてください。現在計画しているものはテキストマイニングの一種で、ランダム性の強い方法でページを選び、その本文から単語の出現頻度など様々なデータを取り出し、見やすいように整形して出力します。Wikipedia:ライセンス更新によれば、帰属表示には「最新の著作者と以前の著作者」を含める必要があり、このアプリケーションの場合、参照したすべてのページのすべての編集者を帰属表示に含める必要があるのですか?その場合、帰属表示は大変な量になることが予想されるので避けたいところです。また、「作品のタイトル」とはウィキペディアではなんのことを指すのでしょうか?項目のタイトルでしょうか?また、参照したすべてのページのタイトルを帰属表示に含める必要があるのでしょうか?また、帰属表示の場所は「任意の合理的な方法で提供される」そうですが、例えばこのアプリケーションのデータを掲載したサイトの1ページにすべてまとめて書く方法でよいのでしょうか。しばらくウィキペディアに関わっていないので件のライセンスの議論も全く追っていません。これらの疑問についてのページも探しましたが、見つかりませんでした。もしこのような帰属表示について詳しく具体的な説明があるページがあったら、それも教えていただけたら幸いです。--Foxtrot 2010年3月16日 (火) 18:40 (UTC)[返信]

CC-BY-SAの詳細については、原文[1]を参照ください。非公式訳Wikipedia:クリエイティブ・コモンズ 表示-継承 3.0 非移植、非移植ではなく日本版の訳のドラフトPDFが参考になるかもしれません。ウィキペディアでの定義などについてはWikipedia:著作権が参考になるでしょう。以下、簡単にぼくなりの説明をしますが、できるだけご自身で判断してください。責任は負いかねます。
「その本文から単語の出現頻度など様々なデータを取り出し、見やすいように整形して出力」の結果、元の文章の思想・感情の表現が感得できるほど残っていなければ、著作物の使用とは言えず、ライセンスを守る必要がないということになります。
使用となるような場合であれば、すべてのページのすべての編集者を帰属表示に含める必要があります。許諾者又は原著作者ではない編集者、つまり執筆や改変に創造性が認められないと考えられる編集者については、共同著作物の著作権者とならないと判断するならば、履歴の差分を追って除外することもできるかもしれません。帰属表示は大変な量になりますが、そうでなければ、編集に参加したすべての著作権者に許諾を得ることになりますから、それと比較すれば労力は相当軽減されると思います。「作品のタイトル」は通常記事名になるでしょう。「このアプリケーションのデータを掲載したサイトの1ページにすべてまとめて書く方法でも」よいと思います。
ウィキペディアを使ったデータマイニングでの論文発表などを考えられているのであれば、cinii[2]で「ウィキペディア」または「Wikipedia」で検索すればいくつか論文が得られますし、過去2度のWikipediaワークショップ[3][4]での発表資料が参考になるでしょう。--Ks aka 98 2010年3月16日 (火) 19:14 (UTC)[返信]
それが二次著作物であれば、どうやらすべての著作者を帰属表示に含めなければならないというのはわかりました。計画中のアプリケーションの場合、データの抽出の結果データに記事全体がそのまま含まれることはおそらくありせんが、もしかしたら文の単位でウィキペディアの記述が結果に含まれるかもしれません。それでも元の文章の思想まで読み取れなければ二次著作物とは認められないということですよね。こうなると CC-BY-SA の詳細というよりは、このテキストマイニングがどこまで二次著作物とされるかという線引きの話になりますか。二次著作物とは認められなければ問題はなにもないのでありがたいのですが。
もし帰属表示が必要と判断された場合、帰属表示を示すための「合理的な方法」として、ウィキペディアへのリンク ( 単に http://ja.wikipedia.org/ ) を示すだけでは帰属表示として認められないでしょうか。テキストマイニングでどのデータはどのページに依存しているとか判別できないごっちゃの状態にあるわけで、参照した個々のページを示すことはあまり意味がないわけです。リンクだけ示しておけば、著作権者を知りたいと思ったらウィキペディアを参照すればいいわけですから。たしか GFDL でも元のページの URL を示しておけば著作権者の表示は省略できるとかいう話だったような気がします……。
また、著作権者名にいわゆる IPユーザは含められるでしょうか?個人を認識できないから要らないか。--Foxtrot 2010年3月17日 (水) 07:02 (UTC)[返信]
《たしか GFDL でも元のページの URL を示しておけば著作権者の表示は省略できるとかいう話だったような気がします……。》については誤解なさっています。必要ならば再読をおすすめします。--iwaim 2010年3月17日 (水) 08:00 (UTC)[返信]

個人的には、百科事典のような事実を簡明に記述する性質のもので、一文のみならば問題にはなりにくいと思います。

個々のページについてはリンクバックでよいということにはなっています(wmf:Terms of Use#Information for re-users/日本語訳。その制定過程が日本の国内法上どうなるかはちょっとよくわかりません)。ja.wikipedia.orgで大丈夫とは言い難いです。GFDLのライセンス自体はリンク・URLによって履歴の保存に代えるということは規定されていません。日本語版では、比較的早い時期から、少なくともウィキペディア内の翻訳や転記をする場合の解決策として、独自に投稿者に同意を求めるという仕組みにしてありました。

「どのデータはどのページに依存しているとか判別できないごっちゃの状態」であっても、それが先行する創作物の表現を利用している以上、参照した個々のページを示すことには意味があります。判別できるように記録を残しながら処理をしなければならないということになる。

ぼくはIPユーザは著者または著作権者の名義として含められると解しています。--以上の署名のないコメントは、Ks aka 98会話投稿記録)さんが 2010年3月17日 (水) 08:13 (UTC) に投稿したものです(Uryahによる付記)。[返信]

Ks aka さんか示してくれたwmf:利用規約#再利用をされる方へによれば、GFDL ではやはりリンクバックでいいようですね。もし完全な履歴を含めなければならないなら、Wikipediaが書籍化、百科事典として出版へで出版された百科事典のページの半分(もしかしたらそれ以上?)は履歴になってしまいますし。iwaim さんがいうように GFDL をざっと眺めてたかぎりはリンクバックでいいとの記述も見当たりませんが、そういうようには運用されていないということでしょうか。
今回は現実的に言ってウィキペディアを使うのは難しそうですね。まあ趣味的に計画していたものなので、ライセンス上難しいならあきらめても構わないのですけど。なんかライセンスが定められていないデータより、きっちりライセンスが定められたデータのほうが使いにくい気がしてきた……。--Foxtrot 2010年3月17日 (水) 15:48 (UTC)[返信]
ぶっちゃけ、他の大手サイトやアプリなどを見て、その表記を真似とけばOKです。細かくやるなら、ネット上にページ用意して、利用した記事とその履歴へのリンクを、一覧として置いといて、readmeテキストかバージョン情報からリンクしておけば完璧です(そこまでやってるアプリは見たことありませんが。)--Was a bee 2010年3月17日 (水) 16:02 (UTC)[返信]
「GFDL ではリンクバックでいい」というのは誤りです。ウィキメディアのプロジェクトでは、財団として、そのように運用すると表明しているというだけです。
たとえば、英語版はpdfを作ることができます。左側のサイドバーのところ。Wikipediaの記事では28ページ中5ページを費やしてContributorsを掲載しています(IPは除外されているようです)。
現実的には、データマイニングでウィキペディアを使うのは難しくないと思いますよ。紹介した通り、先行研究もあります。著作権法でいう「使用」に当たらないような配慮をし、それで補えないものについては、必要に応じて適法に引用するか、それでも無理なら、その記述の元となる記事・文書についてだけはリンクバックすればいい。ここでは、どういう形で公表するかがわからないので、法的な面でのやりとりになっていますが、実務的な判断はそれほどややこしくはないと思います。--Ks aka 98 2010年3月17日 (水) 17:45 (UTC)[返信]
GFDLは取らない方がいいですね。とりあえずこの領域はまともな判例も公的なガイドラインもない所なんで、誰もが可能性の議論しかできません。最後は常に「自己責任で」という曖昧な答えしかないです。何が「使用」で何が「引用」でという話もまた、プログラムの細かい仕様に依存してどーだこーだという話になってきます。とりあえず単純に、訴訟大国アメリカで上場してる営利企業のサイト[5]があります。そこらを一つの目安にしとけばいいんじゃないかと僕は思います。以下は参考情報です。
--Was a bee 2010年3月17日 (水) 20:08 (UTC)[返信]
こんにちは。ちょうどそのライセンスの翻訳の直しをしていることなどもあって、ライセンスの文面を何度も読んでいたので、僕の理解しているところを説明させて下さい。法曹資格者などではないので、勘違いもあるかと思いますが。。前提として、CC-BY-SA 3.0 Unportedのライセンスをそのまま継承して(3.0USなどにはつけかえずに)利用・公表するというケースを想定しています。
まずライセンスを見てみると、おおよそ3種の要求事項があります。
  • そのまま継承しなければならないものが3種類あります。(a)ライセンス・ノーティス、(b)免責事項に関するノーティス、(c)著作権表示の3つです。これらについては keep intact という表現が使われているので、書き換えたりしない方がよいのだと思います。
  • どこかに表示しなければならないのが、ライセンスのURLかライセンス全文。
  • 他に「あなたの用いているメディアや方法に照らして合理的な方法で」表示するように要求されている情報群があります。(i)著作者、(ii)作品のタイトル、(iii)作品に関連するURLとして著作者によって指定されたもの、(iv)「ウィキペディア日本語版にあった文章を加工しています」といった類のクレジット。
これをもう少しウィキペディア日本語版に沿って解釈してみます。
  • ページの一番下の方に(a)「テキストはクリエイティブ・コモンズ 表示-継承ライセンスの下で利用可能です。」というライセンス・ノーティスがあります。その次にある一文と利用規約へのリンクもライセンス・ノーティスの一部と考えられるのかも知れません。(ライセンスの運用の説明などがあるので)。(b) 「免責事項」というリンクがあり、これは免責事項のノーティスに相当しそうです。(c) 著作権表示は基本的に、「著作権者名(c)年号」の3点セットのことを指していると思いますが、特に見当たりません。
  • ライセンスのURIは http://ja.wikipedia.org/wiki/Wikipedia:Text_of_Creative_Commons_Attribution-ShareAlike_3.0_Unported_License へのリンクという形で上記のライセンス・ノーティスに含まれていますから、それをそのまま継承するだけでOKのように思いました。
    • それ以外に、http://creativecommons.org/licenses/by-sa/3.0/ というURLを含める必要があるのかどうかはわかりませんが、ライセンスのURIとあるだけなので大丈夫のような気がしました。また、ライセンス・ノーティスの文言はそのままにリンク部分のURLだけはcreativecommons.orgのものに変更してもいいのかも知れません。(それが「keep intact」に違反することになるかどうかは若干迷うところですが。)
  • (i)著作者名の一覧は各項目の履歴ページにあります。(ii)作品のタイトルは、たぶん項目のタイトルなのではないかと思います。(iii)特に指定されたURLなどはなさそうです。(iv)クレジットは、上の例のようなものを書くといいのだろうと思います。
  • 著作者名一覧が膨大なのをどうするべきかですが、合理的な方法であればいいというのをどう解釈するかだと思います。どういう利用を想定されているかはわからないのですが、複数の項目を混ぜて利用するということではなくて、単一の項目を加工して表示する場合には、加工元のページの履歴ページへのリンクを張るというのでもそれなりに合理性はありそうです。ただ、ウィキペディア日本語版のダンプを元に加工・表示するのであれば、ダンプと最新版の間でタイトルが変更されている(従って履歴ページもURLが代わっている)といった可能性もあるでしょうから、ダンプにある履歴ページを一リンク先においておいて、サイトを利用する人が見られるようにしておく、というような形がよりよいように思いました。
具体的に考えていくとわからないところ、解釈に迷うところが他にもいろいろありそうですが、とりあえずそんな風に考えました。ご参考になれば幸いです。Tomos 2010年3月22日 (月) 16:24 (UTC)[返信]