ノート:ISO/IEC 8859

ページのコンテンツが他言語でサポートされていません。

数値文字参照への置き換えについて[編集]

ウィキペディアの文字コードはUTF-8ですからJIS X 0208の範囲外の文字を数値文字参照に置き換える意味はないと思うのですが、どういう意図があるのでしょうか?--emk 2007年9月1日 (土) 12:28 (UTC)[返信]

文字で見るよりUCS序数で見たほうが、誤りがあったときに発見しやすいとおもったんですが (JIS X 0208 外か全部変わってるのは、機械的に変換したためです)。
あと、MediaWiki側はUTF-8ですが、たまにレガシーエンコンディングのアプリケーションにコピペして編集して壊してしまうひともいるので、一般的にも実体参照にしたほうが安全かな、というのがあります。 --Hatukanezumi 2007年9月1日 (土) 12:47 (UTC)[返信]
  • 目視で誤りを発見するのはかなり無茶だと思います。機械的に探すならどちらであっても違いはありません。
  • UCS序数では、文字コード表を暗記していない限り編集中に文字の見た目が分かりません。
  • サイズが無駄に増えます。この記事の場合、実質的内容は何も変わっていないにもかかわらず4893バイトも増えています。
  • どのみちinterlangが壊れます。interlangを文字参照にしていない膨大な記事の数を考えると、JIS X 0208外の文字を壊すようなアプリケーションでの編集は行うべきでありません。
  • あくまでも副次的なものですが、JIS X 0208外の文字を破壊する編集はPEACE系の判別手段の一つにもなっています。
--emk 2007年9月1日 (土) 12:56 (UTC)[返信]
わたしは、Unicodeとのマッピングテーブルを見て確認することを念頭に置いてました。字形だと見間違える可能性があるので、普通はそうしています。そうじゃないひとのほうが多いのかな。
interlangはたしかに壊れますね。わたしが先日みかけたのも、もしかするとWP:PEACEだったのかもしれない (そっち方面のことには疎いもので)。とにかく、そういうことなら戻しましょうか。 --Hatukanezumi 2007年9月1日 (土) 13:15 (UTC)[返信]
私は戻す方に賛成です。とくに反対する強い理由がないなら自分で戻します。--emk 2007年9月1日 (土) 13:56 (UTC)[返信]
とりあえず戻しました。 --Hatukanezumi 2007年9月1日 (土) 13:59 (UTC)[返信]