ノート:ISO/IEC 10646

ナビゲーションに移動 検索に移動

UCS-4 = UTF-32化?の出典[編集]

「2006年の改訂によりUnicodeで使用できない領域には永久に文字が定義されないこととなった」というくだりについて、個人的に詳細を知りたいです。どなたか出典を示していただけないでしょうか。--Wdpp 2007年5月16日 (水) 09:03 (UTC)

ISO/IEC 10646:2003/Amd 2:2006で、
Page 10, Sub-clause 9.2 Other Planes reserved
for future standardization
Replace text and note by the following:
Planes 11 to FF in Group 00 and all planes in any
other groups (i.e. Planes 00 to FF in Groups 01 to
7F) are permanently reserved.
Code positions in these planes do not have a mapping
to the UTF-16 form (see annex C).
のように文章が差し替えられました。Webで公開されていますし、規格票なので検証可能性も十分だと思います。本文に規格の表題はすでに示されていましたが、参考文献であることがもっと明確に分かるように修正しました。--Emk 2007年5月16日 (水) 17:49 (UTC)
出典としては規格票で十分だと思うので記事には追記していませんが、個人的に詳細を知りたいという点に関して規格票の文章だけでは不十分かもしれないので補足しておくと、提案文書は同サイトのN2920 Seventeen planes restriction、それに対する議決はN2904で読めます。やはりというか日本は棄権してますね。--Emk 2007年5月16日 (水) 18:32 (UTC)
なるほど、こんなことがあったんですね。ありがとうございました。-Wdpp 2007年5月17日 (木) 10:44 (UTC)

いかなる工業規格も所定の手続きにより如何様にも改定できる以上、"permanentary reserved"という文言自体が文字通りに永久不変である保証はなく、将来の改定によって撤回される可能性を誰も否定できません。あくまでも規格本文上の表現であることを念頭にいれ、記事中の表現を「文字が『永久に定義されない』こととされた」と修正しました。--Tabide 2007年11月30日 (金) 11:50 (UTC)

語長の単位[編集]

「UTF-32は4バイト」みたいにバイトという単位が使われていますが、バイトは「文字を表現する語長=(古くは5ビット、ASCIIなどでは8ビット)」の単位なので「UTF-32は4バイト、UTF-16は2バイト」のような表現は、若干の御幣があるように思います。8ビットの語長に対する単位は通信などでよく用いられるオクテットのほうが適切で「UTF-32は4オクテット」みたいに記述するべきだと思います。--61.114.204.8 2011年11月30日 (水) 21:03 (UTC)