幽霊文字
| この項目には、一部のコンピュータや閲覧ソフトで表示できない文字が含まれています。 |
幽霊文字(ゆうれいもじ)とはJIS基本漢字に含まれる、典拠不明の文字の総称。幽霊漢字(ゆうれいかんじ)、幽霊字(ゆうれいじ)とも呼び、英語ではghost charactersと訳される。
目次 |
[編集] 概説
JIS C 6226(後のJIS X 0208)で規定された、いわゆるJIS第1第2水準漢字をこの記事では「JIS基本漢字」と呼ぶ。これは当時の通産省が1978年に制定したものである。
しかし、制定の際に各文字の典拠が規格の中に明示されなかったため、JIS基本漢字には約60字、一説には100字を超えるという見方もあるが、多くの「何に使われるのかわからない文字」が混入することとなった。これが幽霊文字である。
| 垉 (9AB3) | 垈 (9AB0) | 墸 (9AD5) |
| 壥 (9ADD) | 妛 (9BAA) | 岾 (9BB1) |
| 彁 (9C5A) | 恷 (9C8E) | 挧 (9D6A) |
| 暃 (9DF1) | 椦 (9E9B) | 橸 (9EEF) |
| 汢 (9F89) | 熕 (E090) | 碵 (E1F1) |
| 穃 (E26D) | 粐 (E2E2) | 粭 (E2E4) |
| 粫 (E2E6) | 糘 (E2F2) | 膤 (E452) |
| 蟐 (E5AA) | 袮 (E5D7) | 軅 (E75F) |
| 鍄 (E7FB) | 閠 (E880) | 靹 (E8D6) |
| 駲 (E971) | 鵈 (E9FC) |
代表的なものに「妛」や「彁」などがあり、これらは康熙字典にも収録されていない。たとえば「妛」は、JIS X 0208の第1次規格 (JIS C 6226-1978) に収録する文字を選定する際に、典拠資料で異なる文字の一部を切って貼り合わせることで作字していたため、切れ目の影を横画と見誤って転記したものと推測されている[1][2](用例のある類似の文字としては「𡚴」があり、これはJIS X 0213に収録された)。「彁」にいたっては、典拠のみならず用例すら不明(同定不能)である[3]。
JIS漢字が制定され、パソコンやワープロに実装されるようになると、次第にそれらの文字が「何のためにあるのか」「どこで使う文字なのか」「何と読むのか」といった謎が浮上していった。これを受けて国立国語研究所の笹原宏之らが調査を開始し、それらの文字が地名として使われている文字であったり、あるいは資料を書き写す際に発生した誤りと考えられるものであるといったことが判明した。
調査の結果、一般の漢和辞典に見当たらずに「幽霊漢字」とされてきたものの多くは、地名などに実際に使われていた漢字であることが明らかになった。一方、12の漢字(JIS X 0208#典拠不明の漢字を参照)は、典拠の不明なまま残される結果となった。典拠が不明でも、古辞書に類似した文字が見えたり資料の写し間違いが推察されたりといった手がかりが発見されたものが多いが、そのうち1文字(彁)に関してはまったく手がかりのない字である。したがって、現在では本当に幽霊漢字とみなされるのはこれら12文字、狭い意味では「彁」1文字のみである。なお、この調査の成果はJIS X 0208:1997の附属書7「区点位置詳説」にまとめられている。
[編集] 幽霊文字の数
幽霊文字といったとき、それがすべてで何文字あるのか、明確な数字を挙げることはできない。調査の結果として典拠が見付からなかったとするものが12字報告されているが、この数で決定というわけでもない。なぜならば、あくまでも現時点では見当たらないというだけであり、制定時に参考とした、今となっては名前もわからない文献や、それが執筆された当時にあってはその文字を用いる地名や人名などがあったかもしれないという余地は残されるからである。
前述の「妛」は構成する文字要素から通称「やまいちおんな」と呼ばれ、「𡚴」(山かんむりに女と書き「あけび」と読む)の誤字とされているが、この「誤字」にも「妛芸凡(あきおうし)という苗字が存在した」という都市伝説にも似た話が丹羽基二の著書『苗字 この不思議な符牒』(芳文館)に存在する。とはいえ、同著者同出版社の『日本苗字大辞典』では「𡚴」の字が使われており、『苗字 この不思議な符牒』自体が誤植もしくはJIS基本漢字による印刷が行われた可能性もある。一方、TRONコードのGT書体枠にはこれによく似た文字として、更に「
」や「
」が収録されている。
[編集] 実在するとされる幽霊文字を用いた地名の例
- 粫 - 粫田(うるちだ)
- 橸 - 石橸(いしだる)
- 軅 - 軅飛(たかとぶ)
- 垈 - 相垈(あいぬた)
また、「椦」という字は群馬県前橋市にある「橳島」(ぬでしま)の「橳」という字を誤った字体で登録した可能性がある[4]。
[編集] 辞書での扱い
幽霊文字は典拠不明の文字であるために、少なくともJIS基本漢字が制定される以前の主な辞典には記載されていない。仮にそれが誤字であろうと、あるいは忘れられた過去やごく一部で使われていた実在の文字であろうと、読みが不明であることには変わりがない。
とはいえ、パソコンやワープロでは、その文字が実装されている以上、変換して文字が出てこないというのは具合が悪く、多くの場合は便宜的に形声文字として解釈した「音読み」を割り当てている。これに倣い、文字コードを記載した漢和辞典や漢字字典でも、これらの便宜的な読みを掲載することが一般的となっている。
なお、MS-IMEによる逆引きでは空白文字に直される。
[編集] 幽霊文字が残されている理由
笹原宏之らによって幽霊文字の調査は行われたが、これは1997年のJIS漢字改正の一環であった。JIS漢字の改正では1983年のいわゆる「83JIS改正」で字形や文字コードの差替えを行うという変更がされたために大きな混乱を招いた過去があり、それを再び起こすわけにはいかなかった。また、既にUnicodeにはJIS漢字が収録されており、この時期になっての変更は、単に国内だけの問題に留まるものではなかった。
結果として、幽霊文字はいまなおJIS基本漢字に残され、フォントさえ用意すれば世界中のコンピュータで利用可能となっている。
[編集] 使用例
元来、典拠不明の文字であり、仮に正字や字義がわかったとしても使用頻度が低いことには違いない。
実際に使用されている例としては、誤字であると判明したものは本来の字の代用とすることもある。また、なお典拠不明であったり別字ではあっても、よく似た字形の文字の代用に使うこともあり、いわゆる異字、代替字、俗字としての存在理由ができつつある。
また、「何の文字なのかわからない」「読みも不明である」ということを逆手に取って、暗号文書の文字として用いる者もいる。いわゆる忍者文字のようなものともいえる。
そして、幽霊文字紹介としての使用も見られ、皮肉にもインターネット上ではこの使われ方がもっとも多いとされる。幽霊文字について解説をする以上、具体例としてそのうちの何文字かを挙げねばならず、「幽霊文字としての幽霊文字」という利用である。本項目のページ自身もその一例である。
[編集] 脚注
- ^ JIS X 0208:1997 『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』 日本規格協会、1997年、pp.289f。
- ^ 笹原宏之 『日本の漢字』 岩波書店〈岩波新書〉、2006年、p82。ISBN 4-00-430991-3。
- ^ 前掲、pp.291f。
- ^ a b c d JIS X 0208:1997『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』「附属書7 (参考) 句点位置詳説」、日本規格協会、2004年、2.148, 2.127, 2.166, 2.115
- ^ 2006-06-29の入札結果表(静岡市の公式ホームページ)にて、「南アルプス公園線(井川字石橸工区)地すべり調査・観測・測量業務委託」という委託業務の説明がある。