幽霊文字

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索
この項目には、一部のコンピュータや閲覧ソフトで表示できない文字が含まれています詳細

幽霊文字(ゆうれいもじ、英語: ghost characters)とは、JIS基本漢字に含まれる、典拠不明の文字の総称。幽霊漢字(ゆうれいかんじ)、幽霊字(ゆうれいじ)とも呼ぶ。

概説[編集]

1978年に当時の通商産業省が制定したJIS C 6226(後のJIS X 0208)では、いわゆるJIS第1・第2水準漢字として6349字が規定された。この漢字集合を「JIS基本漢字」と呼ぶ。このとき典拠として次の4つの漢字表に含まれる漢字が採用された[1]

  1. 標準コード用漢字表(試案): 情報処理学会漢字コード委員会(1971年)
  2. 国土行政区画総覧: 国土地理協会(1972年)
  3. 日本生命収容人名漢字: 日本生命(1973年)、現存しない
  4. 行政情報処理用基本漢字: 行政管理庁(1975年)

しかし、制定当時は各文字の典拠が規格の中に明示されなかったため、「音、意味や歴史はおろか、どこで使われているのかもわからない文字」が多く混入することが指摘された。これが幽霊文字であり、約60字、一説には100字を超えるといわれた[誰?]。代表的なものに「」や「」などがあり、これらは康熙字典にも収録されておらず、国字新字体などを追加した諸橋轍次の『大漢和辞典』(2000年にJIS基本漢字の一部を含めて補充した『補巻』を除く)にも記載がなかった。

こうした状況を踏まえて、1997年制定の改定規格では、その原案作成委員会において国立国語研究所笹原宏之らが中心となり、1978年規格の原案作成時に参照された文献を調査した。その結果、幽霊文字とされてきたものの多くは、地名などに実際に使われていた漢字であることが明らかになった。

調査によると、1978年規格原案作成に先立って、行政管理庁は1974年に上記の1~3を含む複数の漢字表をとりまとめた『行政情報処理用標準漢字選定のための漢字の使用頻度および対応分析結果』を作成しており、これには漢字表と元の典拠が併せて記載されている。当時のJIS基本漢字の選定の際には、元の典拠ではなくこの対応分析結果が参照されており、このうち『国土行政区画総覧』『日本生命収容人名漢字』を典拠とするものに幽霊漢字が多く含まれていることが判明した。この結果を受け、改定規格の委員会は『国土行政区画総覧』の1972年版を校正履歴から復元したうえで、そこに現れる漢字を全ページにわたって照合し、用例を確認した。このほか、現存しない『日本生命収容人名漢字』に代わる人名用例としてNTTの電話帳データベースを調査対象としたり、30以上にわたる古今の字書を調査対象としたりするなど、徹底的な文献参照を行った。

一方、このような綿密な調査を経ても、12の漢字については典拠の不明なまま残される結果となった。典拠が不明でも、古字書に同形衝突した文字が見えたり資料の写し間違いが推察されたりといった手がかりが発見されたものが多いが、そのうち1文字(「彁」)に関してはまったく手がかりのない字である[2]。したがって、現在では本当に幽霊文字とみなされるのはこれら12文字、狭い意味では「彁」1文字のみである。

幽霊文字とされた漢字の調査結果[編集]

前述の笹原宏之らによる調査の成果はJIS X 0208:1997の附属書7「区点位置詳説」にまとめられている。本節ではその一部を抜粋する。

典拠が不明なもの[編集]

JIS X 0208:1997では、下表の12文字について典拠の確信を得られないため、「典拠不詳」「不明」「同定不能」として扱っている。

文字 区点 概要
52-55 典拠不明。暗合例あり。
52-63 典拠不明。「㕓」の誤写か。
54-12 国土行政区画総覧典拠とあるが未発見。「𡚴」の誤認か。
55-27 典拠不明。同定不能。
57-43 国土行政区画総覧典拠とあるが未発見。「栩」の誤写か。
58-83 国土行政区画総覧典拠とあるが未発見。「杲」などの誤写か。
59-91 国土行政区画総覧典拠とあるが未発見。「橳」の誤写か。
60-57 国土行政区画総覧典拠とあるが未発見。「橦」の誤写か。
74-12 行政情報処理基本漢字典拠とあるが用例なし。暗合例あり。
74-57 国土行政区画総覧典拠とあるが未発見。「祢」の誤写か。
79-64 国土行政区画総覧典拠とあるが未発見。「閏」の誤字か。
81-50 日本生命人名表典拠とあるが原典不在。暗合例あり。

「妛」は、滋賀県犬上郡多賀町河内にある「𡚴原」(あけんばら)の「𡚴」(「山女(あけび)」の合字)がJIS基本漢字に未収録となっているため、これを誤った字体で登録した可能性がある。典拠である国土行政区画総覧において、異なる文字の一部を切って貼り合わせることで作字していたため、切れ目の影を横画と見誤って転記したものと推測されている[3][4]。「𡚴」はJIS X 0213に収録された。

「椦」は、群馬県前橋市にある「橳島」(ぬでしま)[5]の「橳」(植物のヌルデの別名カチノキの合字)がJIS基本漢字に未収録となっているため、これを誤った字体で登録した可能性がある[6]。「」はJIS X 0213に収録された。

典拠が判明したもの[編集]

JIS X 0208:1997では、典拠の明らかになった文字のうち、諸橋『大漢和辞典』、角川『新字源』の両方に掲載されていないものを中心に72文字[7]の典拠詳細をまとめている。 下表にその一部を例示した。

文字 区点 典拠・用例
52-18 国土行政区画総覧に用例あり。藤垈(ふじぬた)・相垈(あいぬた)・大垈(おんた)/山梨県
52-21 国土行政区画総覧に用例あり。垉六(ほうろく)/愛知県
54-19 国土行政区画総覧に用例あるが現存せず。広岾町(ひろやまちょう)→広帖町(こうちょうちょう)/京都府
55-78 日本生命人名表典拠。NTT電話帳に人名用例あり。
60-81 日本地名大辞典に用例あり。石橸(いしだる)/静岡県
61-73 国土行政区画総覧に用例あり。汢の川(ぬたのかわ)[8]/高知県
66-83 日本生命人名表典拠。NTT電話帳に人名用例あり。
67-46 国土行政区画総覧に用例あるが原典誤字か。穃原→榕原(ようばる)/沖縄県
68-68 国土行政区画総覧に用例あり。粐蒔沢(ぬかまきざわ)[9]/秋田県
68-70 国土行政区画総覧に用例あり。粭島(すくもじま)/山口県
68-72 国土行政区画総覧に用例あるが原典誤字か。粫田(うるちだ)→糯田(もちだ)/福島県
68-84 国土行政区画総覧に用例あり。糘尻(すくもじり)/広島県
71-19 国土行政区画総覧に用例あり。膤割(ゆきわり)/熊本県
77-32 国土行政区画総覧に用例あるが現存せず。軅飛(たかとぶ)→鷹飛(たかとび)/福島県
78-93 国土行政区画総覧に用例あり。小鍄(こがすがい)/山形県
82-94 国土行政区画総覧に用例あるが原典誤字か。鵈沢→鵃沢(みさごさわ)/福島県

実在するとされる幽霊文字を用いた地名の例[編集]

  • 粫 - 粫田(うるちだ)
福島県白河市大字本沼。現在は「糯田(もちだ)」となっている模様[6]
  • 橸 - 石橸(いしだる)
静岡県静岡市葵区井川。当地の役所の資料で確認できる[6]。この地名は同地に現存している[10]
  • 軅 - 軅飛(たかとぶ)
福島県白河市白坂。現在は「鷹飛(たかとび)」に変更されている[6]
  • 垈 - 相垈(あいぬた)
山梨県韮崎市藤井町。交差点、およびバス停の名称として確認できる。
  • 岾 - 大岾(おおはけ)
埼玉県所沢市南永井の小字。[11]はけの項を参照のこと)
「岾」はもともと京都市左京区浄土寺広岾町(ひろやまちょう)に由来して採用されたものだが、現存していない。

辞書での扱い[編集]

幽霊文字は典拠不明の文字であるため、少なくともJIS基本漢字が制定される以前の主な字典には記載されている漢字は幽霊文字と呼ばれない。

字典などの出典がなく、文脈や用例も不明な漢字は、仮にそれが誤字であろうと、あるいは忘れられた過去やごく一部で使われていた実在の文字であろうと、読みや意義が不明であることには変わりがない。

通常はそもそもそのような音義不詳の漢字は収録対象にならないが、特に文字コードを記載するような漢和辞典では、編集方針としてJIS基本漢字を全掲載することが前提となっており、幽霊文字を収録せざるを得ない状況が生じる。そのため、辞書や個別の文字によって以下のように扱いが異なる。

読みを便宜的に割り当てる
パソコンやワープロでは、その文字が実装されている以上、変換して文字が出てこないというのは具合が悪く、便宜的に形声文字として解釈した「音読み」を割り当てることがある[12]。これに倣い、辞書でもこれらの便宜的な読みを掲載するものもある。彁=カ、椦=ケンなど。
似た文字の異体字とする
「駲」を「馴」の異体字、「軅」を「軈」の異体字とするものがある。しかし、いずれも典拠を示したものがない。
「妛」は大漢和辞典康煕字典に非常に似た文字(上部の「山」が「屮」となるもの)が収録されており、その異体字とするものがあった[13]
暗合した別の文字として解説する
「槞」を「櫳」の異体字、「鵈」を「とび」の意の国字として解説するものがある。これらはJIS X 0208:1997での調査でも典拠つきで暗合例が紹介されているものである。規格の収録意図とは異なる可能性が高いが、このような扱いは幽霊文字に限らず、収録文字の解説に汎用性を持たせるために行われる。
幽霊文字として解説する
前述の調査結果から幽霊文字であることが判明してからは、読みや意義が不明であることをありのままに記述するものが一般的である。

幽霊文字が残されている理由[編集]

笹原宏之らによって幽霊文字の調査は行われたが、これは1997年のJIS漢字改正の一環であった。JIS漢字の改正では1983年のいわゆる「83JIS改正」で字形や文字コードの差替えを行うという変更がされたために大きな混乱を招いた過去があり、それを再び起こすわけにはいかなかった。また、既にUnicodeにはJIS漢字が収録されており、この時期になっての変更は、単に国内だけの問題に留まるものではなかった。

結果として、幽霊文字はいまなおJIS基本漢字やUnicodeに残され、フォントさえ用意すれば世界中のコンピュータやスマートフォンで利用可能となっている。

使用例[編集]

元来、典拠不明の文字であり、仮に正字や字義がわかったとしても使用頻度が低いことには違いない。

実際に使用されている例としては、誤字であると判明したものは本来の字の代用とすることもある。また、なお典拠不明であったり別字であったりしても、よく似た字形の文字の代用に使うこともあり、いわゆる異字、代替字、俗字としての存在理由ができつつある。

また、「何の文字なのかわからない」「読みも不明である」ということを逆手に取って、いわゆる忍者文字のような暗号文書の文字として用いることもできる。文字として利用するものではなく、他の文字コードへの転用を把握し[著作権]を保護する著作権トラップであった可能性もあるが、文字コードの国際化によって、その意味は薄くなっている。

そして、幽霊文字紹介としての用例も見られ、皮肉にもインターネット上ではこの使われ方がもっとも多いとされる[要出典]。幽霊文字について解説をする以上、具体例としてそのうちの何文字かを挙げねばならず、実在する「幽霊文字」というパラドックスを起こす利用である。本項目のページ自身もその一例である。

脚注[編集]

[ヘルプ]
  1. ^ JIS X 0208:1997 『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』 日本規格協会、1997年、pp.269f。
  2. ^ 前掲、pp.291f。
  3. ^ JIS X 0208:1997 『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』 日本規格協会、1997年、pp.289f。
  4. ^ 笹原宏之 『日本の漢字』 岩波書店〈岩波新書〉、2006年、p82。ISBN 4-00-430991-3
  5. ^ 漢字の写真字典 国字(木 12)” (日本語). Yoshio Yoshida (2013年4月). 2016年12月13日閲覧。
  6. ^ a b c d JIS X 0208:1997『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』「附属書7(参考) 区点位置詳説」、日本規格協会、2004年、2.148, 2.127, 2.166, 2.115
  7. ^ JIS X 0208:1997の附属書7で「原典典拠」と付された区点一覧には72文字が掲載されているが、詳説本文には「鰛(82-60)」が記載されておらず、71文字にとどまっている。
  8. ^ 現地役所によると本来は「冫土」(にすい)であり、国土行政区画総覧の誤字である可能性あり。2002年1月1日に利便性と用例を考慮してさんずいに改めている。
  9. ^ JIS X 0208:1997の附属書7「区点位置詳説」では「粐薪沢」と誤植している。
  10. ^ 2006-06-29の入札結果表静岡市の公式ホームページ)にて、「南アルプス公園線(井川字石橸工区)地すべり調査・観測・測量業務委託」という委託業務の説明がある。
  11. ^ 埼玉県稀少地名漢字リスト - 検証重視のサイトで、現地レポートや考証資料が充実している。)
  12. ^ MS-IME単漢字辞書、ATOKGoogle IMEなど。なお、MS-IMEの逆引き機能では空白文字を返す。
  13. ^ 広辞苑 第五版など。なお、Unicodeでは幽霊文字「」と大漢和辞典収録文字「」とが同一コードポイントU+599Bに包摂されている。

関連項目[編集]