倉頡輸入法
倉頡輸入法 | |
---|---|
| |
各種表記 | |
繁体字: | 倉頡輸入法 |
簡体字: | 仓颉输入法 |
拼音: | Cāngjié Shūrùfǎ |
注音符号: | ㄘㄤ ㄐ|ㄝˊ ㄕㄨ ㄖㄨˋ ㄈㄚˇ |
発音: | ツァンチエ シュールーファ |
倉頡輸入法(そうけつゆにゅうほう)とは、コンピュータ上における漢字入力方式の一つ。朱邦復によって考案され主に中国返還前後から現在に渡り香港特別行政区で用いられている(台湾で主流の入力方式は注音入力。香港・台湾以外の中国で主流の入力方式は拼音入力)[1]。
なお、倉頡とは古代中国において漢字を発明したと言われる伝説上の人物であり、「輸入法」とは「入力方式」 (input method) を表す中国語である。「かな漢字変換」等と同じく特定の漢字入力ソフトウェアを指す言葉ではない為、ソフトウェアによって若干入力方法が異なることに注意する必要がある。
特徴
具体的な入力方法は一字を二つないし五つの字根に分類し[2]、その部首をキーボード上から入力し変換する。注音輸入法とは異なり、同じキーバインドで異なる文字は殆ど無いため、入力効率が極めて高い。また、注音輸入法が四段のキーを必要とするのに対して、倉頡輸入法は漢字入力に関しては三段のキーで入力可能であり、入力法を完全に習得した場合、タッチタイプをより効率的に行うことが可能である。
ただし、「龍」を入力する場合「ト」「月」「ト」「尸」「心」と筆画を無視し形態のみで分解する必要があるなど、台湾人にとっても倉頡輸入法学習者以外には理解が難しい点もある。その反面発音が分からない難読漢字も入力可能な点は利点である。
このため、一般的な注音輸入法に対して職業的に大量の文字をコンピュータに入力する必要のある者が習得していることが多い。実際、公的な大会などでは優勝者の多くは場合倉頡輸入法を利用している。なお、現在の世界記録は分速220文字である。
開発史
- 1977年、台湾にて倉頡が発表される。12,000 字を収録する『国語辞典』に基づく。
- 1980年、倉頡ver.2 が発表される。ver.1 の一部修正の内容。
- 1982年、倉頡ver.3 が発表される。『康熙字典』の四万字を収録し、ver.2 の内容に改良を加えた。
- 1985年、アメリカで倉頡 ver.5 が発表される。収録文字が六万字となり、入力規則の変更と字形要素の追加が行なわれる。朱邦復工作室のホームページの中の『第五代倉頡輸入法手冊』に ver.3 と ver.5 の対照表が公開されている。
- 2002年、朱邦復により倉頡 ver.6 が完成される。しかし、2006年現在公開されておらず、朱邦復工作室関係者のみで使用されているに過ぎない。
現在一般的に使用されているのは倉頡 ver.3 である。Microsoft Windows 95/98/Me/2000/XP などの IME では ver.3 の改良版(異体字と香港漢字を収録しているが、誤りも存在している)を採用している。また倉頡之友所が製作した倉頡 ver.5 も香港などで一部使用されている。バージョンの違いは「面」、「非」の入力方法で判断することが可能である。
- ver.3: 「面」を MWYL (一田卜中)、「非」を LMYYY (中一卜卜卜)
- ver.5: 「面」を MWSL (一田尸中)、「非」を LMSY (中一尸卜)
入力規則
漢字は「上から下、左から右、外から内」等の原則で各要素に分解し、各々の要素に与えられた符合に置き換えて入力する。キーボードは A から Y まで(X は特殊字、Z は不使用)使用する。例を挙げれば A には「日」の要素が割り当てられ、N には「弓」の要素が割り当てられている。漢字は最小で一から最大で五の要素に分解される
例
- 「日」-(分解)-> 日 -(対応キー)->A
- 「本」-(分解)-> 木+一 -(対応キー)-D+M
- 「語」-(分解)-> 卜+口+一+一+口 -(対応キー)-Y+R+M+M+R
要素の分類
倉頡での要素は 26 種類あり、五つに分類することができる
- 五行類(哲理類):日 (A), 月 (B), 金 (C), 木 (D), 水 (E), 火 (F), 土 (G)
- 筆画類:竹 (H,払い), 戈 (I,点), 十 (J,十字), 大 (K,交叉), 中 (L,縦), 一 (M,横), 弓 (N,勾)
- 人体類:人 (O), 心 (P), 手 (Q), 口 (R)
- 字型類:尸 (S), 廿 (T), 山 (U), 女 (V), 田 (W), 卜 (Y)
- 特殊類:難 (X),上記要素で分類が難しい「臼」や「卍」等の字形に使用する。
印刷字体と正書体の差異
倉頡は正字体を要素定義に使用しているため、一般の印刷体を無視し正字体での入力が必要になる場合がある。この他、台湾と香港では字体が若干異なる場合もあり、一部の漢字については入力の際に注意が必要である。
正字体/正入力法 | 印刷字体/誤入力法 | 説明 |
---|---|---|
為(戈大弓火) | 爲(月竹弓火) | 双方の入力法にも対応している(後者は Big5 外)が、印刷字は後者で表示される。 |
勻(心一一) | 匀(心戈一) | 双方の入力法にも対応している(後者は Big5 外)。 |
滫(水人中月) | 潃(水竹人月) | 双方の入力法にも対応している(後者は Big5 外)。 |
斔(卜戈竹難人) | 螤(卜戈中田人) | 双方の入力法にも対応している(後者は Big5 外)。 |
撐(手火月竹) | 撑(手火月手) | 双方の入力法にも対応している(後者は Big5 外)。 |
反(竹水) | 反(一水) | 後者での入力は不可能であるものの、印刷字体は後者 |
免(弓日竹山) | 免(尸竹日山) | |
直(十月一一) | 直(十月山女) | |
改(尸山人大) | 改(尸女人大) | |
麥(十人弓戈) | 麥(十人弓水) | ver.5 では字形は同一で表記。マイクロソフトは前者。 |
麻(戈十金金) | 麻(戈木木) | |
麵(十水一田中) | 麵(十弓一田中) | ver.5 では前者を標準入力とするが、印刷時は後者が印刷されることも
|
麴(十水心火木) | 麴(十弓心火木) | |
麫(十水一卜尸) | 麫(十弓一卜尸) | |
麪(十水一中尸) | 麪(十弓一中尸) | |
麯(十水廿田) | 麯(十弓廿田) |
字例 | 標準入力法 | マイクロソフト入力法 | 補充説明 |
---|---|---|---|
銹 | 金竹木尸 | 金竹木竹 | 「銹」は「鏽」の異体字 |
覣 | 竹女月山山 | 竹女月山 | |
芪 | 廿竹女心 | 廿竹山心 | |
睾 | 竹田土廿十 | 竹田土廿戈 | |
旞 | 卜尸人卜人 | 卜尸卜人人 | |
筑 | 竹一竹弓 | 竹一弓十 | 正書体は「竹一弓戈」、但し ver.5 は前者を採用。 |
難字規則
現在存在する中国語入力法の中で倉頡は最も字根(入力に必要な漢字の要素)の種類が少ない入力法である。大易輸入法、行列輸入法では 250 個の字根,嘸蝦米輸入法では約 300 個の字根が使用されている。これに対し倉頡では 121 個の字根のみの使用に留まり、入力方法を簡便化した観点では優れた入力方法である。しかし、これに対し一部の漢字の分解が非常に煩雑となる欠点を有す。これら分解が煩雑な漢字を倉頡輸入法では「難字」と称し、特別に設けた「難」キー X を使用することで問題を解決している。但し、ver.6 ではこの難字規則は廃止されている。
以下に基本的な難字規則を挙げる:
難字 | 倉頡入力法 |
---|---|
臼 | 竹難 |
肅 | 中難 |
卍 | 弓難 |
齊 | 卜難 |
身 | 竹難竹 |
慶 | 戈難水 |
廌 | 戈難火 |
鹿 | 戈難心 |
姊(旁の部分) | 中難竹 |
淵(旁の部分) | 中難中 |
龜 | 弓難山 |
黽 | 口難山 |
兼 | 廿難金 |
字集收字問題
現在 Unicode には多くの異体字が収録されているが、Big5 及び国家標準コード異体字が収録されていなかった関係上、旧版の倉頡入力法では異体字を入力することができない。
例字 | 異体字 |
---|---|
鵝 | 鵞 |
衛 | 衞 |
戶 | 户 |
強 | 强 |
麵 | 麪、麫 |
舉 | 擧 |
裡 | 裏 |
著 | 着 |
匯 | 滙 |
線 | 綫 |
廈 | 厦 |
彥 | 彦 |
倉頡より派生した入力法
簡易/速成輸入法
簡易輸入法(DOS 時代の呼称)、或いは速成輸入法(中国語版 Windows の呼称)は簡易或いは速成と簡称され、倉頡入力法を簡素化した入力法である。字根分解は倉頡と同様であるが、分解字根の最初と最後を入力する方式である。字根分解が比較的容易であることから初心者の間で使用されるが、同一キーでの候補字が大量に出現し迅速な入力には不向きである。初期の Windows では初期導入されていた為、現在でも少なからずの使用者が存在する。
快速倉頡輸入法
快速倉頡輸入法は快倉と簡称され、麦志洪が1987年 ver.3 倉頡入力法を改良した物。特徴としては一字に対し多種の字根分解を認めた点にあり、誤った字根の入力にも対応している点である。現在は ver.6 が公開されている。
新倉頡輸入法
新倉頡輸入法は Windows 2000 と同時に発表された入力法である。入力後に次字を予測する方式となっているが、倉頡輸入法使用者には歓迎されるものでなく、旧倉頡輸入法がなおも使用され続けている。この原状を踏まえ Windows XP では旧倉頡輸入法が現在も用意されている。
大新倉頡輸入法
大新倉頡輸入法はTQCにて中国語入力の世界記録である分速 220 字を更新した入力法であり、それまで最速と考えられていた嘸蝦米輸入法の最高記録を打ち破っている。特色としては全体の字根入力を減少させ、また誤入力に対応させると同時に、候補字が出現する場合は使用頻度の高いものを上位に配列するなどの工夫を凝らしている。
乱倉打鳥輸入法
亂倉打鳥輸入法は ver.3 の倉頡と大新倉頡の長所を複合させたものであり、日本語や各種符合にも対応したものである。また倉頡入力法初心者のみならず、ver.3 倉頡、快倉などの使用者にも対応しているのが特徴である。
自由倉頡輸入法
香港の華通軟体が開発した物。ver.3 倉頡入力法を基礎に開発したものであり、Unicode に対応している。現在無料で公開されている。