MacJapanese
| この項目には、一部のコンピュータや閲覧ソフトで表示できない文字(Unicode5.2で表現したARIB外字および、文字合成させた囲み文字)が含まれています。 |
MacJapanese または Mac OS Japanese は、アップルが Shift_JIS を独自に拡張した文字コードである。
主に Mac OS のバージョン 7.1 からバージョン 9.x までの間で利用された。
目次 |
[編集] 対応する文字コード
MacJapanese は IANA によって登録されていない。そのため RFC 2045 の § 6.3 に従って、XML、MIME などでは“x-Mac-Japanese”という名称がこの文字コードの名前として使われている(アップル製である iPod もこの名前を認識する[1])。
また、MacJapanese を Unicode にマッピング(対応付け)した上で、 Unicode 用の文字符号化方式(UTF-16、UTF-8 など)を使って符号化する方法もあり、Mac OS X のファイル名などにはこの方法が使われている。ただし、MacJapanese 固有の文字を私用領域 (Private Use Area) の U+F860、U+F861、U+F862、U+F87A、U+F87E、U+F87F を使って表現するので、Mac OS X 以外の環境との互換性は無い。
[編集] 歴史
[編集] 文字セット
以下、「0x」を数字の先頭に付けた十六進法表記を用いて各文字のコードを表す。
0x00 から 0x7F までと 0xA1 から 0xDF までの部分(いわゆる半角文字の部分)は JIS X 0201 に準ずる。ただし、0x7E には ASCII に倣って U+7E のチルダが割り当てられている。
また、次の記号が追加されている。
- 0x80 …… U+5C reverse solidus (= backslash)、半角バックスラッシュ「\」(ASCII の 0x5C と同じ)
- 0xA0 …… U+A0 no-break space、ノーブレークスペース (NBSP)
- 0xFD …… U+A9 copyright sign、著作権記号「©」(○で囲まれた「c」)
- 0xFE …… U+2122 trade mark sign、商標記号「™」(「TM」)
- 0xFF …… halfwidth horizontal ellipsis、半角の欧文用三点リーダー(半角幅の「...」)
2バイトで表される文字(いわゆる全角文字)は JIS X 0208-1990 を元にしている。さらに 0x8540 から 0x886D に「Apple 標準システム外字」(記号など)が、0xEB41 から 0xED96 までに縦書き用の文字が追加されている。Apple 標準システム外字のうち Unicode に対応している文字には次のようなものがある。
- 丸附き数字・黒丸附き数字
| 文字 | 内容 | 文字 | 内容 | 文字 | 内容 | ||
|---|---|---|---|---|---|---|---|
| ① | ○で囲まれた1 | ⑪ | ○で囲まれた11 | ❶ | ●で囲まれた白抜きの1 | ||
| ② | ○で囲まれた2 | ⑫ | ○で囲まれた12 | ❷ | ●で囲まれた白抜きの2 | ||
| ③ | ○で囲まれた3 | ⑬ | ○で囲まれた13 | ❸ | ●で囲まれた白抜きの3 | ||
| ④ | ○で囲まれた4 | ⑭ | ○で囲まれた14 | ❹ | ●で囲まれた白抜きの4 | ||
| ⑤ | ○で囲まれた5 | ⑮ | ○で囲まれた15 | ❺ | ●で囲まれた白抜きの5 | ||
| ⑥ | ○で囲まれた6 | ⑯ | ○で囲まれた16 | ❻ | ●で囲まれた白抜きの6 | ||
| ⑦ | ○で囲まれた7 | ⑰ | ○で囲まれた17 | ❼ | ●で囲まれた白抜きの7 | ||
| ⑧ | ○で囲まれた8 | ⑱ | ○で囲まれた18 | ❽ | ●で囲まれた白抜きの8 | ||
| ⑨ | ○で囲まれた9 | ⑲ | ○で囲まれた19 | ❾ | ●で囲まれた白抜きの9 | ||
| ⑩ | ○で囲まれた10 | ⑳ | ○で囲まれた20 | ||||
- 丸括弧附き数字
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | ||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ⑴ | (1) | ⑸ | (5) | ⑼ | (9) | ⒀ | (13) | ⒄ | (17) | ||||
| ⑵ | (2) | ⑹ | (6) | ⑽ | (10) | ⒁ | (14) | ⒅ | (18) | ||||
| ⑶ | (3) | ⑺ | (7) | ⑾ | (11) | ⒂ | (15) | ⒆ | (19) | ||||
| ⑷ | (4) | ⑻ | (8) | ⑿ | (12) | ⒃ | (16) | ⒇ | (20) |
- ドット附き数字
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | ||
|---|---|---|---|---|---|---|---|
| ⒈ | 1. | ⒋ | 4. | ⒎ | 7. | ||
| ⒉ | 2. | ⒌ | 5. | ⒏ | 8. | ||
| ⒊ | 3. | ⒍ | 6. | ⒐ | 9. |
- 大文字および小文字のローマ数字
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | |||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Ⅰ | I | Ⅴ | V | Ⅸ | IX | ⅰ | i | ⅴ | v | ⅸ | ix | |||||
| Ⅱ | II | Ⅵ | VI | Ⅹ | X | ⅱ | ii | ⅵ | vi | ⅹ | x | |||||
| Ⅲ | III | Ⅶ | VII | Ⅺ | XI | ⅲ | iii | ⅶ | vii | ⅺ | xi | |||||
| Ⅳ | IV | Ⅷ | VIII | Ⅻ | XII | ⅳ | iv | ⅷ | viii | ⅻ | xii |
- 丸括弧附きアルファベット小文字
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ⒜ | (a) | ⒠ | (e) | ⒤ | (i) | ⒨ | (m) | ⒬ | (q) | ⒰ | (u) | ⒴ | (y) | ||||||
| ⒝ | (b) | ⒡ | (f) | ⒥ | (j) | ⒩ | (n) | ⒭ | (r) | ⒱ | (v) | ⒵ | (z) | ||||||
| ⒞ | (c) | ⒢ | (g) | ⒦ | (k) | ⒪ | (o) | ⒮ | (s) | ⒲ | (w) | ||||||||
| ⒟ | (d) | ⒣ | (h) | ⒧ | (l) | ⒫ | (p) | ⒯ | (t) | ⒳ | (x) | ||||||||
- 単位記号
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ㎜ | mm | ㎝ | cm | ㎢ | km2 | ㎖ | ml | ㎳ | ms | ℉ | °F | ㎅ | KB | ||||||
| ㎟ | mm2 | ㎠ | cm2 | ㎎ | mg | ㎗ | dl | ㎲ | μs | ㏔ | mb | ㎆ | MB | ||||||
| ㎡ | m2 | ㎤ | cm3 | ㎏ | kg | ℓ | l | ㎱ | ns | ㏋ | HP | ㎇ | GB | ||||||
| ㎥ | m3 | ㎞ | km | ㏄ | cc | ㎘ | kl | ㎰ | ps | ㎐ | Hz | ||||||||
- アルファベットの組文字
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | ||
|---|---|---|---|---|---|---|---|
| № | No. | ㏍ | K.K. | ℡ | TEL |
- スート(トランプ記号)
| 文字 | 内容 | 文字 | 内容 | |
|---|---|---|---|---|
| ♠ | スペード記号 | ♤ | 白抜きスペード記号 | |
| ♥ | ハート記号 | ♡ | 白抜きハート記号 | |
| ♦ | ダイヤ記号 | ♢ | 白抜きダイヤ記号 | |
| ♣ | クローバー記号 | ♧ | 白抜きクローバー記号 |
- その他記号
| 文字 | 内容 | 文字 | 内容 | 文字 | 内容 | ||
|---|---|---|---|---|---|---|---|
| 〠 | 顔郵便マーク | ☎ | 黒電話 | 〄 | 旧 JIS マーク |
- 矢印記号
| 文字 | 内容 | 文字 | 内容 | 文字 | 表記 | ||
|---|---|---|---|---|---|---|---|
| ☝ | 指さし矢印上 | ⇧ | 白抜き矢印上 | ⇅ | ↑↓ | ||
| ☟ | 指さし矢印下 | ⇩ | 白抜き矢印下 | ⇄ | → ← |
||
| ☜ | 指さし矢印左 | ⇦ | 白抜き矢印左 | ⇆ | ← → |
||
| ☞ | 指さし矢印右 | ⇨ | 白抜き矢印右 | ||||
- 丸括弧附き漢字
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | ||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ㈰ | (日) | ㈮ | (金) | ㉃ | (至) | ㈴ | (名) | ㈵ | (特) | ||||
| ㈪ | (月) | ㈯ | (土) | ㈹ | (代) | ㈲ | (有) | ㈼ | (監) | ||||
| ㈫ | (火) | ㉀ | (祭) | ㈺ | (呼) | ㈻ | (学) | ㈽ | (企) | ||||
| ㈬ | (水) | ㈷ | (祝) | ㈱ | (株) | ㈶ | (財) | ㈿ | (協) | ||||
| ㈭ | (木) | ㉂ | (自) | ㈾ | (資) | ㈳ | (社) | ㈸ | (労) |
| 文字 | 内容 | 文字 | 内容 | 文字 | 内容 | 文字 | 内容 | |||
|---|---|---|---|---|---|---|---|---|---|---|
| ㊤ | ○で囲まれた上 | ㊧ | ○で囲まれた左 | ㊖ | ○で囲まれた財 | ㊞ | ○で囲まれた印 | |||
| ㊥ | ○で囲まれた中 | ㊨ | ○で囲まれた右 | ㊝ | ○で囲まれた優 | ㊙ | ○で囲まれた秘 | |||
| ㊦ | ○で囲まれた下 | ㊩ | ○で囲まれた医 | ㊘ | ○で囲まれた労 | |||||
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | |||
|---|---|---|---|---|---|---|---|---|---|---|
| ㍉ | ミリ | ㌶ | ヘクタール | ㍊ | ミリバール | ㌪ | ハイツ | |||
| ㌔ | キロ | ㍑ | リットル | ㌻ | ページ | ㌱ | ビル | |||
| ㌢ | センチ | ㍗ | ワット | ㌀ | アパート | ㌳ | フィート | |||
| ㍍ | メートル | ㌍ | カロリー | ㌅ | インチ | ㌹ | ヘルツ | |||
| ㌘ | グラム | ㌦ | ドル | ㌕ | キログラム | ㍂ | ホーン | |||
| ㌧ | トン | ㌣ | セント | ㌖ | キロメートル | ㍇ | マンション | |||
| ㌃ | アール | ㌫ | パーセント | ㌞ | コーポ | ㍎ | ヤード | |||
| ㍿ | 株式会社 | |||||||||
- 数学記号
| 文字 | 内容 | 文字 | 内容 | 文字 | 内容 | ||
|---|---|---|---|---|---|---|---|
| ∮ | 閉曲線積分 (閉路積分・周回積分)記号 |
∟ | 直角記号 | ⊿ | 直角三角形 |
| 文字 | 内容 | 文字 | 内容 | |
|---|---|---|---|---|
| 〝 | 鍵括弧の位置にある 日本語用の「“」 |
〟 | 鍵括弧の位置にある 日本語用の「”」 |
- 濁点附きのひらがな・カタカナ
| 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | 文字 | 表記 | ||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ゔ | う゛ | ヷ | ワ゛ | ヸ | ヰ゛ | ヹ | ヱ゛ | ヺ | ヲ゛ |
縦書き用文字には、括弧などの記号類を回転させたものがあり、「︰」(二点リーダ)、「︙」(三点リーダ)、「︵」「︶」(括弧)、「︻」「︼」(黒塗り括弧)など。なお、三点リーダは U+FE19 に収録されているが、MacJapanese のコードポイントとは異なり、互換性はない。また、他にも縦書き用のひらがな・カタカナの小字形がある。
これらは、DTP などの縦書きに対応したアプリケーションで縦書き表示をする際に、本来の文字コードを変換して QuickDraw の描画 API に渡すために使われたものである。通常、情報交換に使われることはない。
[編集] 他の文字コードとの対応
全角文字に関しては、縦書き用文字を別にすると、次のように区分できる。
区分1 - NEC 特殊文字に対応する文字が存在するもの(73字)
シフト符号化表現で符号化すると、MacJapanese と Windows-31J、Shift JIS-2004 とでは別のコードポイントが与えられているために文字化けの原因となる。例えば「⑫」(○で囲まれた「12」)は Windows-31J や Shift_JIS-2004 では 0x874B に割り当てられているが、MacJapanese においては 0x874B に「㈹」(「(代)」)が割り当てられているといった具合である。Unicode においては同じコードポイントが与えられているため、文字化けは発生しない。
区分2 - NEC 特殊文字に対応する文字が存在せず、JIS X 0213 に対応する文字が存在するもの(53字)
区分1と同じく、Shift JIS-2004 で表現すると MacJapanese とは別のコードポイントが割り当てられているため、文字化けの原因となる。
区分3 - NEC 特殊文字にも JIS X 0213 にも対応する文字が存在せず、Unicode に対応する文字が存在するもの(109字)
Unicode のエンコーディング(UTF-16、UTF-8 など)を用い、対応する文字のグリフが存在するフォントを利用すれば、正常に情報交換することができる。仮に MacJapanese を用いて情報交換し、Unicode に変換しようとした場合には、「Unicode と MacJapanese の変換テーブル」を使わないと変換することができない。
区分4 - NEC 特殊文字にも JIS X 0213 にも対応する文字が存在せず、Unicode では文字合成で表す必要があるもの(3字)
囲み文字であり、記号用ダイアクリティカルマーク U+20DD を用いた文字合成で表現することになる。そのため、対応していない OS・フォントやアプリケーションで表示しようとしても、合成されるべきところが合成されずに表示される[2]。文字一覧を下記に記す。
| 文字 | Unicode | 内容 | 文字 | Unicode | 内容 | 文字 | Unicode | 内容 | ||
|---|---|---|---|---|---|---|---|---|---|---|
| 大⃝ | U+5927 U+20DD |
○で囲まれた大[2] | 小⃝ | U+5C0F U+20DD |
○で囲まれた小[2] | 控⃝ | U+63A7 U+20DD |
○で囲まれた控[2] |
区分5 - NEC 特殊文字にも JIS X 0213 にも Unicode にも対応する文字は存在しないが、同型・同用途の文字が Unicode に存在するもの(7字)
Unicode のエンコーディングと対応するフォントを用いて情報交換することはできるが、コードポイントは別であり、MacJapanese との互換性は無い[3]。なお、MacJapanese で入力[4]した場合に Unicode へ変換するならば区分7に準ずる。Unicode のコードポイントにある同型の文字一覧を下記に記す。
| 文字 | Unicode | 内容 | 文字 | Unicode | 内容・表記 | |
|---|---|---|---|---|---|---|
| ⬆ | U+2B06 | 黒塗り矢印上[3] | 🄀 | U+1F100 | 0.[3] | |
| ⬇ | U+2B07 | 黒塗り矢印下[3] | ℻ | U+213B | 組文字・FAX[3] | |
| ⬅ | U+2B05 | 黒塗り矢印左[3] | ⇵ | U+21F5 | ↓↑[5] | |
| ➡ | U+27A1 | 黒塗り矢印右[3] | ||||
区分6 - NEC 特殊文字にも JIS X 0213 にも Unicode にも同用途の文字は存在しないが、同型の文字が JIS X 0213 や Unicode に存在するもの(2字)
区分5と同様に、別のコードポイントに同型の文字があるもの。この同型の文字は、MacJapanese および JIS X 0213 や Unicode に収録されている。共に全角ラテン文字。なお、MacJapanese で入力した場合に Unicode へ変換するならば区分7に準ずる。Unicode のコードポイントにある同型の文字一覧を下記に記す。
| 文字 | Unicode | 内容 | 文字 | Unicode | 内容 | |
|---|---|---|---|---|---|---|
| m | U+FF4D | メートル記号 | g | U+FF47 | グラム記号 |
区分7 - NEC 特殊文字にも JIS X 0213 にも Unicode にも対応する文字が存在せず、同型・同用途の文字が Unicode にも存在しないもの(9字)
文字合成を行なったり異体字タグを利用したりして表現することになる。そのために Unicode の私的領域である U+F860、U+F861、U+F862、U+F87A、U+F87E、U+F87F を使っている。したがって、MacJapanese に対応していないフォントやアプリケーションで表示しようとしても、合成されるべきところが合成されずに表示されたり、異体字となったりする[4]。文字一覧を下記に記す。
| 記号 | Unicode表記 | 内容 | 記号 | Unicode表記 | 内容 | 記号 | Unicode表記 | 内容 | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
U+F862 U+6709 U+9650 U+4F1A U+793E |
組文字・有限会社 | XIII | U+F862 U+0058 U+0049 U+0049 U+0049 |
ローマ数字13大文字 | xiii | U+F862 U+0078 U+0069 U+0069 U+0069 |
ローマ数字13小文字 | ||||||
|
U+F862 U+8CA1 U+56E3 U+6CD5 U+4EBA |
組文字・財団法人 | XIV | U+F861 U+0058 U+0049 U+0056 |
ローマ数字14大文字 | xiv | U+F861 U+0078 U+0069 U+0076 |
ローマ数字14小文字 | ||||||
| TB | U+F860 U+0054 U+0042 |
単位・テラバイト | XV | U+F860 U+0058 U+0056 |
ローマ数字15大文字 | xv | U+F860 U+0078 U+0076 |
ローマ数字15小文字 |
[編集] Mac OS X での対応
Mac OS X においては、MacJapanese は「Shift JIS (Mac)」(文字パレット)あるいは「日本語 (Mac OS)」(テキストエディット)と表現される。
また、Mac OS X 附属のフォントでは Osaka のみが MacJapanese に完全対応している。ヒラギノは Unicode と CID に対応しているため、Unicode を扱えるアプリケーション上では Unicode に対応する文字が存在しない18字(上記の区分5〜7)を除いて MacJapanese の文字を表示できる。一方、CID を扱えるアプリケーション上でヒラギノを使う場合には、halfwidth horizontal ellipsis (半角三点リーダー)以外の文字を全て表示できる。
[編集] iPod での対応
[編集] 脚注
- ^ iPod 2.0: 日本語、韓国語、繁体字中国語、簡体字中国語で作成されたテキストファイルを表示する方法
- ^ a b c d Mac OS・Mac OS X や、Vista 以降の Windows であれば標準の環境なら正しく表示されるが、XP 以前の Windows では標準で文字合成に対応しておらず、合成に対応したフォントが少ないのが現状。無料導入できるものは和田研フォントをベースにしたものがあり、和田研細丸ゴシック Wiki - SourceForge.JPの下部にて「和田研細丸ゴシックProN」がダウンロード可能。他にも、にしき的フォントにある手書きのポップ体「Nishiki-teki」が対応している。
- ^ a b c d e f g ARIB外字のため、対応フォントが必要。無料導入できるものは和田研フォントをベースにしたものがあり、和田研細丸ゴシック Wiki - SourceForge.JPの下部にて「和田研細丸ゴシック2004絵文字、和田研細丸ゴシック2004ARIB、和田研中丸ゴシック2004絵文字、和田研中丸ゴシック2004ARIB」がダウンロード可能。
- ^ a b Mac OS X では通常の変換でリストに出てこないため、過去の文章との互換性を保つ目的と思われる。
- ^ 無料で導入できるフォントで表示に対応しているものは、Y.Oz Voxにある「YOzFont」や、Unicodeフォントの「Code2000」、にしき的フォントにある手書きのポップ体「Nishiki-teki」などがある。