文字参照
出典: フリー百科事典『ウィキペディア(Wikipedia)』
文字参照(もじさんしょう、Character reference の訳語)
- HTMLなどのSGML文書においては、直接記述できない文字や記号(マークアップで使われる "
<" や ">" など)を表記する際に用いられる方法である。SGML構成素の1つとして定義されており、文書文字集合中の文字を参照する為の手段を提供する。- HTMLにおける文字参照には、表記方法により数値文字参照 (Numeric character reference) と文字実体参照 (Character entity reference) の二種が存在する。
- XMLにおいては、HTMLにおける「数値文字参照」を文字参照と呼ぶ。なおHTMLにおける「文字実体参照」は、XMLでは実体参照(Entity reference)と呼び区別する。
目次 |
[編集] 数値文字参照(文字参照)
数値文字参照は、10進数もしくは16進数によって文書文字集合における該当文字を指定する方法である。以下はその例示であり、同一の記号「♪」を示している。16進数による指定は元々のSGMLの規格には存在しなかったが、HTML 4.0で規格化された。16進数表記の際には大文字小文字の区別がない。
- 「♪」(10進数による指定)
- 「♪」(16進数による指定)
[編集] 文字実体参照(実体参照)
文字実体参照は、特定のキーワード文字列によって文書文字集合における該当文字を指定する方法である。
文字実体参照の方が数値文字参照に比べて直感的に文字参照を行えるため、一般的に用いられる事が多い。しかしながら、文字実体参照として定義されていない特殊な文字(例えば前述の「♪(♪)」)については、数値文字参照を行うより他に参照方法がない。
[編集] HTMLで使用可能な文字参照
以下は、HTMLマークアップにおいて頻繁に用いられると思われる文字実体参照である。
- (
) ノーブレークスペース - 折り返しを起こさない(ホワイトスペースではない)空白 - < (
<) - > (
>) - & (
&) - " (
")
数値文字参照の16進数による表現では大文字小文字の区別がなかったのに対し、文字実体参照では大文字小文字の区別が存在する。よって、以下のような大文字小文字の違いによる文字実体参照の差異が存在する場合がある。
- ä (
ä) 小文字 a(ウムラウト付) - Ä (
Ä) 大文字 A(ウムラウト付)
[編集] XMLで使用可能な実体参照
XMLの仕様においては、定義済み実体として可能な文字は次に示す5種類のみであり、かつ使用可能な位置も定められている。これ以外の実体参照は、別に指定したDTDを使用しない限りは使用できない。
| 定義済み実体 | 表示 | 使用条件 |
|---|---|---|
| & | & |
タグやコメントやCDATA以外の箇所でこの表記を行う |
| < | < |
タグ間の値ではこの表記を行う(<タグ>ここで使用する</タグ>) |
| > | > |
タグ間の値で、この表記をしてもよい(<タグ>ここで使用可能</タグ>) |
| " | " |
属性値ではこの表記を行う(<タグ 属性="ここで使用する">〜</タグ>) |
| ' | ' |
属性値ではこの表記を行う(<タグ 属性='ここで使用する'>〜</タグ>) |
[編集] 文字参照の一覧表
[編集] ISO-8859-1文字
| 文字 | 16進数での表現 | 10進数 | 文字実体参照 | 意味 |
|---|---|---|---|---|
| 00A0 | 0160 | | ノーブレークスペース | |
| ¡ | 00A1 | 0161 | ¡ | 逆立ち感嘆符 |
| ¢ | 00A2 | 0162 | ¢ | セント記号 |
| £ | 00A3 | 0163 | £ | 英貨ポンド記号 |
| ¤ | 00A4 | 0164 | ¤ | 一般通貨記号 |
| ¥ | 00A5 | 0165 | ¥ | 円記号 |
| § | 00A7 | 0167 | § | 節記号 |
| ¨ | 00A8 | 0168 | ¨ | ウムラウト |
| © | 00A9 | 0169 | © | 著作権記号 |
| ª | 00AA | 0170 | ª | 順序の指示(女性形) |
| « | 00AB | 0171 | « | 左角引用符 |
| ¬ | 00AC | 0172 | ¬ | 否定記号 |
| ® | 00AE | 0174 | ® | 登録商標 |
| ¯ | 00AF | 0175 | ¯ | マクロン |
| ° | 00B0 | 0176 | ° | 度記号 |
| ± | 00B1 | 0177 | ± | 加減符 |
| ´ | 00B4 | 0180 | ´ | 鋭アクセント |
| µ | 00B5 | 0181 | µ | ミクロン記号 |
| ¶ | 00B6 | 0182 | ¶ | 段落記号 |
| · | 00B7 | 0183 | · | 中黒 |
| ¸ | 00B8 | 0184 | ¸ | セディーユ |
| º | 00BA | 0186 | º | 順序の指示(男性形) |
| » | 00BB | 0187 | » | 右角引用符 |
| ¿ | 00BF | 0191 | ¿ | 逆立ち疑問符 |
| À | 00C0 | 0192 | À | 大文字 A(重アクセント記号付) |
| Á | 00C1 | 0193 | Á | 大文字 A(鋭アクセント付) |
| Â | 00C2 | 0194 | Â | 大文字 A(曲折アクセント記号付) |
| Ã | 00C3 | 0195 | Ã | 大文字 A(ティルデ付) |
| Ä | 00C4 | 0196 | Ä | 大文字 A(ウムラウト付) |
| Å | 00C5 | 0197 | Å | 大文字 A(輪付) |
| Æ | 00C6 | 0198 | Æ | 大文字 AE 二重母音(合字) |
| Ç | 00C7 | 0199 | Ç | 大文字 C(セディーユ付) |
| È | 00C8 | 0200 | È | 大文字 E(重アクセント記号付) |
| É | 00C9 | 0201 | É | 大文字 E(鋭アクセント記号付) |
| Ê | 00CA | 0202 | Ê | 大文字 E(曲折アクセント付) |
| Ë | 00CB | 0203 | Ë | 大文字 E(ウムラウト付) |
| Ì | 00CC | 0204 | Ì | 大文字 I(重アクセント記号付) |
| Í | 00CD | 0205 | Í | 大文字 I(鋭アクセント記号付) |
| Î | 00CE | 0206 | Î | 大文字 I(曲折アクセント付) |
| Ï | 00CF | 0207 | Ï | 大文字 I(ウムラウト付) |
| Ñ | 00D1 | 0209 | Ñ | 大文字 N(ティルデ付) |
| Ò | 00D2 | 0210 | Ò | 大文字 O(重アクセント記号付) |
| Ó | 00D3 | 0211 | Ó | 大文字 O(鋭アクセント記号付) |
| Ô | 00D4 | 0212 | Ô | 大文字 O(曲折アクセント記号付) |
| Õ | 00D5 | 0213 | Õ | 大文字 O (ティルデ付) |
| Ö | 00D6 | 0214 | Ö | 大文字 O(ウムラウト付) |
| Ø | 00D8 | 0216 | Ø | 大文字 O(スラッシュ付) |
| Ù | 00D9 | 0217 | Ù | 大文字 U(重アクセント記号付) |
| Ú | 00DA | 0218 | Ú | 大文字 U(鋭アクセント記号付) |
| Û | 00DB | 0219 | Û | 大文字 U(曲折アクセント記号付) |
| Ü | 00DC | 0220 | Ü | 大文字 U(ウムラウト付) |
| ß | 00DF | 0223 | ß | ドイツ語の小文字鋭 s(sz 合字) |
| à | 00E0 | 0224 | à | 小文字 a(重アクセント記号付) |
| á | 00E1 | 0225 | á | 小文字 a(鋭アクセント記号付) |
| â | 00E2 | 0226 | â | 小文字 a(曲折アクセント記号付) |
| ã | 00E3 | 0227 | ã | 小文字 a(ティルデ付) |
| ä | 00E4 | 0228 | ä | 小文字 a(ウムラウト付) |
| å | 00E5 | 0229 | å | 小文字 a(輪付) |
| æ | 00E6 | 0230 | æ | 小文字 ae 二重母音(合字) |
| ç | 00E7 | 0231 | ç | 小文字 c(セディーユ付) |
| è | 00E8 | 0232 | è | 小文字の e(重アクセント記号付) |
| é | 00E9 | 0233 | é | 小文字の e(鋭アクセント記号付) |
| ê | 00EA | 0234 | ê | 小文字の e(曲折アクセント記号付) |
| ë | 00EB | 0235 | ë | 小文字の e(ウムラウト付) |
| ì | 00EC | 0236 | ì | 小文字の i(重アクセント記号付) |
| í | 00ED | 0237 | í | 小文字の i(鋭アクセント記号付) |
| î | 00EE | 0238 | î | 小文字の i(曲折アクセント記号付) |
| ï | 00EF | 0239 | ï | 小文字の i(ウムラウト付) |
| ñ | 00F1 | 0241 | ñ | 小文字 n(ティルデ付) |
| ò | 00F2 | 0242 | ò | 小文字 o(重アクセント記号付) |
| ó | 00F3 | 0243 | ó | 小文字 o(鋭アクセント記号付) |
| ô | 00F4 | 0244 | ô | 小文字 o(曲折アクセント記号付) |
| õ | 00F5 | 0245 | õ | 小文字 o(ティルデ付) |
| ö | 00F6 | 0246 | ö | 小文字 o(ウムラウト付) |
| ÷ | 00F7 | 0247 | ÷ | 除算記号 |
| ø | 00F8 | 0248 | ø | 小文字 o(斜線付) |
| ù | 00F9 | 0249 | ù | 小文字 u(重アクセント記号付) |
| ú | 00FA | 0250 | ú | 小文字 u(鋭アクセント記号付) |
| û | 00FB | 0251 | û | 小文字 u(曲折アクセント記号付) |
| ü | 00FC | 0252 | ü | 小文字 u(ウムラウト付) |
| ÿ | 00FF | 0255 | ÿ | 小文字 y(ウムラウト付) |
- 縦破線 (
0166=¦) - ソフトハイフン (
0173=­) - 上付き数字 (
0178=², 0179=³) - 分数 (
0188=¼, 0189=½, 0190=¾) - 古い英語(やアイスランド語、古代スカンジナビア語)
- eth と thorn (
0208=Ð, 0240=ð, 0222=Þ, 0254=þ) - 乗法 (
0215=×)
Windows標準コードページ1252集合に含まれるが ISO-8859-1 に含まれない文字には以下の文字がある。
- ユーロ (
€) - ダガーとダブルダガー (
†, ‡) - ブリット (
•) - 商標 (
™) - 活字の句読点(以下を参照)
- パーミル (
‰)
[編集] タイプセット・スタイル句読法
見やすくするため頭文字“O”の隣に文字を配置している。
| ‘O | ‘ | left single quote | —O | — | em dash |
| ’O | ’ | right single quote | –O | – | en dash |
| “O | “ | left double quote | ‚O | ‚ | single low-9 quote |
| ”O | ” | right double quote | „O | „ | double low-9 quote |
[編集] 関連項目
- Extensible Markup Language#実体参照 - XMLにおける実体参照についてはこちらを参照されたい。
- SGML実体
[編集] 外部リンク
- 5.3 Character references - HTML 4.01(邦訳)は、HTML 4.01勧告における文字参照の説明である。
- 24 Character entity references in HTML 4 - HTML 4.01(邦訳)は、HTML 4.01勧告における文字実体参照の定義である。
- 4.1 Character and Entity References - XML 1.0(邦訳)は、XML 1.0勧告における文字参照及び実体参照の定義である。

