制作者の活動(PR)。
- 堀北真希ちゃんにうさぎの耳を付けたら可愛いだろうなと思って作った創作キャラクタ
-
- 主な堀北真希うさぎ収録作品
-
堀北真希うさぎ(うさ耳女子大生):平成元年〜平成 3年頃のボシュロム製コンタクトのTVコマーシャル風にレンズを着けている場面と仮想CM動画
- サイト表紙
- しらぎくのウェブサイト作成入門
- HTML&CSS入門
- XHTML 1.0 入門篇
- 文書マークアップの基本
- 文字参照について
文字参照について。
HTMLで通常の文字として記述出来ない文字を記述するための文字参照について解説します。
文字参照について・目次。
文字参照とは何か。
文字参照とは、HTMLに於いて主に直接記述出来ない文字を記述するための方法です。
文字参照が必要な理由。
HTMLでは
- タグの初めが
<であり、
- またタグの終わりは
>となる
事から、これらの記号をそのままテキストとして記述するのは拙いと言う事が分かると思います。
実際、<が現れたら、そこからタグが始まったと誤認されてもおかしくありません。
このため、これらの記号の記述には、文字参照が必要になるのです。
文字参照には以下の二種があります。
- 実体参照
-
文字に与えられたキーワードを用いる文字参照です。
書式は以下のようになります。
&キーワード;
この場合、キーワードは大文字小文字を区別しますので、間違えないでください。
- 数値文字参照
-
文字コードを用いる文字参照です。
書式は以下のようになります。
&#文字コード;
ここで、文字コードにはユニコード(UCS-2/UCS-4)が用いられます。
十進数の場合は数字の列を、十六進数の場合には小文字の「x」に続けて十六進数の英数字(大文字小文字は不問)を記述します。
- 但し、一部環境で十六進数の数値文字参照を認識しないものがあるようですので、特に指定されない限り十進数の数値文字参照を用いた方が良いでしょう。
HTMLで最低限必要な文字参照。
HTMLに於いては、最低以下の四つの文字参照(実体参照)を覚えておいて下さい。
<
<
>
>
"
"
&
&
- 「
<」及び「>」は、いずれもタグを構成する記号ですので、そのまま書いては拙い事になります。
- また、タグでは属性値は「
"」で挟みますが、属性値に「"」が含まれているとそこで属性値が終わったものと誤認されてしまいますのでやはり " と文字参照にする必要があります。
- そして、文字参照に「
&」が使われると言う事は、「&」自身の記述も文字参照で表わさないと拙い事になります。
いつ文字参照に書き直すべきか。
文書の中に文字参照に変換すべき文字が含まれている場合、マークアップ前に変換すべきです。
そうでないと、マークアップ中にその記号をタグと誤認する恐れがあるからです。
- もっとも、いつ文字参照に変換すべきかは仕様で規定されている訳ではないので、最終的に文字参照にすべき文字が変換されていれば問題はありません。
その他の文字参照の用途。
文字参照には他にもいくつかの用途があります。
- キーボードから入力出来ない文字を記述する
-
環境に依っては、外国語の文字を記述したくてもキーボード, 入力システム或いはテキストエディタの制約から不可能な場合もあります。
そのような場合には数値文字参照を用いて記述する事となります。
- エンコーディングの都合で文書に記述出来ない文字を記述する
-
UTF-8などユニコードを用いたエンコーディングで記述するのであれば問題になる事はありませんが、例えばシフトJISコードでエンコードされた文書にはハングルなどは直接記述出来ません。また、ISO-8859-1で記述された英語などの文書では日本語文字の記述も不可能です。
このような状況ではやはり数値文字参照を用いて記述する事となります。
- 機種依存文字を安全に記述する
-
丸数字やローマ数字などの機種依存文字は、OSなどに依存するため、制作側では問題なくても閲覧側で文字化けなどが起こる事があります。
このような文字を安全に記述するために、当該文字に与えられた文字コードを数値文字参照を用いて記述する事となります。
- 但し、文字コードのエンコーディングがユニコードを元としたもの(UTF-8など)であれば、数値文字参照にしなくても機種の相違に依る文字化けは起こりません。
- また、携帯電話やPCでも旧式のウェブブラウザの場合には、数値文字参照で記述しても正常に表示出来ない場合もあります。
- 携帯電話向けの絵文字を記述する
-
携帯電話のキャリアにも依りますが、絵文字を数値文字参照で記述する事としているものがあります。
参考・いくつかの数値文字参照の例。
参考までに、いくつかの数値文字参照の例を挙げておきます。
- この項目は、一部閲覧環境で文字化けする場合があります。
- 波線「〰」
-
「〜〜〜」と言う細かい波線の文字は 〰 と記述します。
- 「う」の濁点「ゔ」
-
カタカナの「ヴ」はキーボードからも入力可能ですが、ユニコードにはひらがなも定義されており、ゔ と記述します。
- 丸数字
-
丸で囲んだ算用数字は、1から20まで、それぞれ 9312 から 9331 までのユニコードが与えられております。
- つまり、9311に数値を加えた文字コードとなります。
- また、丸で囲んだ 0「⓪」は
9450 となります。
たとえば、丸で囲んだ 3「③」を記述したい場合には、以下のように記述します。
③
尚、ユニコードでの丸数字には黒地の丸数字や和数字の丸数字がそれぞれ 1から10まで定義されております。また、丸囲みのアルファベットやカタカナも定義されております。
- 黒地の丸数字
- 1から10まで、
➊ から➓ まで。
- 太字の丸数字
- 1から10まで、
➀ から➉ まで。
- 丸和数字
- 一から十まで、
㊀ から㊉ まで。
- 丸英字
-
- 大文字は Aから Zまで、
Ⓐ からⓏ まで。
- 小文字は aから zまで、
ⓐ からⓩ まで。
となります。
- 丸カタカナ
-
アイウエオからラリルレロワヰヱヲまで、㋐ から㋾ まで。
- ローマ数字
-
大文字と小文字がそれぞれ定義されております。
- 大文字のローマ数字
-
1から1万まで定義があります。
- 「Ⅰ」(1)から「Ⅻ」(12)まで、
Ⅰ からⅫ まで
- 「Ⅼ」(50), 「Ⅽ」(100), 「Ⅾ」(500), 及び「Ⅿ」(1,000)はそれぞれ
Ⅼ から Ⅿ まで
- 「ↁ」(5,000)及び「ↂ」(1万)はそれぞれ
ↁ と ↂ
- 小文字のローマ数字
-
1から1,000まで定義があります。
- 「ⅰ」(1)から「ⅻ」(12)まで、
ⅰ からⅻ まで
- 「ⅼ」(50), 「ⅽ」(100), 「ⅾ」(500), 及び「ⅿ」(1,000)はそれぞれ
ⅼ から ⅿ まで
- 斜め矢印
-
上下左右の矢印「↑」「↓」「←」「→」はJISコードでの定義があるため日本語環境であれば直接入力も可能ですが、ユニコードでは斜め矢印も定義しております。
- 左上向き「↖」
↖
- 右上向き「↗」
↗
- 右下向き「↘」
↘
- 左下向き「↙」
↙
と記述します。
- 但し、これらの斜め矢印は45度の向きになっていない場合があります。
この他にも、ユニコードでは L字型の矢印や上下或いは左右の両向き矢印など、様々な矢印が定義されております。
また、右向きの矢印には、装飾を施した矢印が多数定義されております。
- ハートマーク
-
- 塗り潰していないハート「♡」は
♡
- 塗り潰されたハート「♥」は
♥
と記述します。
- 温泉マーク「♨」
-
♨ と記述します。
他にも、占星術の星座(へびつかい座は除く), 天気マークなどの絵文字も定義されております。
- ですから、携帯電話向けの絵文字の一部を、数値文字参照でPC向けに変換する事も可能です。
しらぎくのウェブサイト作成入門サイトマップ