この記事は XHTML 1.0 入門としての実際にマークアップする際の注意事項についての記事です。
HTML 5 入門に於ける該当記事は、HTML 5で実際にマークアップする際の注意事項をご覧ください。
ここでは、実際にHTML文書を作成する際の注意事項を挙げておきます。
HTML文書のファイル名としては、以下のもののみを使うようにして下さい。
-」_」.」~」特に以下の記号は絶対に使ってはいけません。
/」?」#」@」!」, 半角アポストロフィ「'」, 半角丸括弧「(」「)」及び半角星印「*」は旧い仕様では使える文字とされており、現在も対応しているブラウザも少なくありませんが、現行の標準(RFC 3986)仕様では禁止されており使わない方が安全でしょう。~」は旧い仕様では禁止されていましたが、現在では使える文字とされております。但し、今も禁止文字と見なしてURLエンコードを掛けるブラウザもあるようです。また、日本語文字もHTML文書に記述する際にURLエンコードを掛ければ使えない事も無いのですが、日本語文字には重大な問題点があります。
この問題点を解決するのはかなり厄介なので、対応出来なければ日本語文字をURLに入れるのはやめましょう。
拡張子とは、ファイルの種類を判別するためにファイル名の末尾に付けられた「.」で始まる数文字の文字列の事です。
ウィンドウズでは拡張子でファイルの種類を判別しているため、拡張子が間違っていると開けない場合があります。
しかし、ここまで拡張子に依存しているOSは実はウィンドウズくらいしかありません。
ユニックスやリナックスでは拡張子はOSではなくユーザがファイルの種類を判別するために用意しているだけのものですし、マックOSに至っては拡張子の概念すらありません(今日ではウィンドウズとの互換性のため拡張子も併用しておりますが)。
結論から言えば、HTML文書の拡張子は一切規定されておりません。
しばしば、HTML文書を作ったら拡張子は「.html」か「.htm」で保存せよ
と書かれたHTML入門書籍/ウェブサイトがありますが、.html でなくても或いは .htm でなくても構いませんし、それこそ拡張子を付けなくてもHTML文書と言う意味では全く問題ありません。
ただ、
を考えて適切な拡張子を与えれば良いのです。
ウェブサーヴァの多くはウィンドウズ同様拡張子で配信するコンテンツの種類を判定するようになっております。
そのようなサーヴァの場合、サーヴァで設定された拡張子が付いていないと正常に配信されない恐れもあります。
ですから、実際にウェブで公開するためにHTML文書を作成するのであれば、サーヴァの設定とローカルの環境の双方を勘案して適切な拡張子を付けるようにすれば良いのです。
そしてその適切な拡張子は概ね .html ないし .htm となると言うだけなのです。
丸囲み数字やローマ数字など、ウィンドウズとマック OSなど複数の環境で異なる文字コードが与えられている文字は機種依存文字と呼ばれ、実際に作成したOSと異なるOS上のブラウザで見た場合に文字化けする事になります。
但し、HTML文書をユニコードを元にしたエンコーディング(UTF-8など)で記述する場合には、丸数字やローマ数字などについても、機種に拘らず共通の文字コードとなりますので、使っても問題はありません。
機種依存が問題になるのはユニコードを元としていないシフトJISコードや日本語EUCなどで記述する場合となります。
また、数値文字参照を用いる事で、文字コードのエンコーディングに関係なく丸数字やローマ数字を使う事も出来ますが、携帯電話やPC向けでも旧式のウェブブラウザでは表示されない場合があります。
実際に利用している文字コードのエンコーディングがよく分からない場合は、機種依存文字は使わないか数値文字参照で記述するようにしましょう。
半角カナ文字は文字コードは統一されているのでその意味では機種依存文字とは言えませんが、旧いOSの中には適切に処理出来ないものがあります。
今日では結構半角カナ文字を使う事は多いようですが、使わない方が安全でしょう。
携帯電話向けにHTML文書を書く場合、以下の制約が加わります。
携帯端末では、シフトJISコードで記述してください。
丸数字やローマ数字などの機種依存文字はたとえ文字参照を用いても、或いはUTF-8で記述しても表示出来ない場合があるため使わないようにしてください。
半角カナ文字については問題はありませんが、PCなどで閲覧される場合には問題が生じるかも知れませんので注意してください。
絵文字については端末のキャリアごとに異なります。
数値文字参照で記述出来るキャリアもあれば、タグを用いて記述するキャリアもあります。