この記事は XHTML 1.0 入門としての記事です。
HTML 5 入門に於ける該当記事は、HTML 5 とはどのような言語かをご覧ください。
先ず、ウェブ文書に用いられるHTMLとはどのような言語を解説します。
HTMLとはハイパーテキスト・マークアップランゲージの略で、電子文書の一種であるハイパーテキストを作成するためのマークアップ言語です。
つまり、文書を電子化するための言語の一つです。
ハイパーテキストとは文書と他のリソース(文書, 画像などは勿論、メールアドレスなどウェブ上で取扱えるもの一般)との関連付け(ハイパーリンク)が可能な電子文書の事です。
元々、WWW(ワールド・ワイド・ウェブ)は学術論文の電子化のために考案されたものです。
学術論文の場合、参考文献の提示は至極当たり前に行なわれます。
読者が論文を読んでいて提示された参考文献を調べたいと思ったとき、通常の紙の論文では、自分で参考文献のあるところまで行って当該文献を入手しなければなりません。
もし自分がいる研究施設に当該論文が無ければ、置いてある研究施設にまで取りに行く必要が生じます。
WWWでは論文中で提示された参考文献名を当該文献と関連付ける事に依り、当該文献を迅速に参照出来るようにしております。
上述のようにHTML文書の最大の特徴は、ハイパーリンクが使える電子文書である事ですが、HTMLにはもう一つ大きな特徴があります。
それは、どんな環境でも利用出来る文書である事です。
WWWが考案された当初、まだウェブブラウザの開発が遅れていた事もあり、ウェブ利用者はワープロソフトにウェブにアクセスする機能を追加して閲覧しておりました。
ワープロソフトにしても、マイクロソフト・ワードや一太郎やロータスなど、様々なソフトウェアがありますが、これらが扱うデータフォーマットはバラバラで、あるワープロソフトのフォーマットに従うと他のワープロソフトでの閲覧に支障が生じる事になります。
このため、HTMLではどんなワープロソフトでも適切に開けるように、文書の基本構造のみを明示し、実際の表示については各ワープロソフトやウェブブラウザなどの表示フォーマット(これをスタイルシートと呼びます)に一切任せると言う方針を採ったのです。
現在では一般のグラフィカルなウェブブラウザ以外のあらゆる環境、例えば携帯電話, ゲーム機, 音声出力, 点字出力などと言ったあらゆる閲覧環境でも適切に利用出来ると言う意味にまで拡げられております。
マークアップとは、人間語を認識出来ないコンピュータが文書の構造を認識出来るように文書を構成する各要素に対してコンピュータが認識出来る目印を与えていく事です。
HTMLの場合、タグと呼ばれる目印が用いられております。
文書中にある基本的な構造を成す要素をタグに依って明示する事で、人間語が理解出来ないコンピュータであっても適切に文書の構造を認識出来るようにするのがHTMLに於けるマークアップとなります。
そして重要なのは、コンピュータは認識した要素について、その取扱い方法を一切規定されない事です。
従って、タグは「どう表示しろ」などと言うような命令では決してありません。
そして何よりも、HTMLはプログラミング言語では決してないと言う事です。
多くの初心者の方は、HTML文書でどのように表示させようかを考えてマークアップしたがるかも知れません。
しかし、HTML文書のマークアップは、どのように表示させるかを考えるのではなく、
すなわち
と言う考え方こそが好ましい考え方です。
どのように表示させようかと言う事、すなわちスタイルの指定は、HTMLとは別の技術であるスタイルシート言語を用います。
スタイルシート言語も幾つかありますが、ウェブ文書ではCSSと呼ばれる言語が使われます。
尚、CSSはHTMLより後に考案された技術のため、旧いウェブブラウザでは対応しておりません。
それでも、PC向けのウェブブラウザでCSSに対応していないものはもはや殆ど残っておらず、CSSで表示方法を規定する方法はもはや全く問題がなくなったと言い切れます。
携帯電話のモバイルブラウザにはエヌ・ティ・ティ・ドコモの端末に実装されているものを中心に未だにCSSに対応していないものがあり、このため携帯電話向けのコンテンツでは今日でも推奨されていない物理タグが用いられる場合が多いようです。
実のところ、CSSに対応しない旧式のウェブブラウザやドコモ携帯電話のモバイルブラウザであっても、文書構造を適切にマークアップした文書であれば、表示方法こそ当該ブラウザのスタイルになるものの、文書内容は適切に判読出来る筈です。
対応していなくても文書は判読出来ると言う意味で、CSSは旧いブラウザに考慮した技術と言えます。
対応していなくても文書は判読出来る事、すなわち旧型のブラウザに考慮している事は、昭和30年代後半から40年代前半にかけてテレヴィジョン放送が白黒からカラーに切り替わったときの状況に良く似ていると思います。仮令カラー放送になったとしても、それまでの白黒受像機では色が出ないとは言え引続きテレヴィジョン放送を視聴する事は可能だったからです。
実は、一口にHTMLと言っても、幾つもの規格があります。
余り詳しく解説しても初めての方には分かり難いかも知れませんが、平成22年 7月22日現在最も良く用いられていると思われる規格は、
の二つです。
特にXHTML 1.0は現行の推奨規格とされておりますが、XHTML 1.0は策定されて既に十年以上経っており、改善すべき点も少なくありません。
このため、現在HTMLの規格を定めている非営利団体・W3CはHTMLの後継仕様としてHTML 5の規格化を進めており、仕様の草案も発表し続けております。
現時点でも、既に公開されている草案に従ってHTML 5を使っている者もおりますが(制作者もしらぎくのウェブサイト作成入門以外の殆どのHTMLをHTML 5にしている)、まだ正式勧告されていないため、今後草案が変更されないとも限りません。
このため、当面まだXHTML 1.0を使い続けるのが最も現実的であると思われます。
当サイトでは、XHTML 1.0の中でも初心者にとって学び易いと思われるXHTML 1.0 トランジッショナルと呼ばれる規格を中心に解説いたします。