制作者の活動(PR)。

アイドル女優・堀北真希ちゃんのうさ耳キャラクタ。次
主な作品

コンタクトレンズをつけている堀北真希うさぎ(うさ耳女子大生)を描いたイラストと仮想コマーシャル動画〜昔の『オプティマ』CM風に〜

グーグルでの携帯電話向けサイト用サイトマップの作り方。

ここでは、グーグルの携帯電話向けサイトマップの作り方について解説いたします。

グーグルでの携帯電話向けサイト用サイトマップの作り方・目次。

携帯電話向けサイト用サイトマップの概要。

グーグルでは、携帯電話向けサーヴィスとして、携帯電話向けサイトに限定した検索機能を用意しております。

そして、携帯電話向けサイト専用のXMLサイトマップを通常のXMLに依るサイトマップを拡張した形で導入しております。

現在、グーグルはエヌ・ティ・ティ・ドコモとKDDI/沖縄セルラーが公式サーヴィスとして採用しており、当然これらの端末からのアクセスを期待するにはグーグル対策が欠かせないと言う事になります。

携帯電話向けサイト用サイトマップの書式。

グーグルでは、通常のXMLに依るサイトマップを拡張したフォーマットを幾つかのサイトに適用しております。

携帯電話向けサイトについても、専用のフォーマットが用意されており、このサイトマップを用いる事で、携帯電話向けサイト検索機能用クローラの手助けとなります。

グーグル専用の携帯電話向けサイトマップの書式は以下のように、通常のサイトマップを拡張したものです。

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:mobile="http://www.google.com/schemas/SITEMAP/1.0">

    <url>
        <loc>ページのURL</loc>
        <priority>優先度</priority>
        <changefreq>更新頻度</changefreq>
        <lastmod>最終更新日時</lastmod>
        <mobile:mobile/>
        </url></urlset>

携帯電話向けサイト用サイトマップの宣言と要素。

検索エンジン用サイトマップの要素は一部を除いて通常のサイトマップの要素と同じですが、幾つか要素と属性が追加されております。

ここでは、全ての宣言・要素・属性について解説いたします。

<?xml ?>宣言

サイトマップはXMLですので、<?xml ?>宣言を初めに行います。

尚、エンコーディングは必ずUTF-8にしなければなりません。

<urlset>要素

サイトマップのルート要素です。

通常のサイトマップでの<urlset>要素同様、デフォルトの名前空間として、http://www.sitemaps.org/schemas/sitemap/0.9 を指定しますが、これに加えて xmlns:mobile="http://www.google.com/schemas/SITEMAP/1.0" 属性も併せて指定します。

<url>要素 (必須)

文書URLの情報を纏めた要素です。URL一つにつき、一つの<url>要素を持たせます。

基本的に通常のサイトマップでの<url>要素と同じですが、携帯電話向けURLである事を示す<mobile:mobile>要素が追加されております。

<loc>要素 (必須)

文書のURLを内容とします。

  • このとき、ノード名, ディレクトリ名やファイル名に半角英数字, ハイフン, ドット, アンダスコア, ティルダ以外の文字が含まれている場合には必ずURLエンコードを行います。
  • 特に、仮名文字や漢字など、非アスキィ文字が含まれる場合はノード名部分ならピュニコード化が、その他の部分ではURLエンコードがそれぞれ必要です。
  • また、URLは最長2,048オクテットまでとなります。
<priority>要素 (省略可)

当該文書の希望クロール優先度を表す0.0から1.0までの実数を内容とします。

  • 但し、実際のところ、検索エンジンはこの情報を殆ど意識しないようです。
  • この要素の内容の値は、サイトマップ内での優先順位を表します。従いまして、全部1.0(最優先)としても意味はありません。
<changefreq>要素 (省略可)

当該文書の推定更新頻度を表す文字列を内容とします。

公式にサポートされている文字列は以下の通りです。

always
常に内容が変動する文書です。
hourly
一時間毎に更新される文書です。
daily
毎日更新される文書です。
weekly
毎週更新される文書です。
monthly
毎月更新される文書です。
yearly
毎年更新される文書です。
never
更新を行う事の無い文書です。

尚、これらの値はあくまでも参考程度にしか扱われません。

  • 例えば、alwaysを指定したからと言って、頻繁にクロールが増えると言う事にはなりません。
  • 或いは、neverを指定したからと言って、一回クロールしたらもう二度と来なくなると言う事にはなりませんし、またこの値を指定したからと言って二度と更新してはいけないと言う事にもなりません。
<lastmod>要素 (省略可)

当該文書の最終更新日時を、W3Cが定めたフォーマット(ISO 8601をベースとしている)で記述します。

  • 時刻は協定世界時(UTC)とします。日本時間からは 9時間前にしたものとします。

例えば、日本時間の平成21年11月13日午前10時24分10秒に更新したのであれば、

<lastmod>2009-11-13T01:24:10Z</lastmod>

と記述します。

  • 手書きの場合は秒単位にこだわらなくても良いと思われます。
  • 特にローカルでサイトマップを作成する場合には、ローカルでの更新日時とサーヴァでの更新日時にずれが生じますので(ローカルで作成した文書等をサーヴァに設置するのにタイムラグが発生し、その結果サーヴァから見た更新日時がずれてしまう)、それ程神経質になる必要も無いかと思われます。
<mobile:mobile>要素 (必須)

当該文書が携帯電話向けである事を示す要素です。

  • この要素は空要素ですので、タグの末尾は /> となります。

また、全ての<url>要素内に<mobile:mobile>要素を記述する必要があります。

  • つまり、一つのサイトマップに携帯電話向けの文書のURL情報とPC向けの文書のURL情報を混在させる事は出来ません。

携帯電話向けサイト用サイトマップに関する注意事項。

注意点は通常の検索エンジン用サイトマップでの注意事項と全く同じですが、改めて解説いたします。

エンコーディングは必ずUTF-8にします。

アスキィ文字はシフトJISコードでも日本語EUCでも文字コードは一致しますので、UTF-8が使えない環境の場合はアスキィ文字だけで作成すればよいでしょう。

特に、URLにUTF-8でエンコードされた非アスキィ文字が含まれる場合には、UTF-8で作成出来るならそのまま書いても構いませんが、それ以外の場合、すなわち、

場合には、

アスキィ文字化する必要があります。

例えば、<url>要素の内容として、

<url>http://www.アイドル.uso/堀北真希/</url>

と言うURL(このとき、堀北真希はUTF-8で認識される事とする)なら、

<url>http://www.xn--ccke5ivf.uso/%E5%A0%80%E5%8C%97%E7%9C%9F%E5%B8%8C/</url>

とエンコードします。

サイトマップを設置しているホストとスキーム名及びノード名が一致している必要があります

分かり易く言えば、サイトマップから相対URLでアクセス出来るURLのみ記述出来ると言う事です。

例えば、サイトマップのURLが http://www.uso800.uso/ であれば、

などは全て記述出来ないURLとなります。

サイトマップより上位ディレクトリ・サイトマップ収納ディレクトリ外にある文書類のURLは書けません

例えば、サイトマップが http://www.uso800.uso/user/sitemap.xml 上にある場合、

など、上位ディレクトリにある文書や

など、収納ディレクトリ外にある文書のURLは書けません。

一本のサイトマップに収納出来る<url>要素は五万箇まで、ファイル全体のサイズは10メガバイトまでとなっております

これ以上の文書が入る場合には、サイトマップを分割する必要があります。

このとき、分割したサイトマップを一纏めにする、サイトマップインデックスと言う書式も使えます。

しらぎくのウェブサイト作成入門サイトマップ

ページ外へのご案内。

marguerite.site@gmail.com