サイトマップ

ここではサイトマップに関して解説します。ちなみにサイトマップという場合、ホームページの一部としてサイト内のリンクを集めたショートカット用のページを指す場合とテキストやXML形式のサイトマップファイルをrobots.txtサイトマップ送信用のフォームで検索エンジンに知らせる場合の二つがあり、今回扱うのは後者です。

サイトマップとは

サイトマップを使うと、ウェブマスターはサイト内のクロールされるページを検索エンジンに簡単に知らせることができます。 サイトマップは、最終アップロード日、通常の更新頻度、サイト内の他の URL との相対的な URL 優先度など、各 URL の詳細メタデータのほか、サイトの URL がリストされている簡単な形式の XML ファイルであるため、検索エンジンでより正確にサイトをクロールできます。

上記がsitemaps.orgのサイトマップの定義です。サイトマップはもともとグーグルが開発したプロトコルで、ウェブマスターにその送信用のフォームとして提供されたのがウェブマスターツールだったりします。その後、他の検索エンジンもサイトマップファイルを利用したいという事でsitemaps.orgなるサイトができました。sitemaps.orgの内容はごく一部を除いてグーグルのサイトマップに関する解説とほぼ同じ内容なのでこちらを読めば十分だとおもいます。07年現在では検索エンジンの専用フォーム以外でもrobots.txtによってサイトマップファイルを通知することができます。

サイトマップの効果

サイトマップは特にページ数の多いサイトで有効とおもわれます。クローラはリンクをたどってページを見つけるので、内部リンクが充実していない場合などなかなかインデックスされにくいケースがありました。サイトマップとしてウェブマスターのほうがURLをリストアップ・通知することでクローラが巡回しやすくなります。管理人のサイトは9,000近くURLがあるのですが、概ね1ヶ月に一度は全てのページをクローラーが訪れていることが確認できています。

あとsite:構文で検索した際に表示される総URL数が実際のインデックス数よりも多くなります。例えばAサイトが検索結果800件と表示されても検索結果の2ページ目以下をクリックすると検索結果が300件などと少なく表示される場合があります。多分、クローラーが巡回するURLには含まれているものの、実際にはインデックスまでに至っていないものと考えられます。気長に待ちましょう。

サイトマップの作り方

  1. テキストファイルで作成
  2. サイトマップ プロトコルを使用する
  3. サイトマップ生成ツールを使用する

サイトマップの作成に関しては上記三通りの方法があります。3.のサイトマップ生成ツールを使用するとはサードパーティと呼ばれる(多分)第三者が作ったツールで日本語のサイトにもそのような感じのものがあった気がします。管理人は利用したことがないしプロトコルの勉強にもならないので割愛します。

テキストファイルで作成

一番簡単で応用の効く方法です。後で述べる”簡単なXMLサイトマップの作り方”でも利用しますので是非ポイントを覚えましょう。ポイントは二つだけです。

サイトマップ プロトコルを使用する

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url><loc>http://www.take33.net/google/index.html</loc></url>
<url><loc>http://www.take33.net/google/01.html</loc></url>
<url><loc>http://www.take33.net/google/02.html</loc></url>
<url><loc>http://www.take33.net/google/03.html</loc></url>
</urlset>

上記がサイトマッププロトコルを使用して作成したものです。XML形式という事でグーグルのヘルプもイマイチ要領を得ないので敬遠しがちですが、XMLはHTMLの親戚でありポイントをつかめばそんなに難しくはありません。まずプロトコルという言葉ですが、直訳すると通信方法、つまり検索エンジンにこのファイルがサイトマップであるということを示す方法のことです。プロトコルの基本的な決まりごとは五つです。以下ではメモ帳での作り方を紹介します。

スキーマの宣言を行う

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

この箇所がスキーマに当たります。そのままコピー&ペーストすればよくウェブマスターのほうで任意に変更する箇所はありません。テキストの頭にコピーすればOKです。

タグで囲む

HTMLと同じ要領でURLをタグ付けしましょう。ただし序列はURLSET>URL>LOCの順番です。最後の</urlset>+改行を忘れずに!

UTF-8エンコードでXML形式にする

メモ帳のテキスト形式からXML形式に変換するわけですが、ここで間違いがないか一度確認しましょう。間違いがなければテキストをワードで開きます。名前をつけて保存を選び名前と一緒にファイル形式も指定できるのでXMLを指定しましょう。何かメッセージが出る気がしますが無視しましょう。後は再度XMLファイルを開いてスキーマが非表示に、URLがピンクふちのタグに囲まれていれば完成です。少々グーグルの解説を逸脱しているような気もしますが、グーグルで正しく認識されているか検証できますのでとりあえずサイトマップを送信してみましょう。

サイトマップ30秒クッキング

クッキングではないというツッコミはさておき、簡単にXMLサイトマップを作る小技を紹介します。用意するものは以下の2点です。

http

<url><loc>http

.html

.html</loc></url>

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">


</urlset>

上から順に置換とコピー&ペーストしていくだけなので30秒でできます。まず、httpを<url><loc>httpに.htmlを.html</loc></url>に置換します。次にスキーマの箇所を最初に、</urlset>を最後にコピーします。あとはメモ帳をワードで開いて”名前を付けて保存”でXML形式で保存すれば完了です。この方法は小技ともいえない簡単なものですが、更新が簡単なので定期的にページ数が増えていくようなサイトではサイトマップの作成に重宝するとおもいます。

サイトマップそのほかのコト

このページでは面倒くさいのもあって触れませんでしたが、各URLについて優先度・最終更新日・更新頻度などの情報を含めることができます。XML形式の最大の特徴はこのような付随情報を追加できることにあるのですが、管理人はこれらの付随情報にこだわる必要は低いと考えます。サイトマップはあくまで検索エンジンに対して補助的な情報を提供することが目的であり、検索エンジンを操作する(誤魔化す)ことはできません。例えば全てのURLに対して優先度や更新頻度を最高にしても意味はありません。やっても効果が薄いなら、検索エンジンのアルゴリズムを尊重するのも一法といえます。

同じ要領でサイトマップのサイトマップを作ることができます。スキーマの箇所その他多少違いますが、サイトマップをURL数やサイトごとに分けている場合は検索エンジンへの送信が一度で済むので更新が楽になります。グーグルのサイトマップに関する解説の下段に書いてあり、このページを理解することができればそう難しくはないはずです。