グーグルウェブマスターツールはSEOを考えているウェブマスターにとっては必須ともいえるツールです。グーグルの最終クロール日やインデックス状況からサイトマップファイルの送信までさまざまな情報を知ることができます。ここでは各項目を簡単に紹介しコメントします。グーグルウェブマスターツールとそのヘルプにリンクを貼りましたので一度御自身で確認ください。
ウェブマスターツールを利用するに当たってまず対象となるサイトを追加します。サイトは自分が管理していないものでも追加できますが、認証のためのメタ情報の追加やファイルのアップロードができないと(つまり他人管理のサイトだと)閲覧できる情報が制限されますのでほとんど意味がありません。
上記の4カテゴリーに分類されており、各項目毎にみていきます。
上記の項目で構成されています。重要と思われるものについてみていきます。
クローラーが最後にホームページをアクセスした月日及び現在の状態(インデックスされているか、いないのか)が分かります。グーグルからスパムサイトとみなされている場合、ここに警告が出るそうです。ちなみにここで記されている最終アクセス日はサイトのトップページにアクセスした月日で尚且つグーグルのキャッシュに残っている月日と一致します。必ずしもアクセスログに残っている情報とは一致しません。
robots.txtへのリンクがあり直接確認できるようになっており、どのURLがrobots.txtで制限されているのかをテストできます。また、robots.txtの機能が拡張されサイトマップファイルを指定することができるようになり、その検証も行っています。グーグルのユーザーエージェントについても解説してあったのでここに記します。
最近90日間のGooglebotの活動を折れ線グラフで表示しています。またGooglebotのクロール頻度を”高速”、”標準”、”低速”から任意に選択できます。しかし”高速”を選択できるサイトはグーグルのアルゴリズムにより決定されるそうで、ページランク1の管理人のサイトは待てど暮らせど選択できません。なお折れ線グラフの項目は下記の通りです。
www.take33.net/google/とtake33.net/google/は異なるURLですが表示されるページは同じです。リンクの際に使用するURLが統一されていない場合、同一ページであるにもかかわらず二つのURLがグーグルにインデックスされる場合があります。このような場合、重複コンテンツとしてどちらか一つが消去される必要があるのですが、それを任意に選択することができます。
その名の通りグーグルイメージ検索用のGooglebot−Imageの活動が活発になる効果があると思われます。ちなみにイメージ検索やメディア検索ではファイルの内容そのものを検索するわけではなく、ファイルの前後の文脈・ALT属性などを判断して検索クエリにあったファイルだという決定をしているそうです。
URLの削除リクエストはもともとウェブマスターツールとは別にあったのですが、統合されたみたいです。統合前のやつを一度利用したことがありましたがイチイチ削除用のアカウントをとったりと面倒くさかったので統合されて利便性が高まりました。ただしリクエスト数が増えたためか削除されるまでの時間がやたら長い(統合前の24時間以内と比べてですが)、あと個人的なこととして”拒否された”リクエストがいつまでも残っていてウザイかも・・・。自分のせいで拒否されたのですが、あたりしいリクエストで該当ページが削除されても残り続けているので一種のバグではないのかと思っています。ちなみにURL削除のための準備とグーグルのインデックスから削除できる項目は下記の通りです。
統計で扱われている項目は、具体的にグーグルがサイトをどのように評価しているのかや検索クエリに関する情報が掲載されています。重要な情報とはおもいますが、うまく使いこなせていないのが管理人の現状です。
ページランクの配信情報が掲載されています。高・中・低・割り当てなしの4つに分類されていますが、管理人のサイトは全て”低”なので全く意味がありません。ページランクが5以上程度でページ数の多いサイトなどは配信情報が一目でわかって参考になるかもしれません。www.google.comの配信情報を見てみたいものです。
”ページランクの最も高いページ”にはサイト内で1ヶ月にページランクの一番高かったURLが表示されます。ここに表示されるのがトップページのURLでなかった場合、トップページを作り直したほうが良いと思います。ちなみに左側の数字は該当の月でページランクではありません。
”検索クエリ”と”検索クエリのクリック数”が統計情報として表示されます。上記はグーグルによる説明ですが、ざっくりいうと”検索クエリ”の項目は検索窓に打ち込まれたクエリに対してグーグルが返した順位、”検索クエリのクリック数”はグーグルの検索結果で表示されたリンクから実際にサイトを訪れたユーザーが利用した検索クエリでの順位だそうです。
”検索クエリのクリック数”が大事そうですが、管理人のサイトは低ページランクなのもあって、更新頻度が遅く情報の正確性にかけるのでクリック数に関してはアクセスログで確認したほうがよさそうです。むしろ”検索クエリ”を参考程度に眺めたほうがよさそうです。管理人の統計情報では普通に400位などの順位で表示されていますが、何位であれ検索結果に表示されるということは大事だと考えます。負け惜しみではなくて、例えばSEO関連の項目についてホームページを作成しているのに全くSEO関連の検索クエリで表示されないとすれば、グーグルはそのホームページがSEOと関係ないと考えていると見ることができるからです。逆に全く関係のない検索クエリに反応するのであればサイトや被リンクの構成を見直す必要があるといえます。
この統計情報に関しては、ふーんそうなのかぁーということ以外いえません。サイトのコンテンツに関してはグーグルがどうやってサイトを解釈しているのかが垣間見えます。”動画”、”DVD”、”定額”等の比較的短い単語に関してはそのままですが人名などの場合基本的に苗字と名前のところで区別されているようです。サイトのコンテンツが自身の考えるモノとかみ合わないようだったらサイトの再構成が必要といえます。
上記がグーグル以外のヤフーやMSNなどの検索エンジンでも使える特殊構文という検索方法です。管理人が頻繁に使うのがsite:構文です。”:”以下は好きなドメインを入力すればよいだけです。自サイトのインデックス状況からライバルサイトの研究までいろいろ使える構文です。ここでもやはり検索結果には注意が必要です。トップページが一位表示は当たり前としても、サイトのページ数が多くジャンル毎にディレィトリを分けているような場合は各ディレクトリのトップページが上位表示されなければサイト構成に誤りがあると考えたほうがよさそうです。
link:はサイトのトップページにリンクしているページがわかるそうですがグーグルには独自の基準があるらしく、実際にリンクされていても検索結果に表示されないサイトが多くあります。後述の”外部リンク”でリンクが確認されているサイトでも表示されません。この項目に関してはグーグルのヘルプを充実してほしいものです。
related:はサイトと類似しているページが検索されるとのことですが、最初はよく分かりませんでした。グーグルのヘルプのどこかで読んだ気がしますが、グーグルの検索アルゴリズムの結果サイトの内容が似ていると判断されたものは類似ページとしてrelated:構文や検索結果に表示される”関連ページ”で類似ページ一覧の検索結果ページが表示されます。こうすることで似た内容のページをすぐに見つけられるというのがウリらしいのですが、実際にグーグルの関連ページはヤフー・MSN他検索ポータルサイトでアルゴリズムの面目躍如といったところです。また、自分のサイトがどのように評価されているのかの参考にもなります。
サイトへのリンクを”外部リンク”と”内部リンク”に分けて表示しています。link:構文とは違ってサイトへのリンクが該当のページごとに数多く表示されます。ここで注目したいのが、同じサイトからのリンクでも全て検出されることと、動的URLとおもわれるものからもリンクが検出されているという点です。更新頻度は大体1ヶ月といったところで”最終検出日”の表示も過去1ヶ月以内のものです。
内部リンクに関しては二つの重要な推測ができます。一つ目は内部リンク充実の重要性です。ページランクの説明でリンクが重視されていると書かれていますが、これは内部リンクにも当てはまるということです。二つ目はグーグルはサブドメインを認識しているということです。管理人がスパマーだったころgoogle.take33.net/というサブドメインをとって他の管理サイトにリンクしていましたが全て内部リンク扱いでした。結論としては、www.take33.net/google/のディレクトリ形式にしたほうがグーグルにとってもウェブマスターにとっても混乱が少なく良いと思われます。
もともとウェブマスターツールのウリはグーグルにサイトマップの送信が行える、ということでした。2007年現在robots.txtからもサイトマップが送信できますが、いろんな情報が表示されるのでこちらからもサイトマップを送信しましょう。サイトマップに関する解説は別ページを参考にして下さい。ちなみに表示される項目は下記です。