グーグルといえばページランクというぐらい、ページランクはグーグルにとって象徴的な存在といえます。ユーザーにとっても”ページをランキングする”と直感的にわかりやすいのもあってウケているといえます。ウェブマスターにとってはページランクに対しての正しい理解をもつことが、グーグルでの検索結果に結びつくといえそうです。ここでは会社情報などからの引用を元にページランクについて考えていきたいと思います。
”Googleの人気の秘密”、”テクノロジー”、”Googleの理念”の3箇所から抜粋しました。
PageRankについて
PageRank は、Webの膨大なリンク構造を用いて、その特性を生かします。ページAからページBへのリンクをページAによるページBへの支持投票とみなし、Googleはこの投票数によりそのページの重要性を判断します。しかしGoogleは単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていくのです。
こうした分析によって高評価を得た重要なページには高いPageRank (ページ順位)が与えられ、検索結果内の順位も高くなります。PageRank はGoogleにおけるページの重要度を示す総合的な指標であり、各検索に影響されるものではありません。むしろ、PageRank は複雑なアルゴリズムにしたがったリンク構造の分析にもとづく、各Webページそのものの特性です。
もちろん、重要度が高いページでも検索語句に関連がなければ意味がありません。そのためにGoogleは洗練されたテキストマッチ技術を使って、検索に対し重要でなおかつ、的確なページを探し出します。
Google の検索テクノロジーを支えているのは、一連の計算を数分の一秒で同時に行うソフトウェアです。従来型の検索エンジンは、単語が 1 つのウェブ ページに何回出てくるかに重点を置いています。Google の PageRank テクノロジーはウェブのリンク構造全体を調べ、どのページが最も重要かを判断します。その後、ハイパーテキスト一致分析を通じて、現在行っている検索に関連のあるページを特定します。Google は、全体の重要度と検索クエリとの関連性を組み合わせ、最も関連性の高い、信頼の置ける結果を提供しているのです。
- PageRank テクノロジー: PageRank は、5 億の変数と 30 億以上の用語の等式を解決することでウェブ ページの重要度を客観的に測定します。PageRank は、リンク数を数えるのではなく、ページ A からページ B へのリンクを、ページ A によるページ B への投票として解釈します。ページの重要度は、ページが受けた投票数によって決まります。
PageRank では、投票したページの重要度も考慮されます。重要度が高いページからリンクされたページも重要度が上がります。重要なページは PageRank が高くなり、検索結果の上位に表示されます。Google のテクノロジーは、ウェブ上に蓄積された情報を使用してページの重要度を決定します。検索結果にまったく人の手が加わらないことが、有料広告などに左右されない客観的な情報源としてユーザーの皆様から信頼を受けている理由です。- ハイパーテキスト一致分析: Google の検索エンジンは、ページのコンテンツも分析します。といっても、各ページのテキストを単にスキャンするのではなく (この方法はサイトの運営者によってメタ タグで操作される可能性があります)、ページのコンテンツ全体と要素をフォント、分割構造、および各単語の厳密な位置という観点から分析するのです。Google は、隣接するウェブ ページのコンテンツも分析し、ユーザーの検索クエリに最も関連する結果を確実に提供できるようにしています。
ウェブでも民主主義は機能する。
Google が機能するのは、どのサイトのコンテンツが重要かを判断する上で、どのウェブ サイトの重要度が高いかを決定するために投票してくれる数百万のユーザーを頼りにしているからです。少人数の編集者が決定したり、用語の出現頻度だけを基準に決定するのではなく、PageRank という画期的な技術を使用して各ウェブ ページにランクを付けています。PageRank は、そのページにリンクしているすべてのサイトを評価して数値を割り当てます。評価の際、それらのサイトにさらにリンクしているサイトも考慮に入れます。ウェブの構造全体を分析することで、Google は、どのサイトがそのコンテンツに興味を持つユーザーから最高の情報源として "投票" されたかを判断します。この方法では、新しいサイトが増えるたびに情報ポイント、しいては票数が増えるため、ウェブが拡大するにつれて効率が上がります。
”ページAからページBへのリンクをページAによるページBへの支持投票とみなし、Googleはこの投票数によりそのページの重要性を判断します。”ページランクの説明としてよく用いられる文章です。ここまでしか読んでないのか、SEOの著書の中にはどんなものでもいいからリンクをかき集めるのが高いページランクを得る王道などとかかれていたりします。では、リンクを集めたポータルサイトは高いページランクを得られるのでしょうか?答えはNOです。ヤフーなど一部のポータルサイトを除けば、個人作成のポータルサイトはページランクの平均が2程度、ページランクが3〜4のサイトは稀です。そういったサイトは大抵相互リンクを条件に登録する内容を登録者自身が打ち込み、問題がなければ自動的に所定のカテゴリーに分類されるだけのサイトです。こんなサイト意味あんのかな?というのが管理人の率直な感想ですが、そういったサイトを作るためのCGIなどがパッケージされているらしく数は増える一方です。
少し話がそれましたが続きを読むと”しかしGoogleは単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていくのです。”とあります。リンク数だけではなくリンクサイトの重要度、すなわちページランクの高いページからのリンクが自サイトの重要度=ページランクを押し上げるのに必要だということになります。リンク数とページランクの高いページからのリンク獲得という二つの項目は矛盾していないのですんなり頭に入るのですが、文章は更に続きます。”もちろん、重要度が高いページでも検索語句に関連がなければ意味がありません。”このフレーズが抜け落ちているように思える自称SEOに熱心なサイトが数多くあるような気がします。多少皮肉っぽくなりましたが、ページランクや関連性の高いリンクについて考えることで更に深く考えて見ましょう。
三番目の抜粋、一見関連性が薄いようですがあえてピックアップしました。グーグルではリンクに”支持投票”という表現を使っています。また理念の中で”ウェブでも民主主義は機能する。”と訴えています。民主主義の国アメリカらしい発想といえますが、ページランクの特徴を端的に表す言葉でもあります。つまり、ブッシュであれ安倍晋三であれ正当な民主主義の手続きを経て選らばれた者は(仮に)無能であったとしても権力者の地位にとどまることができるということです。これをページランクに置き換えれば、内容はともかくSEO的によろしくないサイトであるはずの2chがページランク6を獲得していたり、はたまたウェブ上ではあまり情報を公開していない有料SEO業者のページランクが多分ビジネス的なつながりのリンクを獲得することによって高いページランクを獲得しています。つまり、民主主義は良くできた制度だが万能ではない、これはページランクにも当てはまるということです。
”PageRank は、5 億の変数と 30 億以上の用語の等式を解決することでウェブ ページの重要度を客観的に測定します。”ページランクはランクの高いサイトからリンクされることによって得られるのは間違いがありませんが、それ以外にも多くの要素によって決定されているようです。これがグーグルの検索結果の精度の高さやページランクのブランドにつながっているように思えますが、上の文章を読む限り”あるサイトがどのようなテーマについて書かれたものなのか”をさまざまな基準で客観的に判断しているように思います。例えば当サイトグーグル観察日記ではグーグルとSEOがサイト全体のテーマとしてあり、中・小のテーマとしてグーグルガイドラインや検索エンジンスパム、ホームページ運営・管理を各章に分けて書いています。グーグルは各ページで扱われているテーマについて他のページとの関連性などを見ながら全体としてのテーマを判断しているように思われます。グーグル・SEO・検索エンジンスパムなどの間にどの程度の関連性があるかについても、やはりグーグルのクローラーが集めた80億というページの中から民主主義的な判断をするものと思われます。グーグル検索の特徴として、検索語に対してサイト全体がそのテーマについて扱っているページが検索結果として表示されますが、これもページランクテクノロジーの賜物といえます。
高いページランクを獲得する=上位の検索順位を獲得する、と解釈しがちですがこれに対しては考える余地があります。”重要なページには高いPageRank (ページ順位)が与えられ、検索結果内の順位も高くなります。PageRank はGoogleにおけるページの重要度を示す総合的な指標であり、各検索に影響されるものではありません。むしろ、PageRank は複雑なアルゴリズムにしたがったリンク構造の分析にもとづく、各Webページそのものの特性です。”、”検索結果内の順位も高くなる”といったすぐ後に”総合的な指標で各検索に影響を与えない”とありなんだか矛盾するような内容ですが、単にページランクが高いからといって何でもかんでも検索上位になるわけではない、ということだと思います。実際にグーグルやヤフーの米国法人のドメインはページランク10ですが、サイトに含まれる文字列全てが検索上位なわけはありません。グーグルが下したウェブページの総合的な指標、というのが適当な表現だと思います。ページランクの高いページは概ねレイアウト・内容量・独自性などの点において優れたサイトが多くページランクのブランドは十分通用しそうです。
”Googleについて”を読んだ感想ですが、ページランクとはグーグルの検索アルゴリズムが導き出したウェブページに対する総合的な評価であり、その中でも特にリンクが重視されています。ただし、単なるリンク数の多寡ではなく”重要度の高いページ”、即ちページランクの高いページからリンクを獲得することが重要で、しかも二つのサイトやリンクそのものに”関連性”が必要だともいっています。こういったことを考えると単にリンク集サイトでしこしこと登録申請に励んでもほとんど意味がないといえます。SEOを考える際に内部要因と外部要因のどちらを重視すべきかということがありますが、サイト自体の内容が薄いのにそれを放置したままリンクをかき集めるのはページランクの向上にはつながるとはいえません。内容の濃いサイトを作り、訪れた人が自然とリンクを貼りたくなるようなサイトを作ることが高いページランク獲得への道といえます。