クローラーの巡回とキャッシュ

SEO対策を行う上で無視できないのが、ページタイトルにもある「キャッシュ」です。このページでは、ロボット型検索エンジン用の対策として知っておくと便利な「キャッシュ」についてご紹介します。ここで言うキャッシュとは日本語訳にして「現金」となるキャッシュのことではなく、ロボット型検索エンジンの記録に残るデータの事を指します。注意しておきたいのは、このキャッシュ(記録)はサイト運営者が任意に残することができるようなものではなくということ。検索エンジンには「スパイダー」と呼ばれる検索エンジンのロボットがインターネット上にある(検索エンジンに登録されている)サイトの中を自動で巡回して情報を収集する機能があり、この収集したデータを元に検索エンジンでのサーチ結果(表示順位)を決めています。表示順位を高くするためには被リンクという、どれくらい関係のあるサイトと効果が高いリンクがされているかどうかを検知し、この効果の高いリンクの数が多ければ自然とデータがスパイダーにキャッシュ(記録)されることになります。しかしホームページのソースコード(HTMLソース)にSEO対策を施す前に、まず対策を施していない時点でどのくらいの順位にあるかどうかを知っておく必要があります。

キャッシュ対策を施す

検索上位にランクインさせるためにはキャッシュが重要ということを前項で述べましたが、ここで言うキャッシュとその対策には「フレッシュスクロール」への対策も含めているということも知っておきましょう。また一つ聞き慣れない単語が出てきたと思う方も多いと思いますが、このフレッシュスクロールとは、サイトを巡回するロボット(クローラー)がサイトに定期的に訪れている状態の事を指しています。フレッシュスクロールの理解を深めると、ホームページを構成しているHTMLソースにSEO対策を施す際にどのように順位が変動するのかという点を把握するのに役立ちます。キャッシュ対策を施す前に、まず自分が作ったサイトがどのくらいの順位になっているかという確認方法についてご紹介しましょう。 順位を確認する方法としてオススメなのが「検索エンジン順位チェックツール」。このツールは設定した数個のキーワードを同時に調べることができる上、検索頻度や回数・順位について正確に把握することができるスグレモノです。さて、フレッシュスクロール対策についてですが、この対策は毎日ある決められた時間までに自分のホームページのindexページ(TOPページ)を更新するだけでOKです。検索エンジンの行動ルーチンには、毎日更新されているホームページをそのまま毎日更新しているサイトだと認識し、そのお陰でクローラーが何度も更新サイトに情報収集のため訪れるようになります。頻繁といっても1時間に何十回も訪れるということではなく、ペースとしては1日に1〜2回程度です。クローラーに「サイトが更新」されていると認識させるためには2つほど条件があり、一つ目は「サイトが20〜24時間以内に更新されたかどうか」という点です。 検索エンジンは一日を超えて更新すると「毎日更新されていない」と判断するので、次に巡回されるまでに多少の時間が必要になります。 もう一つの条件は「更新時に追加した情報」です。クローラーが更新と認識する情報量はどれくらいかと言うと、残念ながら正確な数字までは把握できていませんが、おおよそ20〜30文字程度は必要となるようです。だいたい2〜3週間程度、更新日時と更新内容に気をつけながらコツコツとキャッシュ対策を続けることである程度上位のランクインが期待できます。