インデックスとは、Webページのデータを検索エンジンのデータベースに登録されて検索されるようになることです。
検索エンジンはクローラーと呼ばれるプログラムによって世界中のWebページを巡回(クロール)して情報を収集しています。収集された情報は「何についてのページか」「どんなキーワードを含んでいるか」「どこからリンクされてどこへリンクしているか」といった様々な基準で分析され、データベースに取り込まれます。
この分析してデータベースに取り込むまでの一連の処理を「インデックス」といいます。同様の意味で「インデックス化」、「インデックスする」ともいいます。
検索結果に表示されるホームページは、インデックスのデータから引き出されています。そのため、インデックスされていないページは検索結果に載ることがありません。
公開されて間もないページは、クローラーがまだページを見つけられないためインデックスされず、検索結果に表示されない場合があります。他にも、サイト内外からのリンクが少ないページは、リンクを辿ってWebページを巡回するクローラーには見つけてもらいにくく、インデックスされにくいことがあります。
インデックスをされているか確認する方法
個別のURLに対してインデックスされているか調べる方法には、検索エンジンを用いる方法があります。「info:◯◯」(◯◯はページのURL)と入力して、検索エンジンで検索します。インデックスされていれば検索結果に該当ページが表示され、インデックスされていなければ「URLに関する情報は見つかりませんでした。」と表示されます。
より正確にインデックスされているページ数を調べたい、また、インデックスされていないページとその原因を知りたい時は、Googleサーチコンソールというツールを使えば解決できます。
インデックスを促すための方法(サイトマップ)(RSSフィード)(サーチコンソールでリクエスト)
インデックスを促すための方法として、XMLサイトマップの作成・送信する方法があります。
XMLサイトマップはサイト内の全てのページをリスト化したものです。XMLサイトマップをGoogleサーチコンソールに送信することで、クローラーにインデックスして欲しいページを効率よくクロールしてもらうことができます。
他にも、Google Search ConsoleでGoogleにページをインデックスしてもらえるよう直接リクエストする方法があります。リクエストすればすぐにページをクロールしてもらえるというメリットがありますが、大規模なサイトでは、1つ1つのページについてリクエストしなくてはいけないので、手間がかかってしまう場合もあります。
検索エンジンとは
検索エンジンとは、インターネット上にある様々な情報を、キーワードなどで検索するためのシステムをいいます。検索エンジンは、クローラーが収集したインターネット上の情報をインデックスし、検索されたキーワードを元に、インデックスした情報を適切な順に並べて表示します。
代表的なものとして、GoogleやYahoo!などがあります。
クローラーとは
クローラーとは、世界中のインターネット上に存在するWebサイトや画像などの様々な情報を収集し、インデックスするためのプログラムです。Web上を這う(クロールする)ことから、クローラーと呼ばれます。
一般に、クローラーはすでにデータベース内にあるWebページから、リンクを辿って他のWebページを巡回します。そのため、サイト内外にリンクが少ないページはクローラーに認識されにくく、インデックスされにくいことがあります。
「インデックス / INDEX」を調べた人はこの用語も調べています
「新しく公開したページがインデックスされているか確認する」
公開したばかりのページは、クローラーに見つけてもらいにくくインデックスされていないことがあります。インデックスされていない場合は、Google Search Consoleを用いて直接インデックスをリクエストすることができます。
「クローラーにインデックスを拒否される」
ページがGoogleガイドライン違反などによるペナルティを受けている場合、クローラーがインデックスを拒否される場合があります。インデックスされない原因を詳しく知りたい場合は、Google Search Consoleで確認できます。
「サイトのインデックス数を増やす」
サイトのインデックス数とは、サイト内で公開されているページの内インデックスされているページの数を指します。SEO対策のために、インデックス数を増やすこともありますが、インデックス数だけでなく、ページの質を高める頃ことやクロールしやすいサイト構造にすることも重要です。
「インデックスされないようにする」
編集中のページなど、検索結果に表示させたくないページをインデックスされないようにすることがあります。noindexというmeteタグを用いて、クローラーにインデックスしないように指示することができます。
インデックスの詳細情報をGoogle Search Consoleで確認できる
Google Search Consoleは、サイトをGoogleがどう評価しているのか確認することができる、無料のプラットフォームです。Google Search Consoleでは、登録したサイトのインデックス状況を簡単に確認することができます。
例えば、登録したサイトがインデックスされているかどうか、また、インデックスされていないのであればその原因などがわかります。他にも、インデックスの登録を直接リクエストすることもでき、公開したばかりのページをインデックスしてもらうことが可能です。
インデックスのSEO上の効果
検索順位には、Webサイト内のインデックス数だけでなく、インデックス時の検索エンジンの評価が関わります。
現在、検索エンジンには、内容の薄いページ、専門性の高いページを見分ることができるアルゴリズムが備わっており、いくらインデックス数が多くても質の悪いページが多いと、検索エンジンからの評価が下がり検索順位も落ちてしまします。
また、大規模なサイトで、構造が複雑であると、クローラーに正しく認識されてもらえず適切にインデックスしてもらえない場合があります。
SEO上で効果を上げるには、ユーザーのためのサイトであること、クローラーが巡回しやすいサイトであることが重要です。
この記事がお役に立ちましたら、"いいね!"をお願いします
minweb辞書のIT用語をお届けします