今日は、「ソフト404ページ」の話題を。検索エンジンを困らせるぐらいで実害はほとんどないのですが、ウェブマスターとしては少し恥ずかしい、そんなサイトの不具合の話題です。
あなたのサイトでは、「ソフト404」の状態になっていませんか? サイトがソフト404を出す状態になっていると、検索エンジンに嫌われて、正しくページをクロールしてもらえなくなってしまうかもしれませんよ。
ソフト404とは、システムの不備で出る「おかしな状態」
ソフト404とは、少しわかりづらいのですが、Webページの表示に関するおかしな状態を表す用語です。どんな状態を指すのかというと、
・ブラウザで見ると「指定されたURLのページが見つかりません」といった、ページがないことを示す404(not found)が表示されている。
・でも、検索エンジンのロボットからみると、「見つかりません」と書かれたページがそのURLで正しく表示されたことになっている(404の状態になっていない)。
というもの。つまり、指定されたURLではページが作られておらず、ブラウザの画面上にもその旨正しく表示されるのですが、検索エンジンのロボットからはページが存在すると判断されるおかしな状態ですね。
原因はブラウザには表示されない「HTTPレスポンスコード」
もう少し詳しく説明しましょう。Webサーバーは、ブラウザやロボットからページの情報を求められると、2種類のデータを返します。
・1つはHTML、つまりブラウザに表示される部分。
・もう1つは、「HTTPヘッダー」と呼ばれる、ブラウザには表示されない部分。
HTTPヘッダーは、ブラウザやロボットがサーバーから情報を得るためのやりとりに関する情報が含まれるのですが、そこに「HTTPレスポンスコード」というものがあります。これは、要求されたページのURLに対して、サーバーが「あったよ」「なかったよ」「こっちを見てね」と伝える部分。
通常、ページがちゃんと表示されたときはHTTPレスポンスコードで「200(OK)」を返し、要求されたページが存在しなければHTTPレスポンスコードで「404(見つかりません)」を返します。
「ソフト404」とは、本来はHTTPレスポンスコードで404を返さなければいけないのに、サーバーが200を返している状態を指します。そうしたHTTPの仕組みを厳密に処理できていないECシステムやコンテンツ管理システムやCGIのせいで発生する現象です。
たとえるならば、自動販売機にお金を入れたら、ディスプレイに「品切れです」って表示されるけど、商品選択ボタンは光っていて押せる状態になっていて、でも押しても何も出ないみたいな、そんな「画面の状態表示と、システム的な状態と、実際の状態がちぐはぐ」な状態です。
次のページソフト404は実はあまり大きな問題にはならない
続きは会員限定です。無料の読者会員に登録すると続きをお読みいただけます。
- 会員登録 (無料)
- ログインはこちら
関連記事
2008.09.26
2010.04.20
安田 英久
株式会社インプレスビジネスメディア Web担当者Forum編集長
企業のウェブサイト活用やウェブマーケティングに関するメディア「Web担当者Forum」(http://web-tan.forum.impressrd.jp/)を運営しています。