ソフト404ページはウェブマスターとして微妙に恥ずかしい

2011.02.28

IT・WEB

ソフト404ページはウェブマスターとして微妙に恥ずかしい

安田 英久
株式会社インプレスビジネスメディア Web担当者Forum編集長

今日は、「ソフト404ページ」の話題を。検索エンジンを困らせるぐらいで実害はほとんどないのですが、ウェブマスターとしては少し恥ずかしい、そんなサイトの不具合の話題です。

あなたのサイトでは、「ソフト404」の状態になっていませんか? サイトがソフト404を出す状態になっていると、検索エンジンに嫌われて、正しくページをクロールしてもらえなくなってしまうかもしれませんよ。

ソフト404とは、システムの不備で出る「おかしな状態」

ソフト404とは、少しわかりづらいのですが、Webページの表示に関するおかしな状態を表す用語です。どんな状態を指すのかというと、

 ・ブラウザで見ると「指定されたURLのページが見つかりません」といった、ページがないことを示す404(not found)が表示されている。

 ・でも、検索エンジンのロボットからみると、「見つかりません」と書かれたページがそのURLで正しく表示されたことになっている(404の状態になっていない)。

というもの。つまり、指定されたURLではページが作られておらず、ブラウザの画面上にもその旨正しく表示されるのですが、検索エンジンのロボットからはページが存在すると判断されるおかしな状態ですね。

原因はブラウザには表示されない「HTTPレスポンスコード」

もう少し詳しく説明しましょう。Webサーバーは、ブラウザやロボットからページの情報を求められると、2種類のデータを返します。

 ・1つはHTML、つまりブラウザに表示される部分。
 ・もう1つは、「HTTPヘッダー」と呼ばれる、ブラウザには表示されない部分。

HTTPヘッダーは、ブラウザやロボットがサーバーから情報を得るためのやりとりに関する情報が含まれるのですが、そこに「HTTPレスポンスコード」というものがあります。これは、要求されたページのURLに対して、サーバーが「あったよ」「なかったよ」「こっちを見てね」と伝える部分。

通常、ページがちゃんと表示されたときはHTTPレスポンスコードで「200(OK)」を返し、要求されたページが存在しなければHTTPレスポンスコードで「404(見つかりません)」を返します。

「ソフト404」とは、本来はHTTPレスポンスコードで404を返さなければいけないのに、サーバーが200を返している状態を指します。そうしたHTTPの仕組みを厳密に処理できていないECシステムやコンテンツ管理システムやCGIのせいで発生する現象です。

たとえるならば、自動販売機にお金を入れたら、ディスプレイに「品切れです」って表示されるけど、商品選択ボタンは光っていて押せる状態になっていて、でも押しても何も出ないみたいな、そんな「画面の状態表示と、システム的な状態と、実際の状態がちぐはぐ」な状態です。

次のページソフト404は実はあまり大きな問題にはならない

続きは会員限定です。無料の読者会員に登録すると続きをお読みいただけます。

Ads by Google

この記事が気に入ったらいいね!しよう
INSIGHT NOW!の最新記事をお届けします

安田 英久

安田 英久

株式会社インプレスビジネスメディア Web担当者Forum編集長

企業のウェブサイト活用やウェブマーケティングに関するメディア「Web担当者Forum」(http://web-tan.forum.impressrd.jp/)を運営しています。

フォロー フォローして安田 英久の新着記事を受け取る

一歩先を行く最新ビジネス記事を受け取る

ログイン

この機能をご利用いただくにはログインが必要です。

ご登録いただいたメールアドレス、パスワードを入力してログインしてください。

パスワードをお忘れの方

フェイスブックのアカウントでもログインできます。

INSIGHT NOW!のご利用規約プライバシーポリシーーが適用されます。
INSIGHT NOW!が無断でタイムラインに投稿することはありません。