重複コンテンツの基準とチェック方法(見つけ方)と重複を無くす対策

seo

更新日:

重複コンテンツとは、異なるURLで内容が被るコンテンツのことを指します。Googleの検索エンジンでは、コピーコンテンツを淘汰するため、重複コンテンツにはペナルティが課されます。

SEO対策を行う上で、時サイト内に重複コンテンツが発生しないよう対策を取られなければなりません。

 

この記事では、重複コンテンツによりSEO上、どのような影響を受けるのか、重複コンテンツの調査方法、重複コンテンツを無くすための対策方法を紹介します。

 

重複(コピー)コンテンツを判定する上で必要な基準

どのようなページが重複コンテンツと見なされるのかを、確認していきましょう。

 

URLが異なるが内容が重複している【定義】

冒頭でお伝えした通り、別々のURLで内容が重複しているコンテンツを、重複コンテンツと定義しております。

これは同じサイト内でもサイトが異なる場合でも同様です。

 

文章は異なるが内容が似ている【推測】

文章を変えれば重複コンテンツと見なされないという意見がありますが、内容が類似しているため重複コンテンツと見なされるケースはあると思います。

この点について明確な基準はないので一概には言えませんが、Googleは検索結果に似たコンテンツは二つも表示する必要ないと考えていると思います。

 

内容が似ているため検索順位が思うように伸びないケースを、しばしば見かけるからです。

 

キーワードは異なるが検索ニーズが似ている【自サイト内】

SEOは1キーワード、1ページと言われておりますが、厳密には1つの検索ニーズに対して1ページにすべきだと思います。

キーワードによっては検索ニーズが複数あることや、他のキーワードと検索ニーズが被ることがあるからです。

 

キーワードが違っていても検索ニーズが似ていると、どうしてもコンテンツが似通ってきます。

同じサイト内で、検索ニーズが似ているが異なるキーワードのコンテンツを別々に用意すると、重複コンテンツと近い見なされ方をすると思います。

 

重複(コピー)コンテンツが与えるSEO上の影響やペナルティとは?

では重複コンテンツがサイト内にあると、SEO的にどのような影響があるのでしょうか?

 

検索順位が下がる

まず似たようなコンテンツがあると、思うように検索順位が伸びなかったり、検索順位が下がったります。

 

サイト全体の検索順位が下がる

検索順位は他のページにも影響を与えます。一つのページの評価が下がると、サイト全体の評価も下がるため、重複コンテンツがあるとサイト全体の検索順位が落ちる可能性があります。

 

ペナルティによる順位下落、インデックス削除

Googleが明記している『品質に関するガイドライン(リンク)』に違反していると見なされた場合、ペナルティが課されます。

ペナルティが課されると検索順位が大幅に下落したり、検索結果からページが表示されなくなり、サイトへのアクセス数がほとんどなくなるといったリスクもあります。

ペナルティについて詳しくはこちら

 

評価が分散される

サイト内で似たようなコンテンツが複数あると、Googleからの評価が分散する可能性が高いです。本来、集中するはずだった評価が複数のページへ分散するので、結果、思うように検索順位が伸びません。

 

部分重複はSEO的に悪影響ある?

サイト運用を行なっていると、ページ単位では内容が異なるが部分的に内容が被ることや、他サイトからの引用により部分的に重複した内容を掲載せざるをえないこともあるでしょう。

 

評価が下がる可能性がある

部分重複については意見が分かれるところですが、部分重複が発生した分だけ、Googleからの評価が下がり、検索順位に悪い影響を及ぼす可能性があります。

 

簡易的にまとめ、別ページへリンクを貼るべき?

そのため、できれば簡易的にまとめた上で、その内容について詳しくまとめてあるページへ、リンクを貼るのが良いと思います。

 

言い回しは変えるべき

言い回しを変えるべきでしょう。しかし、ユーザーにとって利便性の高いページを提供するためには、ある程度の部分重複は仕方ないという意見もあります。

実際、ユーザーにとって別ページへ移動させられるよりも、そのページ内で内容を完結させてくれた方が親切でしょう。

 

意見が分かれるところですが、最低でも部分重複が発生する場合、言い回しは変えましょう。

 

重複コンテンツを無くすための対策

続いて重複コンテンツをサイト内から無くすために必要な対策を紹介します。

 

オリジナルの文章、コンテンツを心がける

事前知識のない状態で、コンテンツを作成するのは現実的ではありません。一般的には、本やインターネットなどで情報をインプットした上で、コンテンツを作成します。

その際、執筆に慣れていないとどうしても、参考サイトや文献と文体が似通ってきますが、なるべく自分だけの表現や言い回しを使うように心がけましょう。

 

特定のサイト、文献だけに情報収集を絞らない

また特定のサイトや文献だけを参考にしていると、どうしても内容が似通ってくるので、意見の異なる複数のサイトや文献を参考にしましょう。

リサーチすればするほど、オリジナルなアイデアが思い浮かぶようになります。

 

SEOライティングのコツについて詳しくはこちら

 

コンテンツマップを作成する

自サイトから重複コンテンツを無くすためには、コンテンツマップを作成すると良いでしょう。

コンテンツマップは、サイト内のページの階層状態を示すためのものなので、コンテンツの過不足がわかりやすくなるからです。

コンテンツマップ(ディレクトリ構造)の作成方法について詳しくはこちら

 

文字数の少ないページ、内容が被るページはno indexに設定する

情報量が少ないページは、検索エンジンへインデックスさせないために、no index属性を指定しましょう。

ヘッダーやフッター、サイドバーは全ページ共通しているので、オリジナルの情報が少ない上に、重複箇所が多いと見なされる可能性があるからです。

 

RSSでは全文、配信しない

RSS配信を行う際、コンテンツ内の全文章を配信すべきではありません。他サイト内で全く同一のコンテンツがあると、見なされる可能性があるからです。

そのため、配信するコンテンツは部分的に限定しましょう。

 

法令、引用文など定型文は言い回しを変える

法令や引用文のように定型文を用いる場合、そのまま記述するサイトが多いです。引用タグが付与されていれば、検索エンジンに引用していることを伝えることはできます。

しかし、検索順位へ影響があるといった意見もあるので、定型文を用いる際は、極力言い回しを変えるのが無難でしょう。

 

重複コンテンツやGoogleのペナルティのチェック(確認)に使えるツール

このように対策を行っていても、重複コンテンツが発生しないと言い切ることはできません。

重複コンテンツが発生してもすぐ検索順位が落ちるわけではないので、定期的に自サイト内に重複コンテンツがないかチェックすべきです。

以下で重複コンテンツの調査に使えるツールを紹介します。

 

旧サーチコンソール※『HTMLの改善について』は廃止

旧来のサーチコンソールであれば、『HTMLの改善』から、タイトルタグ、ディスクリプションタグの重複などの問題を確認できましたが、リニューアル後のサーチコンソールでは利用できなくなりました。

2019年3月後半から、旧サーチコンソールの機能は全て使えなくなりました。

 

※新サーチコンソールでは、担当者が手動でガイドライン違反を確認し、課されたペナルティについては確認可能です。▷ペナルティについて詳しくはこちら

 

sujiko

重複しているかもしれないURLが二つわかっている場合、『sujiko』を使うと両ページの重複度合いを定量化することができます。重複度合いが低いと判断された場合でも、Googleが重複コンテンツと見なさないとは限らないので、あくまで目安としてお考えください。

 

Google検索①

検索結果に狙ったキーワードで思うように表示されない場合、ペナルティは課されるレベルではなくても、内容が似通っている(または重複コンテンツ)と見なされている可能性があります。

同じキーワードでも検索ニーズは分散するので、幅広い内容のコンテンツを検索結果に表示させるために、似た情報は表示させたくないからです。

 

この場合、対象のキーワードの検索結果のURLの末尾に「&filter=0」を入力しましょう。意図的に検索結果に表示されなかったページが表示されます。

 

Google検索②

また骨は折れる作業ですが、自サイト内の文章を30文字ずつ検索すると文章そのものの重複を確認できます。

 

シチュエーション別!重複コンテンツへの対処法

最後にシチュエーション別に、重複コンテンツへの対処法を紹介します。

 

URLの表記が統一されていない

まずURLの表記が統一されていないと重複コンテンツと見なされる可能性があります。

GoogleはURLに紐付けてページの評価をするので、複製されていないコンテンツでも、URLが複数あると別々に評価するからです。

 

【表記が統一されていない例】

wwwの有無

『http:www.ドメイン名』、『http:〜ドメイン名』など

index拡張子※トップページのソースコードを記載する際に用いられます。

『http:ドメイン名』、『http:ドメイン名.index.html』、『http:ドメイン名.index.php』など

URLの統一、正規化の方法について詳しくはこちら

 

URLの表記を統一されるためには、統一先のURLへリダイレクト(※特定のURLから別のURLへ自動移動させる行為)させましょう。

 

 

デバイスごとにURLが異なる

スマートフォンやPC、ipadなどデバイスによってアスペクト比(縦横比)は異なるので、中にはデバイスごとにURLを変えているサイトもあります。

【例】

  • PC版:『http:ドメイン名』
  • スマートフォン版:『http:ドメイン名/sp/』

 

対処法①:alternateタグの設定

当然、重複コンテンツと見なされる可能性があるので、デバイスごとにURLが異なる場合、検索エンジンへそのことを理解させる必要があります。PCページの要素内で、スマホページのURLへのalternateタグ(※1)を設定する

 

スマホページの要素内で、PCページのURLへcanonicalタグ(※2)を設定する

【注釈】

※1 alternateタグ:代替用のページURLがあることを伝えるためのタグ

※2 canonicalタグ:似たコンテンツの異なるURLにおいて、評価の分散を避けるため正規のURLを伝えるタグ

設置方法について詳しくはリンク先を確認してください。

 

レシポンシプルデザインも検討しよう

またGoogleはモバイルファーストのサイトを評価するため、レシポンシブルデザインが推奨されております。そのため、同一のURLでも問題ないようレシポンシブルデザインに対応することをオススメします。

 

カテゴリページと内容が被るページがある

1語のキーワード(ビックキーワード)で狙ったページと、カテゴリ(一覧)ページの検索ニーズは被ることはよくあります。

評価が分散する可能性があるので、どちらかのページにリダイレクトかけると良いでしょう。

 

もしサイトの構造上、両ページが必要な場合は、検索順位が低い方のページの要素内にno indexタグ(※)を設定するか、または主となるページへのcanonicalタグを設定するのが良いと思います。

no indexタグ:インデックスさせない(検索結果に表示させない)ためのメタタグ

 

パラメータが自動生成された※ECサイトやポータルブルサイト向け

AmazonのようなECサイトでは、パラメータURLが多数、自動生成されます。パラメータURLとはURLに付与される変数を指す言葉です。

【例】「http:ドメイン.com/商品」→「http:ドメイン.com/商品?=」

 

ECサイトでは同じ商品の検索ページでも、金額、色、サイズなどで並び替えることができ、そのパターン分だけパラメータURLが存在します。

パラメータURLも別々のURLと判断され、重複コンテンツと見なされる可能性が高いので、パラメータが付いていないURL(「http:ドメイン.com/商品」)に向けcanonicalタグを設定しましょう。

 

【参考記事】パラメータURLの対処法について詳しくはこちら

 

他のサイトにコンテンツを提供している

中には他サイトへコンテンツを提供しているサイトもあるでしょう。当然、URLは異なるので、重複コンテンツと見なされるので、提供先のページへ元のURLへのcanonicalタグを設置してもらうか、掲載箇所を部分的に限定してもらうのが望ましいです。

 

しかし応じるかどうかは相手次第なので、もし応じてもらえない場合は、コンテンツそのものを書き換えることをお勧めします。

 

他サイトから盗用された

もし他サイトから自サイトのコンテンツをコピーされた場合、ウェブマスターツールを介して検索結果から削除してもらうよう申請しましょう。手続きについては、『著作権侵害による削除|search console』を参考にしてください。

 

Googleからペナルティを課されたかもしれない

万が一ペナルティを課されたかもしれない場合は、まずペナルティを課されたかどうか確認した上で、課された原因を追求し、ペナルティを解除してもらうよう申請する必要があります。

この点について詳しくは以下のリンクを参考にしてください。

Googleのペナルティを確認する方法と課された場合の対処法はこちら

吉池悠理

青山学院大学、理工学部、物理数理学科卒業。 2016年〜SEO対策を中心としたWEBマーケティング会社で働き、並行して知人の会社の求人サイトの運営、Officeツール、プログラミングのセミナー講師、教育資料の作成などを行っている。

-seo

Copyright© WebCome , 2020 All Rights Reserved Powered by AFFINGER5.