重複コンテンツとは?SEOのペナルティ有無やチェック方法、対策を総まとめ
SEOにおいて、サイト評価が下がる可能性のある重複コンテンツ。どのような場合に重複だと判断され、その結果どのような影響があるのでしょうか?
本記事では、検索エンジンから重複コンテンツだと判断される基準や重複コンテンツがサイトに与える影響、重複を解消する方法を紹介します。Webサイトの運営期間が長いほど重複コンテンツの発生確率は高まるため、「知らずのうちにペナルティを受けて順位が下がってしまった」とならないよう、ぜひお読みください。
新任担当者がSEOの落とし穴にハマらないために
これからSEOに取り組む新任担当者向けにSEOの基礎知識をまとめました。本資料では、やってはいけないNG施策、マーケティングから見たSEOなどを解説しています。後半ではSEO業務におけるChatGPTの活用法もご紹介しているので、興味のある方はお気軽にお申し込みください。
「ナイルのSEO相談室」は業界歴15年超のナイルが運営しているメディアです。SEOの最新情報を随時発信しているので、ぜひブックマークしてください!
またSEOにお悩みの方は無料相談やSEOコンサルティングサービスのご利用もぜひご検討ください!
目次
重複コンテンツとは
重複コンテンツとは「異なるURLのページでありながら、内容が完全もしくはほぼ同じコンテンツ」のことです。同じサイト内の異なるページ間で発生する場合と、自サイトと他サイトの間で発生する場合があります。
自サイトと他サイト間での重複コンテンツは「コピーコンテンツ」とも呼ばれ、SEO(検索エンジン最適化)において検索エンジンからのペナルティを受け検索結果に表示されなくなる可能性があります。
重複コンテンツが発生するケース
重複コンテンツが発生するケースとして、主に5つの状況が考えられます。
- URLの表記に一貫性がなく、同じ内容のページが複数ある
- 動的URLが複数生成され、同一ページに複数のURLがある
- 同じページをPC版とモバイル版と別々のURLで公開している
- 自サイト内のコンテンツを他サイトに寄稿している
- 自サイトのオリジナルコンテンツが他サイトに盗用されている
自サイト内での重複コンテンツとしてよくあるケースが、同じコンテンツに対して複数のURLが存在していることです。例えば「wwwの有無」や「セッションIDやトラッキングパラメータなどの有無」です。加えて、PC版とモバイル版で別々のURLを設定している場合も、重複コンテンツであると判断されかねません。
自サイトと他サイト間では、寄稿コンテンツがある場合に重複コンテンツが発生しがちです。自サイトがオリジナルであるにもかかわらず、寄稿先のページがオリジナルだと判断されることもあります。
また、他サイトにコンテンツが盗用された場合も、他サイトがオリジナルであると判断され、自サイトのオリジナルコンテンツの検索順位が下がる可能性があります。
重複コンテンツとみなされる基準
重複コンテンツとみなされる基準には、主に2つのポイントがあります。
1つ目は、複数のURLから内容が完全に一致するコンテンツへアクセスできる場合です。検索エンジンはURLをもとにコンテンツを評価しているため、URLが異なれば別のページだと判断します。その結果、同一コンテンツでもURLが複数あると、同じ内容のコンテンツが重複していると評価します。
2つ目は、特定のキーワードにおいて上位表示の記事が頻繁に交差するケースです。
上記の場合は検索エンジンがどちらの記事を上げるか迷っている状態だと考えられ、重複コンテンツとしてお互いの評価を下げている「キーワードカニバリゼーション」が起こっています。特に20〜30位などもう少しで上位表示できそうな記事などで発生していると、流入数を取りこぼす原因となるので注意しましょう。
情報がどの程度類似していると重複コンテンツだと判断されるか、基準は明記されていません。そのため、重複コンテンツであるかどうかは「重複コンテンツの確認方法」で紹介する方法で確認する必要があります。
ナイルでは重複コンテンツに関する無料相談を受け付けていますので、「重複コンテンツを特定できない」「重複しているかがわからない」という方は下記よりご相談ください。
重複コンテンツが起こす悪影響
SEOにおいて、重複コンテンツは以下のような悪影響を及ぼす恐れがあります。
重複コンテンツが起こす悪影響
悪影響1 Googleペナルティの可能性
Googleガイドラインに抵触するとペナルティの対象となり、SEOでのサイト評価を下げる原因となります。
重複コンテンツとしてペナルティを受けるケースは、Google 検索セントラル ブログ(旧称 Google ウェブマスター)に明記されています。要点をまとめると以下のとおりです。
- 他サイトのコンテンツを引用元を記載せずにそのままコピーしている
- 他サイトのコンテンツを少しだけ変更して転載している
- 独自の要素がないまま他サイトのコンテンツ フィードをそのまま掲載している
- 他サイトの画像や動画などを埋め込んだり編集しているだけ
わかりやすくいうと、他サイトのコンテンツをあたかも自サイトオリジナルかのように無断で転載すると、ペナルティ対象になるということです。
Googleからのペナルティを受けると、検索順位が下がるだけではなく、検索結果に表示されなくなる恐れがあります。また、ペナルティを受けていないページの順位も下がり、サイト全体での自然流入が減ることにつながりかねません。
重複コンテンツによるペナルティを避けるためには、他サイトの文章や画像を流用せず、独自のコンテンツを作成することが重要です。加えて、他サイトから情報を転載する際は引用元のリンクを記載し、重複ではないことを検索エンジンに伝えるようにしましょう。
悪影響2 被リンク評価の分散
重複コンテンツによる悪影響の1つに、被リンク評価の分散が挙げられます。
同じ内容のページが複数のURLで存在してしまうと、本来ならば1つのURLに集まるはずだった被リンクがそれぞれ分散してしまうことがあります。
例えば、同じ内容のページが3つのURLで存在している場合、本来ならば100の評価を得ることができるはずが、それぞれのURLで50、30、20と分散してしまうことがあります。
Googleが適切に処理してくれる場合もありますが、もし適切に処理できなかった場合、本来得られるべき評価を失うことになりかねません。
悪影響3 クロール効率の低下
重複コンテンツすべてがインデックスされることはありません。多くの場合は内部リンクや外部リンクが多く集まっている、またはSNSで広く共有されているURLが正規URLとしてインデックスされます。
その際に重複と判断されたURLはインデックスされず、Google Search Consoleのインデックスカバレッジ上で「除外」と判断されます。
特にデータベース型のサイトで重複コンテンツは避けられないものですが、1つのコンテンツに対して10個の重複がある場合など、管理不可能な状況にあるといえます。このような状況に陥らないためにも、重複コンテンツの発生を最小限に抑える努力は必要です。
また、重複コンテンツへのクロールが増えると、本来インデックスされるべきページのクロールが不十分になることがあります。目安としてサイトのページ数が1万ページを超えたら、このようなクロールの影響に注意してください。
重複コンテンツへの対策方法
重複コンテンツの発生とそれに伴うSEO評価の低下を防止する対策を紹介します。
重複コンテンツへの対策方法
対策1 URLの表記ルールを定める
重複コンテンツの発生を防ぐために重要なのが、URLの表記ルールを定めることです。表記ルールを定めておくことで、異なるURLから同一コンテンツにアクセスされる状況を防げます。
具体的には、Webサイト全体で「www」の有無やURLの末尾などを統一しましょう。
URLの表記ルールは一度決めれば長期的に効果のある対策なので、できる限り早めに対応しておくことをおすすめします。
対策2 301リダイレクトの使用
301リダイレクトは、WebページのURLを変更した際に、旧URLから新URLへユーザーを自動的に転送するために用いられます。例えば、サイトの移転やドメインの変更など、既存コンテンツのURLが変わるときに使うことが多いです。
301リダイレクトを設定することで、旧URLと新URLが重複ではないことを検索エンジンに伝えられます。加えて、旧URLのSEO評価を新URLに引き継げることもメリットです。
正しく設定することで、重複を避けてWebサイトのSEO評価を保ちつつ、古いURLに訪れたユーザーを新しいURLへ自動で遷移させられます。
対策3 canonicalの使用
canonicalとは、WebページのHTML内に設定することで検索エンジンに対して「このページがオリジナルであり、検索結果ではこのページを優先して表示してほしいこと」を伝えるためのタグです。似たような内容のコンテンツが複数ある場合に、代表ページにcanonicalタグを使うことでSEO評価をタグをつけたコンテンツに集められます。
canonicalタグは、内容が似ているが完全には一致していないページが存在する場合に活用しましょう。例えば、色やサイズ違いによって製品ページが多数存在する場合です。
また、アナリティクスの計測用パラメータによって重複コンテンツとみなされることがある場合にも、canonicalタグの使用をおすすめします。
canonicalタグについては下記の記事で解説しているため、併せてご覧ください。
対策4 noindexの使用
noindexタグを使うことで、特定のページを検索エンジンのインデックス対象から除外でき重複を防げます。
インデックスとは、検索エンジンがページを評価するためのデータベースに登録することです。検索エンジンは、インデックスしたページを評価して検索順位を決めています。
内容が似ているコンテンツの片方にnoindexタグを使うことで、noindexタグを使ったコンテンツが検索エンジンから評価されなくなり、重複コンテンツとしてペナルティを受けることを避けられます。
設定の方法は下記の記事で具体的に解説していますのでご参照ください。
対策5 URLパラメータの設定
canonicalによる正規化を行うか、難しい場合にはサーチコンソールで「URLパラメータ」の設定を行います。
サーチコンソールを用いることで、Googleに対してURLパラメータがコンテンツにどのように影響するか、またどのパラメータを含むURLをクロール対象とするかを設定できます。
これにより、重複するURLのクロールを最小限に抑えることができます。例えば、パラメータの違いによって同一コンテンツが存在する場合、正規化のため「URLパラメータ」設定を活用します。
URLパラメータは理解できる範囲内で適切に設定することが望ましいですが、パラメータの作用が不明な場合は、リスクがあるため使用を避けましょう。
対策6 アノテーションの設定
アノテーションの設定とは、スマートフォンやPCといった異なるデバイス向けに別々のページを用意していることを検索エンジンに知らせることです。
具体的には下記の措置を取ります。
- PC向けのページで、スマートフォン向けのURLに対して、「link rel=“alternate”」を記述する
- スマートフォン向けのページで、PC向けのURLに対して、「link rel=“canonical”」を記述する
設定することで重複コンテンツを避けられる上、スマートフォンで検索した際にはスマートフォン向けのページが、PCで検索した際にはPC向けのページが正しく表示されるようになります。
詳しくは下記の記事で紹介していますので、スマートフォンとPCでそれぞれURLを分けている方はご参照ください。
対策7 重複コンテンツの非公開化
自サイト内に重複しているコンテンツがある際は、どちらかのコンテンツを非公開にすることもひとつの方法です。非公開にすることでユーザーや検索エンジンは閲覧できなくなり、削除した場合と同様の効果を得られます。
削除と非公開の違いは、管理者がアクセスできるかどうかです。削除した場合は管理者もアクセスできなくなります。
一方で、非公開なら管理者は引き続きアクセスできるため、将来的にコンテンツを再利用したい場合に内容を修正して再び公開できます。非公開にしておくことには特筆したデメリットがないため、削除ではなく非公開化しておくことがおすすめです。
対策8 削除要請
外部サイトによって自サイトのコンテンツが無断転載された場合、まずは無断転載しているサイトの運営者に対しコンテンツの削除を依頼します。
もし依頼に応じてもらえない場合は、Googleにコンテンツの削除要請を行いましょう。Googleの申請フォームにて「どのコンテンツが無断で使用されているか」や「その証拠」などを送り、Googleが著作権を侵害していると判断すれば、重複コンテンツが解消されます。
また、寄稿先のサイトが重複コンテンツとなっている場合は、該当コンテンツにcanonicalやnoindexの設定を依頼してみてください。
重複コンテンツへの対策は、どのような経緯で重複したかによって対応が変わります。適切な対策がわからない場合は、ぜひナイルへご相談ください。
重複コンテンツの確認方法
自サイト内に重複コンテンツがあるのか、そしてどのコンテンツが重複だと判断されているかは、下記の方法で確認できます。
重複コンテンツの確認方法
確認方法1 Google Search Consoleを使う
Google Search Consoleを使うことで、自サイトに重複コンテンツがあるかや、その重複コンテンツがペナルティの対象かどうかを確認できます。
ペナルティの対象となっている重複コンテンツの有無を確認するためには、「セキュリティと手動による対策」から「手動による対策」をクリックしましょう。
ペナルティの対象となっている重複コンテンツがある場合は該当ページが表示され、なければ下記画像のように「問題は検出されませんでした」と表示されます。
ペナルティの対象となっていない重複コンテンツの有無を確認するためには、「インデックス作成」から「ページ」を確認します。
重複コンテンツがある場合は「重複しています。ユーザーにより、正規ページとして選択されていません」と表示され、クリックすると重複しているページのURLを確認できます。
確認方法2 重複コンテンツチェックツールを使う
重複コンテンツをチェックできる無料のツールもあります。
例えばsujiko.jpは、重複しているであろう2つのコンテンツのURLを入力することで、双方のコンテンツの内容がどの程度重複しているかを分析できるツールです。本文の類似度や検索エンジンからペナルティを受ける可能性がわかります。
一方で、CopyContentDetectorは、新たにコンテンツを作成する際、執筆した文章が他サイトと類似していないかを調べられるツールです。
上記画像のように一致している割合が多い場合、他サイトの文章と被っているため、文章表現を変更して重複を避ける必要があります。
確認方法3 検索順位チェックツールを使う
GRCやRankTrackerなどの検索順位チェックツールを活用することで、重複コンテンツの目星をつけられます。
重複コンテンツを特定したい場合は、特定のキーワードを検索順位チェックツールに登録し、そのキーワードで上位に表示されているページを追跡しましょう。もし、同じキーワードで複数のページが上位に表示されたり順位が下がったりする場合は、それらのページが重複コンテンツである可能性が高いです。
ただし、検索順位の変動だけでは重複していると判断できません。検索順位チェックツールの使用は、あくまでも重複コンテンツだと思われるページを特定するための方法です。目星をつけたら、次に紹介する「確認方法4 パラメータを付けて検索する」などの方法で、検索エンジンに重複コンテンツだと認識されているかを確認しましょう。
確認方法4 パラメータを付けて検索する
Googleでは、URLの末尾に「&filter=0」というパラメータをつけて検索することで、重複コンテンツを確認できます。
具体的な手順は下記のとおりです。
- 重複コンテンツがあると思われるキーワードで検索する
- 検索結果ページのURLの末尾に「&filter=0」をつけて再度検索する
最初の検索結果には表示されていないページが2回目の検索で表示された場合、そのページが重複していると考えられます。
重複コンテンツを無くしSEOの効果を最大化させよう
重複コンテンツはGoogleからペナルティを受ける可能性があるため、早急に対策する必要があります。放置していると、重複しているコンテンツだけではなく、サイト全体の評価が下がりかねません。
まずは重複コンテンツの有無を確認しましょう。もし重複コンテンツがある場合は、「301リダイレクトやcanonicalタグを使用する」「自サイトのコンテンツを無断転載している(丸パクリ・コピペしている)サイトへ削除を依頼する」など、重複解消のために施策を進めてください。
なお、SEOでのサイト評価を下げる要因は、重複コンテンツだけではありません。ナイルでは「SEO対策においてやってはいけない6のNG施策」を無料ダウンロードできる資料にまとめていますので、ご参照ください。
新任担当者がSEOの落とし穴にハマらないために
これからSEOに取り組む新任担当者向けにSEOの基礎知識をまとめました。本資料では、やってはいけないNG施策、マーケティングから見たSEOなどを解説しています。後半ではSEO業務におけるChatGPTの活用法もご紹介しているので、興味のある方はお気軽にお申し込みください。