重複したコンテンツ:なぜそれが起こるのか、それを修正する方法

コンテンツの頭@Ahrefs(または、平易な英語では、私たちが公開するすべてのブログ記事が叙事詩であることを保証する責任を負う人です)。
重複したコンテンツが何であるか、それがあなたのSEOを傷つける可能性があるかを学ぶために探していますか?

重複したコンテンツは、多くのサイト所有者にとって絶え間ない不安の原因です。

それについてのほとんど何でも読めば、あなたの場所が重複した内容問題の刻々と過ぎている時限爆弾であることを信じることを離れて来る。 Googleのペナルティは、単に数日離れています。ありがたいことに、これは真実ではありません—しかし、重複したコンテンツはまだSEOの問題を引き起こす可能性があります。

また、webの25〜30%が重複したコンテンツであるため、このような問題を回避して修正する方法を知ることは便利です。

このガイドでは、次のことを学びます。

  • 重複コンテンツとは何ですか。
  • 重複コンテンツがSEOに悪い理由。
  • Googleに重複コンテンツのペナルティがあるかどうか;
  • 重複したコンテンツの一般的な原因;
  • 重複したコンテンツをチェック(および修正)する方法

重複したコンテンツとは何ですか?重複コンテンツとは、ウェブ上で複数の場所に表示される正確またはほぼ重複したコンテンツです。

重複コンテンツとは、複数の場所に表示され これは、単一のwebサイトまたはクロスドメインで発生する可能性があります。たとえば、この投稿をahrefs.com/blog/duplicate-content-copy/で再公開すると、それは重複したコンテンツになります。 私は別のウェブサイト上でそれを再発行した場合、それはまた、真であろう。Googleは、ほとんどの重複したコンテンツは、起源で欺瞞的ではないと述べています。

重複したコンテンツがSEOに悪いのはなぜですか?

重複したコンテンツは、いくつかの理由であなたのSEOのパフォーマンスに害を与える可能性があります。

  1. 検索結果の望ましくないまたは非友好的なUrl;
  2. バックリンク希釈;
  3. バーンズクロール予算;
  4. スクレープまたはシンジケートされたコンテン

これらをより深く調べてみましょう。

検索結果の望ましくないまたは非友好的なUrl

同じページが3つの異なるUrlで利用可能であるとします。

  1. domain.com/page/
  2. domain.com/page/?utm_content=バッファ&utm_medium=ソーシャル
  3. domain.com/category/page/

最初のものが検索結果に表示されるはずですが、Googleはこれを間違っている可能性があります。 その場合、望ましくないURLが代わりに使用される可能性があります。

人々は非友好的なURLをクリックする傾向が少ないかもしれないので、あなたはより少ない有機トラフィックを得ることができます。

バックリンク希釈

同じコンテンツが多くのUrlで利用可能な場合、それらのUrlのそれぞれがバックリンクを引き付ける可能性があります。 その結果、Url間の「リンクエクイティ」が分割されます。

野生でこれの例を表示するには、上のこれら二つのページを見てみましょうbuffer.com:

これらのページはほぼ正確に重複しています。 そしてそれらに106および144の参照の範囲(独特なウェブサイトからのリンク)が、それぞれある。あなたがパニックになる前に、Googleが重複したコンテンツをどのように処理するかのために、これは必ずしも問題ではないことを知ってください。簡単に言えば、重複したコンテンツを検出すると、Urlを1つのクラスターにグループ化します。 次に、”検索結果でクラスターを表すための”最良の”URLと思われるものを選択する”と”リンクの人気など、クラスター内のUrlのプロパティを代表URLに統合します。したがって、上記の場合、Googleはorganic searchのUrlの1つのみを表示し、クラスター内のすべての参照ドメイン(106+144)をそのURLに属性付けする必要があります。

しかし、両方のUrlが同様のキーワードでGoogleでランキングされているのを見るので、それは何が起こるかではありません。この例では、Googleは1つのURLで「リンクエクイティ」を統合していない可能性があります。BUFFERのGoogle Search Consoleアカウントにアクセスできないため、Googleがこれら2つのUrlをどのように認識しているかはわかりません。 これらのUrlの両方が重複していると表示され、そのうちの1つがすぐにorganic searchから消えてしまう可能性があります。

Burns crawl budget

Googleはクロールを介してウェブサイト上の新しいコンテンツを検索します。 彼らはまた、何かが変更されたかどうかを確認するために、彼らが時々知っているページを再クロールします。

重複したコンテンツを持つことは、それらのためのより多くの仕事を作成するためにのみ機能します。 これは、新規または更新されたページをクロールする速度と頻度に影響を与える可能性があります。

これは、新しいページのインデックス作成や更新されたページのインデックス再作成に遅延が生じる可能性があるため、悪いことです。

サイドノート。

googleの”クロール率の制限”は、より応答性の高いウェブサイトのために高いので、これはより小さな帯域幅の手当と遅いウェブサイトのための問題の多 彼らのシステムはまた、重複したUrlをあまり頻繁にクロールしません。

スクレイプコンテンツはあなたを上回っています

場合によっては、別のウェブサイトにあなたのコンテンツを再公開することを許可することがあります。 それはシンジケーションとして知られています。 他の回は、サイトがあなたのコンテンツをこすり、許可なしにそれを再発行することがあります。

これらのシナリオの両方が、複数のドメイン間でコンテンツを重複させる可能性がありますが、通常は問題は発生しません。 それは問題が起こること掻き取られるか、または再発行された内容があなたの場所の原物をoutranking始めるときだけである。良いニュースは、これはまれな出来事ですが、それが起こる可能性があります。

Googleには重複したコンテンツのペナルティがありますか?Googleは、重複したコンテンツのペナルティがないことを複数の場面で述べています。

重複したコンテンツペナルティはありません。 多くの重複したコンテンツを持っているためにサイトを降格させるということではありません。
ジョンMueller、ウェブマスタートレンドアナリストGoogle
: There’s no such thing as a duplicate content penalty.
Susan Moskwa, Former Webmaster Trends Analyst Google

DYK Google doesn’t have a duplicate content penalty.
Gary Illyes, Webmaster Trends Analyst Google

But, this isn’t entirely true. あなたの重複したコンテンツが偶然であり、検索結果やスパム行為の意図的な操作の結果ではない場合、あなたは罰せられることはありません。 そうであれば、あなたは可能性があります。

Googleは以下のことを確認します:

googleがランキングを操作し、ユーザーを欺く意図で重複したコンテンツが表示される可能性があると認識したまれなケースでは、関連するサイトのインデックスとランキングにも適切な調整を行います。 その結果、サイトのランキングが低下したり、サイトがGoogleインデックスから完全に削除されたりする可能性があります。P>

問題は、”ランキングを操作してユーザーを欺く意図”とは何ですか?Googleはここに多くの情報を持っています。

しかし、基本的には、次のようなものです。

  • 意図的に複数のページ、サブドメイン、または重複したコンテンツが多いドメインを作成します。
  • スクレープされたコンテンツの多くを公開
  • Amazonや他のサイトからスクレープされたアフィリエイトコンテンツを公開(および追加の値を追加しない)

しかし、上記のように、重複したコンテンツはまだSEOを傷つける可能性があります—でもペナルティなし。

重複コンテンツの一般的な原因

重複コンテンツの単一の原因はありません。 多くがあります。

ファセットナビゲーション/フィルタリングされたナビゲーション

ファセットナビゲーションは、ユーザーがページ上の項目をフ Ecommerceのウェブサイトはそれをたくさん使用する。

この種のナビゲーションは、URLの最後にパラメータを追加します。

通常、これらのフィルタの多くの組み合わせがあるため、ファセットナビゲーションは、多くの場合、重複または重複に近いコンたとえば、次の2つのページを見てください。

Urlは一意ですが、内容はほぼ同じです。

さらに、パラメータの順序は重要ではないことがよくあります。 たとえば、同じページには、これらのUrlの両方でアクセスできます。

この問題を解決する方法

ファセットナビゲーションは複雑な獣です。 これが重複したコンテンツの問題の原因であると思われる場合は、これを読んでください。

トラッキングパラメータ

パラメータ化されたUrlは、トラッキング目的にも使用されます。 たとえば、UTMパラメータを使用して、googleアナリティクスのニュースレターキャンペーンからの訪問を追跡できます。

例:example.com/page?utm_source=newsletter

この問題を解決する方法

パラメータを追跡せずにパラメータ化されたUrlをSEOに適したバージョンに正規化します。

セッションId

セッションIdには、訪問者に関する情報が格納されます。 通常、次のように長い文字列をURLに追加します。

例:example.com?sessionId=jow8082345hnfn9234

How to solve this issue

Canonicalize the URLs to SEO-friendly versions.

HTTPS vs. HTTP, and non-www vs. www

Most websites are accessible at one of these four variations:

  • https://www.example.com (HTTPS, www)
  • https://example.com (HTTPS, non-www)
  • http://www.example.com (HTTP, www)
  • http://example.com (HTTP, non-www)

If you’re using HTTPS, it’ll be one of the first two. それがwwwまたは非wwwバージョンであるかどうかはあなたの選択です。

ただし、サーバーを正しく構成しないと、サイトにはこれらのバリエーションのうちの二つ以上でアクセスできます。 それは良くないし、コンテンツの問題を重複する可能性があります。

この問題を解決する方法

リダイレクトを使用して、webサイトが1つの場所でのみアクセスできるようにします。

大文字と小文字を区別するUrl

GoogleはUrlを大文字と小文字を区別すると見なします。P>

Urlは大文字と小文字を区別しますが、必要な大文字と小文字を選択します。—🍌John🍌(@JohnMu)June22,2017

Sidenote.これは、すべてのUrlを小文字として扱うBingの場合はそうではないようです。 これは、これらの3つのUrlがすべて異なることを意味します。

  • example.com/page
  • example.com/PAGE
  • example.com/pAgE
この問題を解決する方法

内部リンクと一貫性があります(つまり、複数のバージョンのUrlに内部的にリンクしないでください)。 それでも問題が解決しない場合は、いつでも正規化またはリダイレクトできます。

末尾のスラッシュ対 non-trailing-slashes

Googleは、末尾のスラッシュの有無にかかわらずUrlを一意として扱います。 つまり、これらの2つのUrlはGoogleの目では一意です。

  • example.com/page/
  • example.com/page

両方のUrlでコンテンツにアクセスできる場合、コンテンツの重複の問題が発生する可能性があります。

これが問題であるかどうかを確認するには、末尾のスラッシュの有無にかかわらずページをロードしてみてください。 理想的には、1つのバージョンのみがロードされます。 もう一方はリダイレクトされます。

たとえば、末尾のスラッシュを付けずにこの投稿をロードしようとすると、末尾のスラッシュを付けたURLにリダイレクトされます。Googleは、この動作が理想的であると述べています。

p>

一つのバージョンだけを返すことができれば(つまり、他のバージョンはそれにリダイレクトされます)、それは素晴らしいことです! この動作は、重複したコンテンツを減らすために有益です。

この問題を解決する方法

望ましくないバージョン(例:末尾のスラッシュなし)を目的のバージョン(例:末尾のスラッシュ付き)にリ また、内部リンクとの一貫性を維持することを確認する必要があります。 末尾にスラッシュが付いているバージョンにリンクすることはありません。 いずれかを選択し、それに固執します。

印刷に適したUrl

印刷に適したバージョンは、元のものと同じ内容を持ちます。 異なるのはURLだけです。

        • example.com/page
        • example.com/print/page
        この問題を解決する方法

        印刷に適したバージョンを元のバージョンに正規化します。

        モバイルフレンドリUrl

        モバイルフレンドリUrlは、印刷フレンドリUrlと同様に重複しています。

              • example.com/page
              • m.例。com/page
              この問題を解決する方法

              モバイルフレンドリーなバージョンをオリジナルに正規化します。 Rel=”alternate”を使用して、モバイルフレンドリーなURLがデスクトップコンテンツの代替バージョンであることをGoogleに伝えます。

              推奨読書:デスクトップおよびモバイルUrlの注釈

              AMP Url

              Accelerated Mobile Pages(AMP)は重複しています。

                    • example.com/page
                    • example.com/amp/pageこの問題を解決する方法

AMPバージョンを非AMPバージョンに正規化します。 AMP URLが非AMPコンテンツの代替バージョンであることをGoogleに伝えるには、rel="amphtml"を使用します。AMPコンテンツのみがある場合は、自己参照の正規タグを使用します。

推奨読書:あなたのページを発見可能にする—amp。dev

タグとカテゴリページ

ほとんどのCMSは、タグを使用するときに専用のタグページを作成します。たとえば、オーガニックホエイプロテインに関する記事があり、”protein powder”と”whey”の両方をタグとして使用すると、次のような二つのタグページになります:

それは常にそれ自体で重複したコンテンツを引き起こすわけではありませんが、可能です。

これらの2つのタグを持つサイトには1つのページしかないため、各タグページは同じです。Div>

この問題を解決する方法

二つのオプション:

  1. タグを使用しないでください。 ほとんどの場合、彼らはとにかく値に少しを持っていません。
  2. タグページをインデックスしません。 Googleはまだこれらのページをクロールする時間を無駄にするので、これはクロール予算の問題を解決しません。

カテゴリページはタグページと同様の問題を引き起こす可能性があることに注意してください。 ポイントのケース:

どちらのカテゴリの下にリストされている製品がないため、これらのページはほぼ同じです。 だから私たちが残っているのは定型テンプレートのコピーだけです。

あなたのサイト上のカテゴリの合理的な数を使用して、またはあなたのカテゴリページをnoindexingことによってこれを解決します。

添付ファイルの画像Url

多くのCMSは、画像の添付ファイルの専用ページを作成します。 これらのページには、通常、画像と定型文のコピーだけが表示されます。このコピーは、自動生成されたすべてのページで同じであるため、コンテンツが重複します。

このコピーは、自動生成されたすべてのページで同じであるた

この問題を解決する方法

CMSの画像の専用ページを無効にします。 WordPressでは、Yoastのようなプラグインを使用してこれを行うことができます。

ページ化されたコメント

ワードプレスと他のCMS’ページ化されたコメントを許可します。 これにより、同じUrlの複数のバージョンが効果的に作成されるため、コンテンツが重複します。

        • example.com/post/
        • example.com/post/comment-page-2
        • example.com/post/comment-page-3
        この問題を解決する方法

        コメントのページネーションをオフにするか、Yoastのようなプラグインを使用してページネーションされたページ

        ローカリゼーション

        同じ言語を話す異なるロケールの人々に似たコンテンツを提供している場合、コンテンツが重複する可能性があります。

        たとえば、米国、英国、オーストラリアのユーザー向けにサイトのバージョンが異なる場合があります。 各ロケールに提供されるコンテンツの間にはわずかな違いしかない可能性があるため(例えば、ドルとポンドの価格)、バージョンは重複に近いでしょう。

        サイドノート。John Muellerによると、翻訳されたコンテンツは重複したコンテンツではありません。
        この問題を解決する方法

        hreflangタグを使用して、バリエーション間の関係について検索エンジンに伝えます。

        検索結果ページ

        ウェブサイトの多くは、検索ボックスを持っています。 これらを使用すると、通常、パラメータ化された検索URLに移動します。

        Example:example.com?q=search-term

        Googleの元Webspamヘッド、Matt Cuttsは、次のように述べています。

        通常、web検索結果はユーザーに価値を追加しません。 (もちろん、”/results”や”/search”のようなものを含むすべてのUrlが検索結果であるわけではありません。 この問題を解決する方法

        robotsメタタグを使用して、Googleのインデックスから検索ページを削除したり、ロボットの検索結果ページへのアクセスをブロックtxt。 検索結果ページへの内部リンクはご遠慮ください。

        ステージング環境

        ステージング環境は、テスト目的で使用されるサイトの重複またはほぼ重複したバージョンです。

        たとえば、新しいプラグインをインストールしたり、webサイトでコードを変更したりしたいとします。 あなたは毎日の訪問者の数十万人とライブサイトにまっすぐにそれをプッシュしたくないかもしれません。 大惨事のリスクが高すぎます。 解決策は、最初にステージング環境で変更をテストすることです。

        ステージング環境は、コンテンツが重複するため、Googleがインデックスを作成するとSEOの問題になります。

        この問題を解決する方法

        HTTP認証、IPホワイトリスト、またはVPNアクセスを使用してステージング環境を保護します。 すでにインデックスが作成されている場合は、robots noindexディレクティブを使用して削除します。あなたのサイト上の重複したコンテンツをチェックする方法

        Ahrefsのサイト監査に向かい、クロールを開始します。

        完了したら、コンテンツ品質レポートに進みます。

        正規化されていない重複とほぼ重複のクラスターを探します。 これらはオレンジ色で強調表示されます。

        これらのクラスターのいずれかをクリックすると、影響を受けるページが表示されます。

        重複したコンテンツの理由を調査し、適切なアクションを実行します。

        これらは、特に重複に近い場合には、必ずしも修正が必要な問題ではないことに注意してください。/p>

        Ahrefsユーザーではありませんか?

        Google検索コンソールでこれらの重複コンテンツ関連の警告を探します:

        • ユーザーが選択した正規のない重複
        • 重複し、Googleはユーザーとは異なる正規のを選択しました
        • 重複し、提出されたURLは正規として選択されていません

        ここでこれらの警告に対処する方法の詳細については、こちらをご覧ください。

        Googleが特定のURLをどのように扱うかを確認するには、URL検査ツールを使用します。また、HTMLタグレポートで重複するタイトルタグ、メタ説明、およびH1を確認することもできます。悪い重複はあなたが探しているものです。

        悪い重複はあなたが探しているものです。

        れらは重複したメタ札が別のcanonicalsが付いているページである。HTMLタグ&コンテンツの下にある”悪い重複”トグルをクリックして、これらを選択します。

        黄色のバーのいずれかをクリックすると、影響を受けるページが表示されます。

        重複したタイトル、メタ記述、またはH1のページは、多くの場合、非常に似ています。たとえば、これらの2つは同じタイトルタグを持ち、製品が同じであるため内容はほぼ同じです。 唯一の違いは、ページの1つがinstant lighting firelogsの3パック用であるのに対し、他のページは1つだけのためのものであることです。

        Googleは、次のような類似したコンテンツを最小限に抑える必要があると述べています。

        類似しているページが多

        しかし、類似したページの数が少ないことはあまり問題になりそうにありません。

        web上で重複したコンテンツの問題をチェックする方法

        コンテンツのスクレイピングとシンジケーションは、重複したコンテンツの問題 しかし、それは通常、あなたのコンテンツの掻き取られたバージョンがあなたを上回っているのを見た場合にのみ問題です。

        それは起こるのですか?

        はい、しかしそれは頻繁に新しくか弱いウェブサイトのための問題の多くである。 どうして? あなたのコンテンツを掻き取るサイトは、多くの場合、より権威があるので。 それは時々彼らが元であることを考えることにGoogleを”トリック”。

        小さなウェブサイトがある場合は、Googleで引用符で囲まれたページのテキストのスニペットを検索することで、掻き取られたコンテンツを見つけるこ大規模なサイトの場合は、Copyscapeのような自動化されたツールを使用する必要があります。 これは、あなたのページ(複数可)上のコンテンツの他の出現のためのウェブを検索します。p>

        どちらの方法を使用しても、ほとんどの結果はスパムと低品質のサイトからのものになります。一般的に言えば、これらは心配することは何もありません。

        ただし、正当なウェブサイトがコンテンツを掻き集め、トラフィックを盗んでいる可能性があると懸念している場合は、UrlをAhrefsのサイトエクスプローp>

        あなたのページよりも多くのトラフィックを取得している場合、問題がある可能性があります。この場合、次の3つのオプションがあります。

        1. 手を差し伸べて、コンテンツを削除するように要求します。
        2. 手を差し伸べて、あなたのサイト上のオリジナルへの正規のリンクを追加するように要求します。
        3. GOOGLE経由でDMCAテイクダウンリクエストを送信します。意図的に他のウェブサイトにコンテンツをシンジケートする場合は、オリジナルへの正規のリンクを追加するように依頼する価値があります。

        これにより、重複したコンテンツの問題のリスクが排除されます。

        あなた自身のサイトにコンテンツを再公開しますか?

        サイト上の他の人からコンテンツを再公開する場合、コンテンツの重複の問題を防ぐには2つの方法があります。

        1. 元のコンテンツに正
        2. ページをインデックスしません。

        最終的な考え

        重複したコンテンツをあまり強調しないでください。 それは通常、それがあると考えられているよりもはるかに少ない問題です。

        ページが重複している場合、またはページが重複している場合は、問題が発生する可能性は低いです。

        ページが重複している場合は、ページが重複している場合があります。 別のウェブサイトやサイト上の他のページからのコンテンツを引用する場合も同じです。 少量の重複または定型的なコンテンツは大丈夫です。 Googleは、そのようなことに対処するための場所でシステムを持っています。

        あなたが目を光らせてする必要があるのは、eコマースサイト上のファセットナビゲーションの不適切な実装など、重複したコンテンツのページの数百

        これらは、とりわけ、あなたのクロール予算に大混乱をもたらすことができます。



コメントを残す

メールアドレスが公開されることはありません。