Duplicate Content: miért történik és hogyan kell kijavítani

A tartalom vezetője @ Ahrefs (vagy egyszerű angol nyelven én vagyok az a srác, aki felelős azért, hogy minden közzétett blogbejegyzés epikus legyen).

szeretné megtudni, hogy mi a duplikált tartalom, és hogyan árthat a SEO-nak?

a duplikált tartalom sok webhelytulajdonos számára állandó szorongás forrása.

olvassa el szinte semmit róla, és akkor jön el azt hinni, hogy a webhely egy ketyegő időzített bomba ismétlődő tartalmi kérdések. A Google büntetése csak napok múlva van.

szerencsére ez nem igaz—de a duplikált tartalom továbbra is okozhat SEO problémákat. És mivel a web 25-30% – a ismétlődő tartalom, hasznos tudni, hogyan lehet elkerülni és kijavítani az ilyen problémákat.

ebben az útmutatóban megtudhatja:

  • mi az ismétlődő tartalom;
  • miért rossz a duplikált tartalom a SEO számára;
  • hogy a Google duplikált tartalom-büntetést alkalmaz-e;
  • a duplikált tartalom gyakori okai;
  • hogyan ellenőrizhető (és javítható) a duplikált tartalom

mi az a duplikált tartalom?

a duplikált tartalom olyan pontos vagy közel duplikált tartalom, amely egynél több helyen jelenik meg az interneten. Előfordulhat egyetlen weboldalon vagy kereszttartományban.

például, ha újra közzétenném ezt a bejegyzést a ahrefs.com/blog/duplicate-content-copy/ címen, akkor az ismétlődő tartalom lenne. Ez akkor is igaz lenne, ha újra közzétenném egy másik weboldalon.

a Google kijelenti, hogy a legtöbb duplikált tartalom eredete nem megtévesztő.

miért káros a duplikált tartalom a SEO számára?

az ismétlődő tartalom néhány okból károsíthatja a SEO teljesítményét.

  1. nemkívánatos vagy barátságtalan URL-ek a keresési eredmények között;
  2. Backlink hígítás;
  3. Burns crawl költségvetés;
  4. lekapart vagy szindikált tartalom felülmúlja Önt.

vizsgáljuk meg ezeket részletesebben.

nemkívánatos vagy barátságtalan URL-ek a keresési eredmények között

képzelje el, hogy ugyanaz az oldal három különböző URL-en érhető el:

  1. domain.com/page/
  2. domain.com/page/?utm_content = buffer & utm_medium=szociális
  3. domain.com/category/page/

az elsőnek meg kell jelennie a keresési eredmények között, de a Google ezt rosszul tudja. Ha ez megtörténik, egy nemkívánatos URL léphet a helyére.

mivel az emberek kevésbé hajlamosak egy barátságtalan URL-re kattintani, kevesebb organikus forgalmat érhet el.

Backlink hígítás

Ha ugyanaz a tartalom több URL-en is elérhető, akkor ezek az URL-ek vonzzák a backlinkeket. Ez a” link equity ” felosztását eredményezi az URL-ek között.

ha példát szeretne mutatni erre a vadonban, nézze meg ezt a két oldalt buffer.com:

ezek az oldalak szinte pontos másolatok. 106, illetve 144 hivatkozó domainjük van (egyedi weboldalakról származó linkek).

mielőtt pánikba esne, tudja, hogy ez nem mindig probléma, mert a Google hogyan kezeli az ismétlődő tartalmat.

egyszerűen fogalmazva, amikor duplikált tartalmat észlelnek, az URL-eket egy fürtbe csoportosítják. Ezután ” kiválasztják, hogy melyik a legjobb URL-CÍM A fürt megjelenítésére a keresési eredmények között “és” összevonják a fürt URL-jeinek tulajdonságait, például a hivatkozás népszerűségét a reprezentatív URL-re.”

tehát a fenti esetben a Google csak az egyik URL-t jelenítse meg az organikus keresésben, és a fürt összes hivatkozó domainjét (106+144) hozzárendelje ehhez az URL-hez.

de nem ez történik, mivel látjuk, hogy mindkét URL rangsorolja a Google-ban hasonló kulcsszavakat.

ebben az esetben a Google valószínűleg nem konszolidálja a “link equity” – t egy URL-en.

jogi nyilatkozat

nem lehetünk biztosak abban, hogy a Google hogyan látja ezt a két URL-t, mivel nincs hozzáférésünk a Buffer Google Search Console-fiókjához. Lehet, hogy mindkét URL-t duplikátumként látják, és az egyik hamarosan eltűnik az organikus keresésből.

Burns crawl budget

a Google új tartalmat talál a webhelyén a feltérképezés segítségével, ami azt jelenti, hogy a meglévő oldalakról az új oldalakra mutató hivatkozásokat követik. Azt is recrawl oldalakat tudnak időről időre, hogy ha valami megváltozott.

az ismétlődő tartalom csak arra szolgál, hogy több munkát hozzon létre számukra. Ez befolyásolhatja az új vagy frissített oldalak feltérképezésének sebességét és gyakoriságát.

ez rossz, mert késleltetheti az új oldalak indexelését és a frissített oldalak újraindexelését.

Sidenote.

mivel a Google “feltérképezési sebességkorlátozása” magasabb az érzékenyebb webhelyek esetében, ez inkább a kisebb sávszélességű, lassú webhelyek esetében jelent problémát. Rendszereik ritkábban fogják feltérképezni a duplikált URL-eket is.

lekapart tartalom felülmúlja Önt

alkalmanként engedélyezheti, hogy egy másik webhely újra közzétegye a tartalmát. Ezt nevezik szindikációnak. Más esetekben a webhelyek lekaparhatják az Ön Tartalmát, és engedély nélkül újra közzétehetik.

mindkét forgatókönyv több domainen keresztül ismétlődő tartalomhoz vezet, de általában nem okoznak problémát. Csak akkor merülnek fel problémák, amikor a lekapart vagy újraközölt tartalom elkezdi felülmúlni az eredetit a webhelyén.

a jó hír az, hogy ez ritka eset, de megtörténhet.

van-e a Google-nak duplikált tartalombüntetése?

a Google több alkalommal kijelentette, hogy nincs ismétlődő tartalmi büntetés.

nincs ismétlődő tartalmi büntetés. Nem arról van szó, hogy egy webhelyet lefokoznánk, mert sok ismétlődő tartalom van.
John Mueller, Webmester trendek elemzője Google

tegyük ezt az ágyba egyszer és mindenkorra, emberek: There’s no such thing as a duplicate content penalty.
Susan Moskwa, Former Webmaster Trends Analyst Google

DYK Google doesn’t have a duplicate content penalty.
Gary Illyes, Webmaster Trends Analyst Google

But, this isn’t entirely true. Ha a duplikált tartalom véletlen, és nem a keresési eredmények szándékos manipulálásának vagy a spam jellegű gyakorlatoknak az eredménye, akkor nem büntetik meg. Ha igen, akkor lehet.

a Google megerősíti, hogy itt:

azokban a ritka esetekben, amikor a Google észleli, hogy a duplikált tartalom megjeleníthető azzal a szándékkal, hogy manipulálja a rangsorunkat és megtévessze a felhasználóinkat, megfelelő módosításokat hajtunk végre az érintett webhelyek indexelésében és rangsorolásában is. Ennek eredményeként a webhely rangsorolása szenvedhet, vagy a webhelyet teljesen eltávolíthatják a Google indexéből, amely esetben már nem jelenik meg a keresési eredmények között.

a kérdés az, hogy mi számít”szándéknak a rangsorunk manipulálására és felhasználóink megtévesztésére”?

a Google-nak sok információja van erről itt. De alapvetően olyan dolgok, mint:

  • szándékosan több oldal, aldomain vagy domain létrehozása sok ismétlődő tartalommal.
  • sok lekapart tartalom közzététele
  • az Amazonról vagy más webhelyekről lekapart affiliate tartalom közzététele (és további érték hozzáadása nélkül)

azonban, amint azt fentebb tárgyaltuk, a duplikált tartalom továbbra is károsíthatja a SEO—t-még büntetés nélkül is.

a duplikált tartalom gyakori okai

a duplikált tartalomnak nincs egyetlen oka. Sokan vannak.

Faceted/filtered navigation

a Faceted navigation az, ahol a felhasználók szűrhetik és rendezhetik az oldal elemeit. Az e-kereskedelmi webhelyek sokat használják.

Ez a fajta navigáció paramétereket fűz az URL végéhez.

mivel ezeknek a szűrőknek általában sok kombinációja van, a csiszolt navigáció gyakran sok duplikált vagy majdnem duplikált tartalmat eredményez.

vessen egy pillantást erre a két oldalra, például:

az URL-ek egyediek, de a tartalom szinte azonos.

plusz, a paraméterek sorrendje gyakran nem számít. Például ugyanaz az oldal elérhető mindkét URL-en:

a probléma megoldása

a sokoldalú navigáció összetett vadállat. Ha azt gyanítja, hogy ez a duplikált tartalmi problémák oka, csak olvassa el ezt.

követési paraméterek

a paraméterezett URL-eket nyomkövetési célokra is használják. Például az UTM-paraméterek segítségével nyomon követheti a Google Analytics hírlevél-kampányának látogatásait:

példa: example.com/page?utm_source=newsletter

hogyan lehet megoldani ezt a problémát

kanonizálja a paraméterezett URL-eket SEO-barát verziókba követési paraméterek nélkül.

munkamenet-azonosítók

a munkamenet-azonosítók információkat tárolnak a látogatókról. Általában hosszú karakterláncot fűznek az URL-hez, így:

példa: example.com?sessionId=jow8082345hnfn9234

How to solve this issue

Canonicalize the URLs to SEO-friendly versions.

HTTPS vs. HTTP, and non-www vs. www

Most websites are accessible at one of these four variations:

  • https://www.example.com (HTTPS, www)
  • https://example.com (HTTPS, non-www)
  • http://www.example.com (HTTP, www)
  • http://example.com (HTTP, non-www)

If you’re using HTTPS, it’ll be one of the first two. Függetlenül attól, hogy a www vagy nem www verzió az Ön választása.

Ha azonban nem megfelelően konfigurálja a szervert, akkor a webhely két vagy több ilyen változatban lesz elérhető. Ez nem jó, és ismétlődő tartalmi problémákhoz vezethet.

a probléma megoldása

az átirányítások használatával biztosíthatja, hogy webhelye csak egy helyen érhető el.

kisbetűs URL-ek

a Google az URL-eket kisbetűsnek tekinti.

az URL-ek nagybetűérzékenyek, de Válasszon bármilyen esetet.- (@JohnMu) június 22, 2017

Sidenote.

úgy tűnik, hogy ez nem így van a Bing esetében, amely az összes URL-t kisbetűként kezeli.

Ez azt jelenti, hogy ez a három URL különböző:

  • example.com/page
  • example.com/PAGE
  • example.com/pAgE
hogyan lehet megoldani ezt a problémát

legyen összhangban a belső linkekkel (azaz ne hivatkozzon belsőleg az URL-ek több verziójára). Ha ez nem oldja meg a dolgokat, akkor mindig kanonizálhat vagy átirányíthat.

záró perjel vs. non-trailing-slashes

a Google az URL-eket a Trailing slashes-szel és anélkül egyediként kezeli. Ez azt jelenti, hogy ez a két URL egyedülálló a Google szemében:

  • example.com/page/
  • example.com/page

Ha a tartalom mindkét URL-en elérhető, akkor ez ismétlődő tartalmi problémákhoz vezethet.

annak ellenőrzéséhez, hogy ez probléma-e, próbáljon meg betölteni egy oldalt a záró perjelrel vagy anélkül. Ideális esetben csak egy verzió töltődik be. A másik átirányítja.

például, ha megpróbálja betölteni ezt a bejegyzést anélkül, hogy a záró perjel, akkor átirányítja az URL-t a záró perjel.

a Google kijelenti, hogy ez a viselkedés ideális.

Ha csak egy verziót lehet visszaadni (azaz a másik átirányít rá), ez nagyszerű! Ez a viselkedés azért előnyös, mert csökkenti az ismétlődő tartalmat.

hogyan lehet megoldani ezt a problémát

irányítsa át a nemkívánatos verziót (pl. Arra is ügyelnie kell, hogy összhangban maradjon a belső összekapcsolással. Ne hivatkozzon néha záró perjelekkel rendelkező verziókra, más idők nélkül. Válasszon egyet, és ragaszkodjon hozzá.

Nyomtatóbarát URL-ek

a Nyomtatóbarát verziók tartalma megegyezik az eredetivel. Csak az URL különbözik.

  • example.com/page
  • example.com/print/page
a probléma megoldása

kanonizálja a nyomtatóbarát verziót az eredetire.

mobilbarát URL-ek

a mobilbarát URL-ek, mint például a nyomtatóbarát URL-ek, ismétlődések.

  • example.com/page
  • m.példa.com/page
hogyan lehet megoldani ezt a problémát

kanonizálja a mobilbarát verziót az eredetire. A rel=”alternate” használatával közölheti a Google-lal, hogy a mobilbarát URL az asztali tartalom alternatív változata.

ajánlott olvasmány: az asztali és mobil URL-ekre vonatkozó megjegyzések

AMP URL-ek

a gyorsított mobil oldalak (AMP) másolatok.

  • example.com/page
  • example.com/amp/page
hogyan lehet megoldani ezt a problémát

Az AMP verzió kanonizálása a nem AMP verzióra. A rel="amphtml" használatával közölheti a Google-lal, hogy az AMP URL a nem AMP tartalom alternatív változata.

Ha csak AMP-tartalommal rendelkezik, használjon önhivatkozó kanonikus címkét.

ajánlott olvasmány: tegye az oldalakat felfedezhetővé-amp.dev

Tag és kategória oldalak

a legtöbb CMS dedikált címkeoldalakat hoz létre címkék használatakor.

például, ha van egy cikk a szerves tejsavófehérjéről, és mind a “fehérjeport”, mind a “tejsavó” címkéket használja, akkor két ilyen címkeoldal lesz:

Ez nem mindig okoz ismétlődő tartalmat önmagában, de lehet.

itt ez a helyzet, mert a webhelyen csak egy oldal található ezzel a két címkével—tehát minden címkeoldal azonos.

a probléma megoldása

két lehetőség:

  1. ne használjon címkéket. Az idő nagy részében, amúgy is alig vagy egyáltalán nincs értékük.
  2. Noindex a címkék oldalak. Ez nem oldja meg a feltérképezési költségvetés kérdését, mivel a Google továbbra is pazarolja az időt ezen oldalak feltérképezésére.

ne feledje, hogy a kategóriaoldalak hasonló problémákat okozhatnak, mint a címkeoldalak. Példa erre:

mindkét oldal szinte azonos, mert egyik kategóriában sem szerepelnek termékek. Tehát csak a boilerplate sablon másolata maradt.

ezt úgy oldhatja meg, hogy ésszerű számú kategóriát használ a webhelyén, vagy akár nem indexeli a kategóriaoldalakat.

Mellékletkép URL-ek

sok CMS külön oldalakat hoz létre a képmellékletekhez. Ezek az oldalak általában nem mutatnak semmit, csak a képet és néhány kazánlapot.

mivel ez a másolat minden automatikusan generált oldalon azonos, duplikált tartalomhoz vezet.

hogyan lehet megoldani ezt a problémát

tiltsa le a CMS-ben lévő képek dedikált oldalait. A WordPress – ben ezt megteheti egy olyan plugin segítségével, mint a Yoast.

Paginált Hozzászólások

a WordPress és más CMS lehetővé teszi a paginált megjegyzéseket. Ez ismétlődő tartalmat okoz, mivel hatékonyan ugyanazon URL-ek több verzióját hozza létre.

  • example.com/post/
  • example.com/post/comment-page-2
  • example.com/post/comment-page-3
hogyan lehet megoldani ezt a problémát

kapcsolja ki a megjegyzés oldalszámozását vagy a noindex-et a lapozott oldalak egy olyan plugin segítségével, mint a Yoast.

lokalizáció

ha hasonló tartalmat jelenít meg különböző helyszíneken, akik ugyanazt a nyelvet beszélik, akkor ez ismétlődő tartalmat okozhat.

például előfordulhat, hogy webhelyének különböző verziói vannak az Egyesült Államokban, az Egyesült Királyságban és Ausztráliában élők számára. Mivel valószínűleg csak kisebb különbségek vannak az egyes nyelveken megjelenített tartalom között (például dollárban vagy fontban kifejezett árak), a verziók közel Duplikátumok lesznek.

Sidenote.

John Mueller szerint a lefordított tartalom nem duplikált tartalom.

hogyan lehet megoldani ezt a problémát

használja a hreflang címkéket, hogy elmondja a keresőmotoroknak a változatok közötti kapcsolatot.

keresési eredmények oldalak

sok webhely rendelkezik keresőmezőkkel. Ezek használata általában egy paraméterezett keresési URL-hez vezet.

példa: example.com?q=keresési kifejezés

a Google korábbi Webspam vezetője, Matt Cutts kijelentette, hogy:

a webes keresési eredmények általában nem adnak értéket a felhasználóknak, és mivel fő célunk a lehető legjobb keresési eredmények biztosítása, általában kizárjuk a keresési eredményeket a webes keresési indexünkből. (Nem minden URL, amely olyan dolgokat tartalmaz, mint a “/eredmények” vagy a “/keresés”, természetesen keresési eredmények.)
Matt Cutts, a Webspam Google korábbi vezetője

hogyan lehet megoldani ezt a problémát

használjon robots metacímkét a keresési oldalak eltávolításához a Google-ból index vagy blokkolja a hozzáférést a keresési eredmények oldalak robotok.txt. Tartózkodjon attól, hogy belsőleg összekapcsolja a keresési eredményoldalakat.

Staging environment

a staging environment a webhely tesztelési célokra használt duplikált vagy majdnem duplikált változata.

képzelje el például, hogy új plugint szeretne telepíteni, vagy módosítani szeretne valamilyen kódot a webhelyén. Lehet, hogy nem akarja ezt egyenesen egy élő webhelyre tolni, ahol napi több százezer látogató van. A katasztrófa kockázata túl magas. A megoldás az, hogy először teszteljük az átmeneti környezet változásait.

az átmeneti környezetek SEO problémává válnak, amikor a Google indexeli őket, mert ismétlődő tartalmat eredményez.

a probléma megoldása

védje az átmeneti környezetet HTTP-hitelesítéssel, IP-engedélyezőlistával vagy VPN-hozzáféréssel. Ha már indexelt, használjon robots noindex irányelvet az eltávolításához.

hogyan lehet ellenőrizni a duplikált tartalmat a webhelyén

menj át az Ahrefs Webhelyellenőrzéséhez, és kezdj el feltérképezni.

Ha kész, irány a Tartalomminőségi jelentés.

keresse meg a duplikátumok és a közeli Duplikátumok klasztereit kanonikus nélkül. Ezek narancssárga színnel vannak kiemelve.

kattintson bármelyik klaszterre az érintett oldalak megtekintéséhez.

vizsgálja meg a duplikált tartalom okát, majd tegye meg a megfelelő műveletet.

vegye figyelembe, hogy ezek nem mindig lesznek olyan problémák, amelyeket ki kell javítani, különösen a közeli másolatok esetén.

nem Ahrefs felhasználó?

keresse meg ezeket a duplikált tartalommal kapcsolatos figyelmeztetéseket a Google Search Console-ban:

  • Duplicate a felhasználó által kiválasztott kanonikus
  • Duplicate nélkül a Google más kanonikus, mint a felhasználó
  • Duplicate, a beküldött URL nincs kiválasztva kanonikus

Tudjon meg többet arról, hogyan kell kezelni ezeket a figyelmeztetéseket itt.

annak megtekintéséhez, hogy a Google hogyan kezeli az adott URL-t, használja az URL-ellenőrző eszközt.

a HTML-címkék jelentésben ellenőrizheti a címcímkék, a metaleírások és a H1s duplikátumait is.

rossz másolatok az, amit keres. Ezek olyan oldalak, amelyek ismétlődő metacímkéket tartalmaznak, de különböző kanonikálokat tartalmaznak.

válassza ki ezeket a HTML-címkék & tartalom alatt található”Rossz másolatok”kapcsolóra kattintva.

kattintson bármelyik sárga sávra az érintett oldalak megtekintéséhez.

az ismétlődő címekkel, metaleírásokkal vagy H1-ekkel rendelkező oldalak gyakran nagyon hasonlóak.

például ennek a kettőnek ugyanaz a címcímkéje van, és a tartalom majdnem azonos, mert a termék ugyanaz. Az egyetlen különbség az, hogy az egyik oldal egy 3 csomag instant lighting firelogs, míg a másik csak egy.

a Google kijelenti, hogy minimalizálja a hasonló tartalmakat, mint ez:

ha sok hasonló oldala van, fontolja meg az egyes oldalak kibővítését vagy az oldalak egyesítését.

kevés hasonló oldal azonban valószínűleg nem jelent problémát.

hogyan ellenőrizhető, hogy vannak-e ismétlődő tartalmi problémák a weben

a Tartalomkaparás és a szindikálás ismétlődő tartalmi problémákhoz is vezethet. De ez általában csak akkor jelent problémát, ha a tartalom lekaparott verziói felülmúlják Önt.

ez megtörténik? Igen, de ez gyakran inkább az új vagy gyenge webhelyek problémája. Miért? Mivel a tartalmat lekaparó webhelyek gyakran hitelesebbek. Ez néha “becsapja” a Google-t, hogy azt gondolja, hogy az övék az eredeti.

Ha van egy kis webhelye, akkor gyakran megtalálhatja a lekapart tartalmat, ha a Google-ban keres egy szövegrészletet az oldaláról idézőjelekben.

nagyobb webhelyek esetén olyan automatizált eszközt kell használnia, mint a Copyscape. Ez megkeresi az interneten az oldal(ok) tartalmának egyéb előfordulásait.

bármelyik módszert is használja, a legtöbb eredmény spam jellegű és gyenge minőségű webhelyekről származik.

Általánosságban elmondható, hogy ezek miatt nem kell aggódni. Ha azonban azt látja, hogy egy törvényes webhely lekaparta a tartalmát, és aggódik amiatt, hogy ellophatja a forgalmat, dobja az URL-t az Ahrefs webhely-Felfedezőjébe, hogy organikus forgalmi becslést jelenítsen meg.

Ha nagyobb forgalmat ér el, mint az oldalad, akkor probléma lehet.

ebben az esetben három lehetősége van:

  1. keresse meg és kérje a tartalom eltávolítását.
  2. keresse meg és kérje, hogy adjon hozzá egy kanonikus linket az eredetihez a webhelyén.
  3. DMCA eltávolítási kérelem benyújtása a Google-on keresztül.

ha szándékosan szindikál tartalmat más webhelyekre, akkor érdemes megkérni őket, hogy adjanak hozzá egy kanonikus linket az eredetihez. Ez kiküszöböli az ismétlődő tartalmi problémák kockázatát.

tartalom újbóli közzététele a saját webhelyén?

ha másoktól származó tartalmat tesz közzé újra a webhelyén, kétféle módon akadályozhatja meg az ismétlődő tartalmakkal kapcsolatos problémákat:

  1. vissza az eredetihez.
  2. Noindex az oldal.

végső gondolatok

ne stresszelj túl sokat a duplikált tartalom miatt. Ez általában sokkal kevésbé probléma, mint azt gondolják.

Ha van egy maroknyi duplikált vagy majdnem duplikált oldalad, akkor valószínűleg nem lesz sok probléma. Ugyanez igaz, ha egy másik webhelyről vagy a webhely más oldalairól származó tartalmat idéz. Kis mennyiségű duplikált vagy kazántartalomnak rendben kell lennie. A Google rendelkezik olyan rendszerekkel, amelyek az ilyen dolgok kezelésére szolgálnak.

amire figyelni kell, azok a technikai SEO balesetek, amelyek több száz vagy ezer oldalnyi duplikált tartalom generálásához vezetnek, például a sokoldalú navigáció helytelen megvalósítása az e-kereskedelmi webhelyeken.

ezek pusztítást okozhatnak a feltérképezési költségvetésben, többek között.



Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.