Duplicitní Obsah: Proč se To Stane a Jak To Opravit

Hlava z Obsahu @ Ahrefs (nebo, v jednoduché angličtině, já jsem ten, kdo je zodpovědný za zajištění, že každý blog post vydáváme je EPIC).

zájem se dozvědět, co je duplicitní obsah, a jak by mohly být bolí své SEO?

duplicitní obsah je zdrojem neustálé úzkosti pro mnoho majitelů stránek.

Přečtěte si o tom téměř cokoli a budete věřit, že váš web je časovaná bomba duplicitních problémů s obsahem. Trest Google je jen několik dní pryč.

naštěstí to není pravda – ale duplicitní obsah může stále způsobit problémy se SEO. A vzhledem k tomu, že 25-30% webu je duplicitním obsahem, je užitečné vědět, jak se těmto problémům vyhnout a opravit je.

V této příručce, se naučíte:

  • Co je duplicitní obsah;
  • Proč duplicitní obsah, je špatné pro SEO;
  • Zda Google má duplicitní obsah trest;
  • běžné příčiny duplicitního obsahu;
  • jak zkontrolovat (a opravit) duplicitní obsah

co je duplicitní obsah?

duplicitní obsah je přesný nebo téměř duplicitní obsah, který se objevuje na webu na více než jednom místě. Může se vyskytnout na jednom webu nebo mezi doménami.

například, pokud bych měl znovu publikovat tento příspěvek na ahrefs.com/blog/duplicate-content-copy/, pak by to byl duplicitní obsah. To by také byla pravda, kdybych to měl znovu publikovat na jiném webu.

Google uvádí, že většina duplicitního obsahu není původem klamavá.

proč je duplicitní obsah špatný pro SEO?

duplicitní obsah může poškodit váš výkon SEO z několika důvodů.

  1. Nežádoucí nebo nepřátelské Url ve výsledcích vyhledávání;
  2. Backlink ředění;
  3. Popáleniny plazit rozpočtu;
  4. Poškrábaný nebo syndikovaného obsahu vítězných zobrazení.

pojďme prozkoumat tyto ve větší hloubce.

Nežádoucí nebo nepřátelské Url ve výsledcích vyhledávání

Představte si, že na stejné stránce je k dispozici ve třech různých Url:

  1. domain.com/page/
  2. domain.com/page/?utm_content=buffer&utm_medium=sociální
  3. domain.com/category/page/

první by se mělo ukázat ve výsledcích vyhledávání, ale Google může dostat to špatně. Pokud k tomu dojde, může na jeho místo zaujmout nežádoucí URL.

protože lidé mohou být méně nakloněni kliknout na nepřátelskou adresu URL, můžete získat méně organického provozu.

ředění zpětného odkazu

Pokud je stejný obsah k dispozici na mnoha adresách URL, pak každá z těchto adres URL může přitahovat zpětné odkazy. To má za následek rozdělení „link equity“ mezi URL.

ukázat příklad v přírodě, podívejte se na tyto dvě stránky na buffer.com:

Tyto stránky jsou téměř přesné duplikáty. A mají 106 a 144 odkazujících domén (odkazy z jedinečných webových stránek).

dříve, Než propadnete panice, vím, že to není vždy problém, protože, jak Google zpracovává duplicitní obsah.

jednoduše řečeno, když detekují duplicitní obsah, seskupují adresy URL do jednoho clusteru. Oni pak „vybrat, co myslíte, že je „nejlepší“ URL reprezentovat cluster ve výsledcích vyhledávání“ a „upevnit vlastnosti adresy Url v clusteru, jako link popularity, zástupce URL.“

ve výše uvedeném případě by tedy Google měl zobrazit pouze jednu z adres URL v organickém vyhledávání a přiřadit k této adrese URL všechny odkazující domény v clusteru (106+144).

ale to se nestane, protože vidíme, že obě adresy URL jsou v Googlu hodnoceny pro podobná klíčová slova.

V tomto případě, Google pravděpodobně není konsolidaci „odkaz kapitálu“ na jednu adresu URL.

zřeknutí se odpovědnosti

nemůžeme si být jisti, jak Google vidí tyto dvě adresy URL, protože nemáme přístup k účtu Google Search Console bufferu. Je možné, že obě tyto adresy URL vidí jako duplikáty a jedna z nich brzy zmizí z organického vyhledávání.

Burns procházení rozpočtu

Google najde nový obsah na vašem webu pomocí procházení, což znamená, že sleduje odkazy ze stávajících stránek na nové stránky. Čas od času také překreslují stránky, o kterých vědí, aby zjistili, zda se něco nezměnilo.

duplicitní obsah slouží pouze k vytvoření více práce pro ně. To může ovlivnit rychlost a frekvenci procházení vašich nových nebo aktualizovaných stránek.

to je špatné, protože to může vést ke zpoždění při indexování nových stránek a reindexování aktualizovaných stránek.

Sidenote.

protože „limit rychlosti procházení“ společnosti Google je vyšší u citlivějších webů, jedná se spíše o problém pro pomalé weby s menšími povolenkami na šířku pásma. Jejich systémy budou také procházet duplicitní adresy URL méně často.

Škrabal obsah vítězných zobrazení

Občas, může povolit jiné webové stránky publikovat obsah. Tomu se říká syndikace. Jindy, weby mohou škrábat váš obsah a znovu jej publikovat bez povolení.

oba tyto scénáře vedou k duplikování obsahu ve více doménách, ale obvykle nezpůsobují problémy. Problémy nastanou pouze tehdy, když poškrábaný nebo publikovaný obsah začne převyšovat originál na vašem webu.

dobrou zprávou je, že se jedná o vzácný výskyt, ale může se to stát.

má Google duplicitní trest za obsah?

Google několikrát uvedl, že nemají duplicitní obsah.

nemáme duplicitní trest za obsah. Není to tak, že bychom degradovali web za to, že má hodně duplicitního obsahu.
John Mueller, analytik trendů webmasterů Google

: There’s no such thing as a duplicate content penalty.
Susan Moskwa, Former Webmaster Trends Analyst Google

DYK Google doesn’t have a duplicate content penalty.
Gary Illyes, Webmaster Trends Analyst Google

But, this isn’t entirely true. Pokud je váš duplicitní obsah náhodný a není výsledkem úmyslné manipulace s výsledky vyhledávání nebo spamovými praktikami, nebudete penalizováni. Pokud ano, pak byste mohli.

Google potvrzuje, že:

Ve vzácných případech, v nichž Google vnímá, že duplicitní obsah může být zobrazen s cílem manipulovat s naším žebříčku a oklamání našich uživatelů, budeme také příslušné úpravy indexování a hodnocení stránek. V důsledku toho může trpět hodnocení webu nebo může být Web zcela odstraněn z indexu Google, v takovém případě se již nebude zobrazovat ve výsledcích vyhledávání.

otázkou je, co se počítá jako „záměr manipulovat s naším hodnocením a podvádět naše uživatele“?

Google o tom má spoustu informací. Ale v podstatě jsou to věci jako:

  • úmyslné vytváření více stránek, subdomén nebo domén se spoustou duplicitního obsahu.
  • Publikování hodně poškrábaný obsahu
  • Publikování affiliate obsah poškrábaný od Amazon nebo jiné weby (a přidávat žádná další hodnota)

Nicméně, jak je uvedeno výše, duplicitní obsah může ještě ublížit SEO—i bez trestu.

běžné příčiny duplicitního obsahu

neexistuje jediná příčina duplicitního obsahu. Je jich mnoho.

Faceted / filtrovaná navigace

Faceted navigace je místo, kde mohou uživatelé filtrovat a třídit položky na stránce. Webové stránky elektronického obchodu to hodně používají.

tento druh navigace připojí parametry na konec adresy URL.

Protože tam jsou obvykle mnoho kombinací těchto filtrů, fasetová navigace má často za následek spoustu duplicitní nebo téměř duplicitní obsah.

podívejte se na tyto dvě stránky, například:

adresy URL jsou jedinečné, ale obsah je téměř totožný.

navíc na pořadí parametrů často nezáleží. Například stejná stránka je přístupná na obou těchto adresách URL:

jak vyřešit tento problém

Faceted navigation je komplexní šelma. Pokud máte podezření, že je to příčinou problémů s duplicitním obsahem, přečtěte si toto.

parametry sledování

parametrizované adresy URL se také používají pro účely sledování. Například, můžete použít UTM parametry pro sledování návštěv z newsletter kampaně v Google Analytics:

Příklad: example.com/page?utm_source=newsletter

Jak tento problém vyřešit

Canonicalize vaše parametrizované Url na SEO-friendly verze bez parametrů pro měření.

ID relací

id relací ukládají informace o vašich návštěvnících. Obvykle k URL připojují dlouhý řetězec takto:

příklad: example.com?sessionId=jow8082345hnfn9234

How to solve this issue

Canonicalize the URLs to SEO-friendly versions.

HTTPS vs. HTTP, and non-www vs. www

Most websites are accessible at one of these four variations:

  • https://www.example.com (HTTPS, www)
  • https://example.com (HTTPS, non-www)
  • http://www.example.com (HTTP, www)
  • http://example.com (HTTP, non-www)

If you’re using HTTPS, it’ll be one of the first two. Ať už je to www nebo non-www verze je vaše volba.

Pokud však server správně nenakonfigurujete, bude váš web přístupný ve dvou nebo více z těchto variant. To není dobré a může vést k duplicitním problémům s obsahem.

jak tento problém vyřešit

použijte přesměrování, abyste zajistili, že vaše webové stránky budou přístupné pouze na jednom místě.

adresy URL citlivé na velká a malá písmena

Google vidí adresy URL citlivé na velká a velká písmena.

adresy URL jsou velká a malá písmena, ale Vyberte libovolný případ.— 🍌 John ((@JohnMu) June 22, 2017

Sidenote.

to se nezdá být případ Bing, který zachází se všemi adresami URL jako malými písmeny.

To znamená, že tyto tři adresy Url jsou různé:

  • example.com/page
  • example.com/PAGE
  • example.com/pAgE
Jak tento problém vyřešit

Být v souladu s vnitřní odkazy (tedy, ne vnitřně odkaz na více verzí Url). Pokud to nevyřeší věci, můžete vždy kanonizovat nebo přesměrovat.

koncové lomítka vs. non-trailing-lomítka

Google považuje adresy URL s lomítkem a bez něj za jedinečné. To znamená, že tyto dvě adresy jsou unikátní v Google očí:

  • example.com/page/
  • example.com/page

Pokud je váš obsah je přístupný na obě adresy Url, pak to může vést k duplicitní obsah otázky.

Chcete-li zkontrolovat, zda se jedná o problém, zkuste načíst stránku s lomítkem nebo bez něj. V ideálním případě se načte pouze jedna verze. Druhý bude přesměrován.

Pokud se například pokusíte načíst tento příspěvek bez lomítka, přesměruje se na adresu URL s lomítkem.

Google uvádí, že toto chování je ideální.

Pokud lze vrátit pouze jednu verzi (tj. Toto chování je prospěšné, protože snižuje duplicitní obsah.

Jak tento problém vyřešit

Přesměrování na nežádoucí verze (např. bez koncové lomítko) na požadovanou verzi (např, s koncové lomítko). Měli byste se také ujistit, že zůstanete v souladu s interním propojením. Nepřipojujte se k verzím s koncovými lomítky někdy a bez jiných časů. Vyberte si jeden a držte se ho.

Tiskové adresy URL

tiskové verze mají stejný obsah jako originál. Liší se pouze Adresa URL.

  • example.com/page
  • example.com/print/page
Jak tento problém vyřešit

Canonicalize print-friendly verze k originální.

mobilní adresy URL

mobilní adresy, jako jsou adresy URL vhodné pro tisk, jsou duplikáty.

  • example.com/page
  • m. příklad.com / page
jak vyřešit tento problém

Kanonizujte verzi pro mobilní zařízení na původní. Použijte rel= „alternate“ a řekněte společnosti Google, že adresa URL vhodná pro mobily je alternativní verzí obsahu na ploše.

doporučené čtení: anotace pro stolní a mobilní adresy url

AMP URL

Accelerated Mobile Pages (AMP) jsou duplikáty.

  • example.com/page
  • example.com/amp/page
Jak tento problém vyřešit

Canonicalize AMP verze non-AMP verze. Použijte rel="amphtml" a řekněte společnosti Google, že adresa URL AMP je alternativní verzí obsahu jiného než AMP.

Pokud máte pouze obsah AMP, použijte kanonickou značku s vlastním odkazem.

doporučené čtení: aby vaše stránky zjistitelné-amp.dev

stránky značek a kategorií

většina CMS vytváří vyhrazené stránky značek, když používáte značky.

Pokud máte například článek o organickém syrovátkovém proteinu a jako značky používáte jak „proteinový prášek“, tak „syrovátku“, skončíte se dvěma stránkami značek, jako jsou tyto:

to samo o sobě ne vždy způsobuje duplicitní obsah, ale může.

to je případ, protože na webu je pouze jedna stránka s těmito dvěma značkami—takže každá stránka značky je identická.

Jak tento problém vyřešit

Dvě možnosti:

  1. nepoužívejte tagy. Většinu času, stejně nemají žádnou hodnotu.
  2. Noindex své stránky značky. To nevyřeší problém procházení rozpočtu, protože Google bude stále ztrácet čas procházením těchto stránek.

Všimněte si, že stránky kategorií mohou způsobit podobné problémy jako stránky značek. Příklad:

obě tyto stránky jsou téměř identické, protože v žádné kategorii nejsou uvedeny žádné produkty. Takže nám zbývá jen kopie šablony kotle.

vyřešte to pomocí přiměřeného počtu kategorií na vašem webu, nebo dokonce bez použití stránek kategorií.

adresy URL obrázků příloh

mnoho CMS vytváří vyhrazené stránky pro přílohy obrázků. Tyto stránky obvykle neukazují nic jiného než obrázek a nějakou kopii kotle.

protože je tato kopie stejná na všech automaticky generovaných stránkách, vede k duplicitnímu obsahu.

jak tento problém vyřešit

zakažte vyhrazené stránky pro obrázky ve vašem CMS. Ve WordPressu to můžete provést pomocí pluginu, jako je Yoast.

stránkované Komentáře

WordPress a další CMS umožňují stránkované Komentáře. To způsobuje duplicitní obsah, protože efektivně vytváří více verzí stejných adres URL.

  • example.com/post/
  • example.com/post/comment-page-2
  • example.com/post/comment-page-3
Jak tento problém vyřešit

vypněte komentář stránkování nebo noindex vaše očíslovanými stránkami pomocí plugin jako Yoast.

Lokalizace

Pokud jste sloužící podobný obsah pro lidi, v různých lokalitách, kteří mluví stejným jazykem, pak to může způsobit duplicitní obsah.

například můžete mít různé verze vašeho webu pro lidi v USA, Velké Británii a Austrálii. Protože tam jsou pravděpodobně pouze o drobné rozdíly mezi obsahem podává každé národní prostředí (např., ceny v dolarech versus liber šterlinků), verze se budou blízké duplicity.

Sidenote.

podle Johna Muellera není přeložený obsah duplicitním obsahem.

jak vyřešit tento problém

pomocí značek hreflang informujte vyhledávače o vztahu mezi variacemi.

stránky s výsledky vyhledávání

spousta webových stránek má vyhledávací pole. Jejich použití vás obvykle přenese na parametrizovanou adresu URL vyhledávání.

Příklad: příklad.com?q=search-term

Google je bývalý Šéf Webspamový, Matt Cutts prohlásil, že:

Typicky, výsledky vyhledávání na webu nechcete přidat hodnotu pro uživatele, a protože náš hlavní cíl je poskytovat nejlepší výsledky vyhledávání je to možné, jsme se obecně vyloučit výsledky hledání z našich web search index. (Ne všechny adresy URL, které obsahují věci jako „/results“ nebo „/search“, jsou samozřejmě výsledky vyhledávání.)
Matt Cutts, Bývalý Šéf Webspamový Google

Jak tento problém vyřešit

Použití metaznačky robots odstranit search stránky z indexu Google nebo blokovat přístup na stránky s výsledky vyhledávání v roboty.txt. Vyhněte se internímu propojení na stránky s výsledky vyhledávání.

Pracovní prostředí

pracovní prostředí je duplicitní nebo téměř duplicitní verze webu použity pro účely testování.

představte si například, že chcete nainstalovat nový plugin nebo změnit nějaký kód na svém webu. Možná nebudete chtít tlačit přímo na živé stránky se stovkami tisíc denních návštěvníků. Riziko katastrofy je příliš vysoké. Řešením je nejprve otestovat změny ve stagingovém prostředí.

pracovní prostředí se stává problémem SEO, když je Google indexuje, protože má za následek duplicitní obsah.

Jak tento problém vyřešit

Chraňte své pracovní prostředí pomocí HTTP autentizace, IP whitelisting, nebo VPN přístup. Pokud je již indexována, použijte směrnici robots noindex, abyste ji odstranili.

jak zkontrolovat duplicitní obsah na vašem webu

přejděte na audit webu Ahrefs a spusťte procházení.

po dokončení přejděte ke zprávě o kvalitě obsahu.

hledejte shluky duplikátů a téměř duplikátů bez kanonického. Ty jsou zvýrazněny oranžově.

kliknutím na některý z těchto clusterů zobrazíte postižené stránky.

Prozkoumejte důvod duplicitního obsahu a poté proveďte příslušnou akci.

Všimněte si, že to nebudou vždy problémy, které je třeba napravit, zejména v případě blízkých duplikátů.

není uživatel Ahrefs?

vyhledejte tato varování týkající se duplicitního obsahu ve Vyhledávací konzoli Google:

  • Duplicitní, aniž by uživatel-vybrané kanonické
  • Duplicitní, Google zvolil jiné než kanonické uživatele
  • Duplicitní, předložené URL není vybrána jako kanonické

Dozvědět se více o tom, jak se vypořádat s těmito varování.

Chcete-li zjistit, jak Google zachází s konkrétní adresou URL, použijte nástroj pro kontrolu adres URL.

můžete se také podívat na duplicitní název značky, meta popisy, a H1s v HTML tagy zpráva.

Špatné duplikáty jsou to, co hledáte. Jedná se o stránky s duplicitními metaznačkami, ale různými kanoniky.

Vyberte je kliknutím na přepínač „Špatné duplikáty“ pod HTML tagy & obsah.

kliknutím na některý ze žlutých pruhů zobrazíte postižené stránky.

stránky s duplicitními názvy, meta popisy nebo H1 jsou často velmi podobné.

například tyto dva mají stejnou značku názvu a obsah je téměř totožný, protože produkt je stejný. Jediný rozdíl je v tom, že jedna ze stránek je pro 3‑pack instant lighting firelogs, zatímco druhá je pouze pro jednu.

Google uvádí, že by měl minimalizovat podobný obsah jako toto:

Pokud máte mnoho stránek, které jsou podobné, zvážit rozšíření každou stránku nebo upevnění stránek do jedné.

je však nepravděpodobné, že by malý počet podobných stránek byl velkým problémem.

jak zkontrolovat problémy s duplicitním obsahem na webu

škrábání a syndikace obsahu může také vést k problémům s duplicitním obsahem. Ale je to obvykle problém, pouze pokud vidíte poškrábané verze vašeho obsahu, které vás převyšují.

stává se to? Ano, ale často je to spíše problém pro nové nebo slabé webové stránky. Proč? Protože weby, které škrábají váš obsah, jsou často autoritativnější. To někdy“ přiměje “ Google, aby si myslel, že jejich je originál.

Pokud máte malý web, můžete často najít poškrábaný obsah vyhledáním úryvku textu z vaší stránky v uvozovkách.

pro větší weby budete muset použít automatizovaný nástroj, jako je Copyscape. Tím se na webu vyhledávají další výskyty obsahu na vašich stránkách.

bez ohledu na metodu, kterou používáte, většina výsledků bude ze spamových a nekvalitních webů.

obecně lze říci, že se nemusíte bát. Nicméně, pokud zjistíte, že legitimní webové stránky, poškrábaný váš obsah, a jsou obavy, že to může být krást vaše provozu, hodit URL do Ahrefs‘ Site Explorer vidět ekologické dopravy odhad.

Pokud získává větší návštěvnost než vaše stránka, může dojít k problému.

V tomto případě, máte tři možnosti:

  1. Oslovit a požádat o odstranění obsahu.
  2. oslovte a požádejte, aby přidali kanonický odkaz na originál na vašem webu.
  3. odeslat požadavek DMCA takedown přes Google.

pokud záměrně syndikujete obsah na jiné webové stránky, stojí za to požádat je, aby k originálu přidali kanonický odkaz. Tím se eliminuje riziko duplicitních problémů s obsahem.

publikování obsahu na vašem vlastním webu?

Pokud jste publikování obsahu od ostatních na vaše stránky, existují dva způsoby, jak zabránit duplicitní obsah otázky:

  1. Canonicalize zpět na původní.
  2. Noindex stránky.

Závěrečné myšlenky

se příliš nestresují nad duplicitním obsahem. Obvykle je to mnohem menší problém,než se předpokládá.

Pokud máte několik duplicitních nebo téměř duplicitních stránek, pravděpodobně nebude problém. Totéž platí při citování obsahu z jiného webu nebo jiných stránek na vašem webu. Malé množství duplikátu nebo obsahu varné desky by mělo být v pořádku. Google má zavedené systémy, které takové věci řeší.

to, Co budete muset být na pozoru pro technické SEO nehody, které vedou ke generaci stovky nebo tisíce stránek, duplicitní obsah, jako je například nesprávné provádění fasetová navigace na stránkách elektronického obchodu.

ty mohou mimo jiné způsobit zmatek ve vašem rozpočtu procházení.



Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.