Duplikat Innhold: Hvorfor Det Skjer og Hvordan Å Fikse det
Ønsker du å lære hva duplikat innhold er, og hvordan DET kan skade DIN SEO?
Duplikatinnhold er en kilde til konstant angst for mange nettstedseiere.
Les nesten alt om det, og du vil komme unna å tro at nettstedet ditt er en tikkende bombe av duplikat innhold problemer. En Google-straff er bare dager unna.Heldigvis er Dette Ikke sant-men duplikatinnhold kan fortsatt forårsake SEO-problemer. Og med 25-30% av nettet som duplikatinnhold, er det nyttig å vite hvordan du kan unngå og fikse slike problemer.
i denne veiledningen lærer Du:
- hva duplikat innhold er;
- Hvorfor duplikat innhold er dårlig FOR SEO;
- Om Google har en duplikat innholdsstraff;
- Vanlige årsaker til duplikatinnhold;
- hvordan sjekke for (og fikse) duplikatinnhold
Hva er duplikatinnhold?
Duplikat innhold er nøyaktig eller nesten duplikat innhold som vises på nettet på mer enn ett sted. Det kan forekomme på et enkelt nettsted eller på tvers av domener.
for eksempel, hvis jeg skulle publisere dette innlegget på ahrefs.com/blog/duplicate-content-copy/
, så ville det være duplikat innhold. Det ville også være sant hvis jeg skulle publisere det på et annet nettsted.
Google sier at mest duplikat innhold ikke er villedende opprinnelse.
hvorfor er duplikatinnhold dårlig FOR SEO?
Duplikatinnhold kan skade SEO-ytelsen din av noen grunner.
- Uønskede Eller uvennlige Nettadresser i søkeresultatene;
- tilbakekobling fortynning;
- Burns crawl budsjett;
- Skrapt eller syndikert innhold outranking deg.
la oss utforske disse i mer dybde.
Uønskede Eller uvennlige Nettadresser i søkeresultatene
Tenk deg at den samme siden er tilgjengelig på tre Forskjellige Nettadresser:
- domain.com/page/
- domain.com/page/?utm_content=buffer &utm_medium=sosial
- domain.com/category/page /
den første skal dukke opp i søkeresultatene, Men Google kan få dette galt. Hvis det skjer, kan en uønsket URL ta sin plass.Fordi folk kan være mindre tilbøyelige til å klikke PÅ en uvennlig URL, kan du få mindre organisk trafikk.
tilbakekoblingsfortynning
hvis det samme innholdet er tilgjengelig på mange Nettadresser, kan hver Av Disse Nettadressene tiltrekke seg tilbakekoblinger. Det resulterer i splitting av «link equity» mellom Nettadresser.
for å vise et eksempel på dette i naturen, ta en titt på disse to sidene på buffer.com:
disse sidene er nesten eksakte duplikater. Og de har henholdsvis 106 og 144 henvisende domener (lenker fra unike nettsteder).
før du panikk, vet at Dette ikke alltid er et problem på grunn Av Hvordan Google håndterer duplikatinnhold.
enkelt sagt, når de oppdager duplikatinnhold, grupperer De Nettadressene i en klynge. De deretter «velge hva tror er den ‘beste’ URL for å representere klyngen i søkeresultatene » og «konsolidere egenskapene Til Nettadressene i klyngen, for eksempel link popularitet, til representant URL.»
Så, I tilfellet ovenfor, Bør Google bare vise En Av Nettadressene i organisk søk og tilordne alle henvisende domener i klyngen (106+144) til DEN NETTADRESSEN.
men det er ikke det som skjer, da vi ser Begge Nettadressene i Google for lignende søkeord.
I dette tilfellet konsoliderer Google sannsynligvis ikke «link equity» på EN URL.
Vi kan ikke være sikker På Hvordan Google ser Disse To Nettadressene, da vi ikke har tilgang Til Buffers Google Search Console-konto. Det kan være at De ser Begge Disse Nettadressene som duplikater, og en av dem vil forsvinne fra organisk søk snart.
Burns crawl budget
Google finner nytt innhold på nettstedet ditt via crawling, noe som betyr at De følger koblinger fra eksisterende sider til nye sider. De har også recrawl sider de vet om fra tid til annen for å se om noe har endret seg.
å ha duplikat innhold tjener bare til å skape mer arbeid for dem. Det kan påvirke hastigheten og frekvensen de gjennomsøker nye eller oppdaterte sider med.
det er dårlig fordi det kan føre til forsinkelser i indeksering av nye sider og reindeksering av oppdaterte sider.
Skrapt innhold overgår deg
Av og til kan du tillate et annet nettsted å publisere innholdet ditt. Dette kalles syndikering. Andre ganger kan nettsteder skrape innholdet ditt og publisere det uten tillatelse.
Begge disse scenariene fører til duplikatinnhold på tvers av flere domener, men de forårsaker vanligvis ikke problemer. Det er først når det skrapede eller republiserte innholdet begynner å rangere originalen på nettstedet ditt at problemer oppstår.
den gode nyheten er at dette er en sjelden forekomst, men det kan skje.
Har Google en duplikat innholdsstraff?
Google har ved flere anledninger uttalt at De ikke har en duplikat innholdsstraff.
vi har ikke en duplikat innholdsstraff. Det er ikke det at vi ville degradere et nettsted for å ha mye duplikat innhold.
John Mueller, Webmaster Trender Analytiker Google
La oss sette dette til sengs en gang for alle, folkens: There’s no such thing as a duplicate content penalty.Susan Moskwa, Former Webmaster Trends Analyst Google
DYK Google doesn’t have a duplicate content penalty.Gary Illyes, Webmaster Trends Analyst Google
But, this isn’t entirely true. Hvis ditt duplikatinnhold er tilfeldig og ikke et resultat av forsettlig manipulering av søkeresultater eller spammy praksis, vil du ikke bli straffet. Hvis det er, så kan du.
Google bekrefter at Her:
I de sjeldne tilfellene Der Google oppfatter at duplikatinnhold kan vises med hensikt å manipulere våre rangeringer og bedra våre brukere, vil Vi også gjøre passende justeringer i indekseringen og rangeringen av de involverte nettstedene. Som et resultat kan rangeringen av nettstedet lide, eller nettstedet kan bli fjernet helt Fra Google-indeksen, i så fall vil det ikke lenger vises i søkeresultatene.
spørsmålet er, hva teller som «hensikt å manipulere våre rangeringer og lure våre brukere»?
Google har mye informasjon om det her. Men i utgangspunktet er det ting som:
- Forsettlig å lage flere sider, underdomener eller domener med mye duplikatinnhold.
- Publisering av mye skrapt innhold
- Publisering av tilknyttet innhold skrapt fra Amazon eller andre nettsteder (og legger ingen tilleggsverdi)
men som diskutert ovenfor kan duplikatinnhold fortsatt skade SEO – selv uten straff.
Vanlige årsaker til duplikatinnhold
det er ingen enkelt årsak til duplikatinnhold. Det er mange.
Fasettert / filtrert navigasjon
Fasettert navigasjon er der brukere kan filtrere og sortere elementer på siden. E-handel nettsteder bruker det mye.
denne typen navigasjon legger parametere til SLUTTEN AV URL-ADRESSEN.
fordi det vanligvis er mange kombinasjoner av disse filtrene, resulterer fasettert navigasjon ofte i mye duplikat eller nesten duplikat innhold.
Ta en titt på disse to sidene, for eksempel:
Nettadressene er unike, men innholdet er nesten identisk.
i Tillegg spiller rekkefølgen av parametrene ofte ingen rolle. For eksempel er den samme siden tilgjengelig på begge Disse Nettadressene:
Fasettert navigasjon er et komplekst dyr. Hvis du mistenker at dette er årsaken til duplikat innhold problemer, bare les dette.
Sporingsparametere
Parameteriserte Nettadresser brukes også til sporingsformål. Du kan for Eksempel bruke utm-parametere til å spore besøk fra en nyhetsbrevkampanje I Google Analytics:
Eksempel: example.com/page?utm_source=newsletter
Canonicaliser parameteriserte Nettadresser TIL SEO-vennlige versjoner uten sporingsparametere.
Økt-Ider
Økt-Ider lagrer informasjon om dine besøkende. DE legger vanligvis en lang streng TIL NETTADRESSEN slik:
Eksempel: example.com?sessionId=jow8082345hnfn9234
Canonicalize the URLs to SEO-friendly versions.
HTTPS vs. HTTP, and non-www vs. www
Most websites are accessible at one of these four variations:
- https://www.example.com (HTTPS, www)
- https://example.com (HTTPS, non-www)
- http://www.example.com (HTTP, www)
- http://example.com (HTTP, non-www)
If you’re using HTTPS, it’ll be one of the first two. Enten det er www eller ikke-www versjon er ditt valg.
hvis du imidlertid ikke konfigurerer serveren på riktig måte, vil nettstedet ditt være tilgjengelig på to eller flere av disse variasjonene. Det er ikke bra og kan føre til dupliserte innholdsproblemer.
Bruk omdirigeringer for å sikre at nettstedet ditt bare er tilgjengelig på ett sted.
Store Og Små Bokstaver
Google ser Nettadresser som store og små bokstaver.
Nettadresser er case-sensitive, men velg hvilken sak du vil.- 🍌 John 🍌 (@JohnMu) 22. juni 2017
Dette ser ikke ut Til Å være Tilfelle For Bing, som behandler Alle Nettadresser som små bokstaver.
det betyr at Disse Tre Nettadressene er alle forskjellige:
- example.com/page
- example.com/PAGE
- example.com/pAgE
Vær i samsvar med interne lenker(dvs. ikke internt lenke til flere versjoner Av Nettadresser). Hvis det ikke løser ting, kan du alltid kanonisere eller omdirigere.
Etterfølgende skråstreker vs. ikke-etterfølgende skråstreker
Google behandler Nettadresser med og uten etterfølgende skråstreker som unike. Det betyr at Disse To Nettadressene er unike I Googles øyne:
- example.com/page/
- example.com/page
hvis innholdet ditt er tilgjengelig på Begge Nettadressene, kan det føre til problemer med duplikatinnhold.
for å sjekke om dette er et problem, prøv å laste inn en side med og uten skråstrek. Ideelt sett vil bare en versjon lastes. Den andre vil omdirigere.
hvis du for eksempel prøver å laste inn dette innlegget uten skråstrek, vil DET omdirigere TIL NETTADRESSEN med skråstrek.
Google sier at denne oppførselen er ideell.
Hvis bare en versjon kan returneres (dvs. den andre omdirigerer til den), det er flott! Denne virkemåten er gunstig fordi den reduserer duplikatinnhold.
Omdirigere uønsket versjon (f.eks uten etterfølgende skråstrek) til ønsket versjon (f. eks med etterfølgende skråstrek). Du bør også sørge for å være konsekvent med intern linking. Ikke koble til versjoner med etterfølgende skråstreker noen ganger, og uten andre ganger. Velg en og hold deg til den.
Utskriftsvennlige Nettadresser
Utskriftsvennlige versjoner har samme innhold som originalen. DET er BARE NETTADRESSEN som er forskjellig.
- example.com/page
- example.com/print/page
Kanoniser den utskriftsvennlige versjonen til originalen.
Mobilvennlige Nettadresser
Mobilvennlige Nettadresser, som utskriftsvennlige Nettadresser, er duplikater.
- example.com/page
- m.eksempel.com/page
Kanoniser den mobilvennlige versjonen til originalen. Bruk rel= «alternate» for Å fortelle Google At den mobilvennlige NETTADRESSEN er en alternativ versjon av skrivebordsinnholdet.
Anbefalt lesing: Merknader for stasjonære Og mobile Nettadresser
AMP-Nettadresser
Accelerated Mobile Pages (AMP) er duplikater.
- example.com/page
- example.com/amp/page
Kanoniser AMP-versjonen til ikke-AMP-versjonen. Bruk rel="amphtml"
for Å fortelle Google At AMP-NETTADRESSEN er en alternativ versjon av ikke-AMP-innholdet.
hvis DU bare HAR AMP-innhold, bruk en selvrefererende kanonisk tag.
Anbefalt lesing: Gjør sidene dine synlig-amp.dev
Tag og kategorisider
De FLESTE CMS’ lage dedikerte koder sider når du bruker koder.hvis du for eksempel har en artikkel om organisk myseprotein, og du bruker både «proteinpulver» og «whey» som koder, vil du ende opp med to taggsider som disse:
det forårsaker ikke alltid duplikatinnhold i seg selv, men det kan.
det er tilfellet her fordi det bare er en side på nettstedet med de to kodene—så hver taggside er identisk.
To alternativer:
- ikke bruk tagger. Mesteparten av tiden har de liten eller ingen verdi uansett.
- Noindex dine tagger sider. Dette løser ikke problemet med gjennomsøkingsbudsjett, Da Google fortsatt vil kaste bort tid på å gjennomsøke disse sidene.
merk at kategorisider kan føre til lignende problemer på taggsider. Case in point:
Begge disse sidene er nesten identiske fordi det ikke er noen produkter oppført under noen av kategoriene. Så alt vi er igjen med er boilerplate mal kopi.
Løs dette ved å bruke et rimelig antall kategorier på nettstedet ditt, eller til og med noindexing kategorisidene dine.
Vedlegg bilde Urler
mange CMS’ lage dedikerte sider for bildevedlegg. Disse sidene viser vanligvis ingenting, men bildet og noen standardtekst kopi.
fordi denne kopien er den samme på alle automatisk genererte sider, fører den til duplikat innhold.
Deaktiver dedikerte sider for bilder i CMS. I WordPress kan Du gjøre dette ved hjelp Av et plugin som Yoast.
Paginerte kommentarer
WordPress og ANDRE CMS’ tillater paginerte kommentarer. Dette fører til duplikat innhold som det effektivt skaper flere versjoner av De samme Nettadressene.
- example.com/post/
- example.com/post/comment-page-2
- example.com/post/comment-page-3
Slå av kommentar paginering eller noindex dine paginerte sider ved hjelp Av en plugin som Yoast.
Lokalisering
hvis du serverer lignende innhold til personer på forskjellige steder som snakker samme språk, kan det føre til duplikatinnhold.
du kan for eksempel ha forskjellige versjoner av nettstedet ditt for personer I USA, STORBRITANNIA og Australia. Fordi det sannsynligvis bare er små forskjeller mellom innholdet som serveres til hver lokalitet (f.eks. priser i dollar mot pund sterling), vil versjonene være nær duplikater.
Bruk hreflang-koder for å fortelle søkemotorer om forholdet mellom variasjonene.
søkeresultatsider
Mange nettsteder har søkebokser. Ved hjelp av disse vanligvis tar deg til en parameterisert søk URL.
Eksempel: example.com?q=search-term
Googles Tidligere Leder Av Webspam, Matt Cutts, uttalte at:
vanligvis gir ikke søkeresultater verdi til brukerne, og siden vårt hovedmål er å gi de beste søkeresultatene mulig, ekskluderer vi generelt søkeresultater fra vår websøkindeks. (Ikke Alle Nettadresser som inneholder ting som «/ resultater «eller» / søk » er søkeresultater, selvfølgelig.)
Matt Cutts, Tidligere Leder Av Webspam Google
Bruk en metatag for roboter til å fjerne søkesider Fra Google indeksere eller blokkere tilgang til søkeresultatsider i roboter.txt. Avstå fra internt linking til søkeresultatsider.
Staging environment
et staging miljø er en duplikat eller nesten duplikat versjon av nettstedet ditt som brukes til testformål.
tenk deg for eksempel at du vil installere en ny plugin eller endre noen kode på nettstedet ditt. Du vil kanskje ikke presse det rett til et live nettsted med hundretusener av daglige besøkende. Risikoen for katastrofe er for høy. Løsningen er å teste endringene i et staging miljø først.
Staging miljøer blir EN SEO problem Når Google indekserer dem fordi det resulterer i duplikat innhold.
Beskytt staging-miljøet ditt ved HJELP AV HTTP-godkjenning, IP-hvitelisting eller VPN-tilgang. Hvis det allerede er indeksert, bruk et robots noindex-direktiv for å få det fjernet.
slik sjekker du etter duplikatinnhold på nettstedet ditt
Gå over Til Ahrefs’ Nettstedsrevisjon og start en gjennomgang.
når du er ferdig, går du til Innholdskvalitetsrapporten.
Se etter klynger av duplikater og nær duplikater uten en kanonisk. Disse er uthevet i oransje.
Klikk på en av disse klyngene for å se de berørte sidene.
Undersøk årsaken til duplikatinnholdet, og ta deretter de nødvendige tiltakene.
Merk at disse ikke alltid vil være problemer som må rettes opp, spesielt når det gjelder nær duplikater.
Se etter disse duplikat-innholdsrelaterte advarslene I Google Search Console:
- Dupliser Uten bruker valgt kanonisk
- Dupliser, google valgte annerledes kanonisk enn bruker
- Dupliser, innsendt URL ikke valgt som kanonisk
Lær mer om hvordan du håndterer disse advarslene her.
hvis Du vil se Hvordan Google behandler en BESTEMT NETTADRESSE, bruker DU Verktøyet For Nettadresseinspeksjon.
du kan også se etter dupliserte tittelkoder, meta beskrivelser og H1s i HTML-koder rapporten.
Bad duplikater er det du leter etter. Dette er sider med dupliserte metakoder, men forskjellige kanonicaler.
Velg disse ved å klikke på «Bad duplikater» veksle UNDER HTML-koder & innhold.
Klikk på en av de gule linjene for å se de berørte sidene.
Sider med like titler, meta beskrivelser eller H1 er ofte svært like.
for eksempel har disse to samme tittelkode, og innholdet er nesten identisk fordi produktet er det samme. Den eneste forskjellen er at en av sidene er for en 3-pakke med instant lighting firelogs, mens den andre er for bare en.
Google sier At du bør minimere lignende innhold som dette:
hvis du har mange sider som er like, bør du vurdere å utvide hver side eller konsolidere sidene til en.
et lite antall lignende sider er imidlertid lite sannsynlig å være mye av et problem.
slik sjekker du etter problemer med duplikatinnhold på nettet
innholdskraping og syndikering kan også føre til problemer med duplikatinnhold. Men det er bare vanligvis et problem hvis du ser skrapede versjoner av innholdet ditt som overgår deg.
skjer det? Ja, men det er ofte mer et problem for nye eller svake nettsteder. Hvorfor? Fordi nettstedene som skraper innholdet ditt, ofte er mer autoritative. Det noen ganger «triks» Google til å tro at deres er originalen.
hvis du har et lite nettsted, kan du ofte finne skrapt innhold ved Å søke På Google etter en tekstbit fra siden din i anførselstegn.
for større nettsteder må du bruke et automatisert verktøy som Copyscape. Dette søker på nettet etter andre forekomster av innholdet på siden(e) din (e).
Uansett hvilken metode du bruker, vil de fleste resultatene være fra spammy og lav kvalitet nettsteder.
Generelt sett er dette ingenting å bekymre seg for. Men hvis du ser at et legitimt nettsted skrapte innholdet ditt, og er bekymret for at det kan stjele trafikken din, kaster DU NETTADRESSEN til Ahrefs’ Site Explorer for å se et organisk trafikkestimat.
hvis det blir mer trafikk enn siden din, kan det være et problem.
I dette tilfellet har du tre alternativer:
- Nå ut og be om at de fjerner innholdet.
- Nå ut og be om at de legger til en kanonisk lenke til originalen på nettstedet ditt.
- Send INN EN DMCA-takedown-forespørsel via Google.
hvis du forsettlig syndikerer innhold til andre nettsteder, er det verdt å be dem om å legge til en kanonisk lenke til originalen. Det vil eliminere risikoen for duplikat innhold problemer.
hvis du publiserer innhold fra andre på nettstedet ditt, er det to måter å forhindre problemer med duplikatinnhold på:
- Kanonisere tilbake til originalen.
- Noindex siden.
Siste tanker
ikke stress over duplikat innhold for mye. Det er vanligvis mye mindre av et problem enn det antas å være.
hvis du har en håndfull dupliserte eller nesten dupliserte sider, er det lite sannsynlig å være mye av et problem. Det samme gjelder når du siterer innhold fra et annet nettsted eller andre sider på nettstedet ditt. Små mengder duplikat eller boilerplate innhold bør være i orden. Google har systemer på plass for å håndtere slike ting.hva du trenger å være på utkikk etter er teknisk SEO uhell som fører til generering av hundrevis eller tusenvis av sider med duplikat innhold, for eksempel feil implementering av fasettert navigasjon på e-handel nettsteder.
Disse kan skape kaos på gjennomsøkingsbudsjettet ditt, blant annet.