Duplicate Content: hvorfor det sker, og hvordan man løser det
Duplicate content er en kilde til konstant angst for mange site ejere.
Læs næsten alt om det, og du vil komme væk at tro, at din hjemmeside er en tikkende bombe af dublerede indhold spørgsmål. En Google-straf er kun dage væk.
heldigvis er dette ikke sandt-men duplikatindhold kan stadig forårsage SEO-problemer. Og med 25-30% af internettet er duplikatindhold, er det nyttigt at vide, hvordan man undgår og løser sådanne problemer.
i denne vejledning lærer du:
- hvad duplikatindhold er;
- hvorfor duplikatindhold er dårligt for SEO;
- Om Google har en straf for duplikatindhold;
- almindelige årsager til duplikatindhold;
- Sådan kontrolleres (og rettes) duplikatindhold
Hvad er duplikatindhold?
Duplicate content er nøjagtigt eller næsten duplikeret indhold, der vises på internettet mere end et sted. Det kan forekomme på en enkelt hjemmeside eller på tværs af domæner.
for eksempel, hvis jeg skulle genudgive dette indlæg på ahrefs.com/blog/duplicate-content-copy/
, så ville det være duplikatindhold. Det ville også være tilfældet, hvis jeg skulle genudgive det på en anden hjemmeside.
Google siger, at de fleste duplikatindhold ikke er vildledende.
Hvorfor er duplicate content dårligt for SEO?
duplikeret indhold kan skade din SEO-ydeevne af nogle få grunde.
- uønskede eller uvenlige URL ‘ er i søgeresultaterne;
- backlink fortynding;
- Burns gennemgå budget;
- skrabet eller syndikeret indhold, der overstiger dig.
lad os undersøge disse mere dybtgående.
uønskede eller uvenlige URL ‘er i søgeresultaterne
Forestil dig, at den samme side er tilgængelig på tre forskellige URL’ er:
- domain.com/page/
- domain.com/page/?utm_content=buffer&utm_medium=social
- domain.com/category/page /
den første skal vises i søgeresultaterne, men Google kan få det forkert. Hvis det sker, kan en uønsket URL tage sin plads.
fordi folk kan være mindre tilbøjelige til at klikke på en uvenlig URL, kan du få mindre organisk trafik.
backlink fortynding
Hvis det samme indhold er tilgængeligt på mange URL ‘er, kan hver af disse URL’ er tiltrække backlinks. Det resulterer i opdeling af “link egenkapital” mellem URL ‘ er.
for at vise et eksempel på dette i naturen, se på disse to sider på buffer.com:
disse sider er næsten nøjagtige dubletter. Og de har henholdsvis 106 og 144 henvisende domæner (links fra unikke hjemmesider).
før du får panik, skal du vide, at dette ikke altid er et problem på grund af, hvordan Google håndterer duplikatindhold.
enkelt sagt, når de registrerer duplikatindhold, grupperer de URL ‘ erne i en klynge. De vælger derefter “hvad synes er den ‘bedste’ URL til at repræsentere klyngen i søgeresultaterne” og “konsoliderer egenskaberne for URL’ erne i klyngen, såsom link popularitet, til den repræsentative URL.”
så i ovenstående tilfælde skal Google kun vise en af URL ‘ erne i organisk søgning og tilskrive alle henvisende domæner i klyngen (106+144) til den URL.
men det er ikke hvad der sker, da vi ser begge URL ‘ er ranking i Google for lignende søgeord.
i dette tilfælde konsoliderer Google sandsynligvis ikke “link egenkapital” på en URL.
Vi kan ikke være sikre på, hvordan Google ser disse to URL ‘ er, da vi ikke har adgang til buffers Google Search Console-konto. Det kan være, at de ser begge disse URL ‘ er som duplikater, og en af dem forsvinder snart fra organisk søgning.
Burns gennemgå budget
Google finder nyt indhold på din hjemmeside via gennemgang, hvilket betyder, at de følger links fra eksisterende sider til nye sider. De søger også sider, de kender til fra tid til anden for at se, om noget har ændret sig.
at have duplikatindhold tjener kun til at skabe mere arbejde for dem. Det kan påvirke den hastighed og frekvens, hvormed de gennemgår dine nye eller opdaterede sider.
det er dårligt, fordi det kan føre til forsinkelser i indeksering af nye sider og genindeksering af opdaterede sider.
da Googles “grænse for gennemsøgningshastighed” er højere for mere responsive hjemmesider, er dette mere et problem for langsomme hjemmesider med mindre båndbreddegodtgørelser. Deres systemer vil også gennemgå de duplikerede URL ‘ er sjældnere.
skrabet indhold overstiger dig
lejlighedsvis kan du tillade en anden hjemmeside at genudgive dit indhold. Det kaldes syndikering. Andre gange kan sider skrabe dit indhold og genudgive det uden tilladelse.
begge disse scenarier fører til duplikeret indhold på tværs af flere domæner, men de forårsager normalt ikke problemer. Det er først, når det skrabede eller genudgivne indhold begynder at overgå originalen på din hjemmeside, at der opstår problemer.
den gode nyhed er, at dette er en sjælden begivenhed, men det kan ske.
har Google en dobbelt indholdsstraf?
Google har ved flere lejligheder erklæret, at de ikke har en dobbelt indholdsstraf.
vi har ikke en duplikat indholdsstraf. Det er ikke, at vi ville degradere et sted for at have en masse duplikatindhold.John Mueller, Trendanalytiker Google
lad os lægge dette i seng en gang for alle, folk: There’s no such thing as a duplicate content penalty.Susan Moskwa, Former Webmaster Trends Analyst Google
DYK Google doesn’t have a duplicate content penalty.Gary Illyes, Webmaster Trends Analyst Google
But, this isn’t entirely true. Hvis dit duplikatindhold er utilsigtet og ikke resultatet af forsætlig manipulation af søgeresultater eller spammy-praksis, bliver du ikke straffet. Hvis det er, så kan du måske.
Google bekræfter, at her:
i de sjældne tilfælde, hvor Google opfatter, at duplikatindhold kan vises med det formål at manipulere vores placeringer og bedrage vores brugere, foretager vi også passende justeringer i indekseringen og rangeringen af de involverede sider. Som et resultat kan placeringen af siden lide, eller siden kan fjernes helt fra Google-indekset, i hvilket tilfælde det ikke længere vises i søgeresultaterne.
spørgsmålet er, hvad der tæller som”hensigt at manipulere vores placeringer og bedrage vores brugere”?
Google har en masse oplysninger om det her. Men dybest set er det ting som:
- bevidst at oprette flere sider, underdomæner eller domæner med masser af duplikatindhold.udgivelse af tilknyttet indhold skrabet fra
eller andre sider (og tilføjer ingen yderligere værdi)
Som diskuteret ovenfor kan duplikatindhold dog stadig skade SEO—selv uden en straf.
almindelige årsager til duplikatindhold
der er ingen enkelt årsag til duplikatindhold. Der er mange.
facetteret/filtreret navigation
facetteret navigation er, hvor brugerne kan filtrere og sortere elementer på siden. E-handel hjemmesider bruger det meget.
denne form for navigation tilføjer parametre til slutningen af URL ‘ en.
da der normalt er mange kombinationer af disse filtre, resulterer facetteret navigation ofte i masser af duplikat-eller-næsten-duplikatindhold.
se på disse to sider, for eksempel:
URL ‘ erne er unikke, men indholdet er næsten identisk.
Plus, rækkefølgen af parametrene betyder ofte ikke noget. For eksempel er den samme side tilgængelig på begge disse URL ‘ er:
facetteret navigation er et komplekst dyr. Hvis du har mistanke om dette som årsagen til dine duplikatindholdsproblemer, skal du bare læse dette.
sporingsparametre
parameteriserede URL ‘ er bruges også til sporingsformål. Du kan f. eks. bruge UTM-parametre til at spore besøg fra en nyhedsbrevskampagne i Google Analytics:
eksempel: example.com/page?utm_source=newsletter
Kanonikaliser dine parameteriserede URL ‘ er til SEO-venlige versioner uden sporingsparametre.
Session-id ‘er
Session-id’ er gemmer oplysninger om dine besøgende. De tilføjer normalt en lang streng til URL ‘ en som sådan:
eksempel: example.com?sessionId=jow8082345hnfn9234
Canonicalize the URLs to SEO-friendly versions.
HTTPS vs. HTTP, and non-www vs. www
Most websites are accessible at one of these four variations:
- https://www.example.com (HTTPS, www)
- https://example.com (HTTPS, non-www)
- http://www.example.com (HTTP, www)
- http://example.com (HTTP, non-www)
If you’re using HTTPS, it’ll be one of the first two. Uanset om det er den anden eller ikke-anden version, er det dit valg.
men hvis du ikke konfigurerer din server korrekt, vil din hjemmeside være tilgængelig på to eller flere af disse variationer. Det er ikke godt og kan føre til duplikat indholdsproblemer.
brug omdirigeringer for at sikre, at din hjemmeside kun er tilgængelig på et sted.
store og små bogstaver
Google ser URL ‘ er som store og små bogstaver.
URL ‘ er er store og små bogstaver, men vælg det tilfælde, du ønsker.- Kristian John (@JohnMu) 22. juni 2017
dette synes ikke at være tilfældet for Bing, som behandler alle URL ‘ er som små bogstaver.
det betyder, at disse tre URL ‘er er alle forskellige:
- example.com/page
- example.com/PAGE
- example.com/pAgE
vær i overensstemmelse med interne links (dvs.ikke internt link til flere versioner af URL’ er). Hvis det ikke løser ting, kan du altid kanonikalisere eller omdirigere.
efterfølgende skråstreger vs. ikke-efterfølgende-skråstreger
Google behandler URL ‘ er med og uden efterfølgende skråstreger som unikke. Det betyder, at disse to URL ‘er er unikke i Googles øjne:
- example.com/page/
- example.com/page
Hvis dit indhold er tilgængeligt på begge URL’ er, kan det føre til duplikatindholdsproblemer.
for at kontrollere, om dette er et problem, skal du prøve at indlæse en side med og uden den efterfølgende skråstreg. Ideelt set indlæses kun en version. Den anden vil omdirigere.
Hvis du for eksempel forsøger at indlæse dette indlæg uden den efterfølgende skråstreg, omdirigeres det til URL ‘ en med den efterfølgende skråstreg.
Google siger, at denne adfærd er ideel.
Hvis kun en version kan returneres (dvs. den anden omdirigerer til den), er det godt! Denne adfærd er gavnlig, fordi den reducerer duplikatindhold.
omdirigere den uønskede version (f.eks. Du skal også sørge for at være i overensstemmelse med intern sammenkædning. Link ikke til versioner med efterfølgende skråstreger nogle gange og uden andre gange. Vælg en og hold dig til den.
printvenlige URL ‘ er
printvenlige versioner har samme indhold som originalen. Det er kun URL ‘ en, der adskiller sig.
- example.com/page
- example.com/print/page
Kanonikaliser den udskriftsvenlige version til originalen.
mobilvenlige URL ‘er
mobilvenlige URL’ er, som printvenlige URL ‘ er, er dubletter.
- example.com/page
- m.eksempel.com / page
Kanonikaliser den mobilvenlige version til originalen. Brug rel=” alternate ” til at fortælle Google, at den mobilvenlige URL er en alternativ version af desktopindholdet.
Anbefalet læsning: kommentarer til Desktop og mobile URL ‘er
AMP URL’ er
Accelerated Mobile Pages (AMP) er dubletter.
- example.com/page
- example.com/amp/page
Kanonikaliser AMP-versionen til den ikke-AMP-version. Brug rel="amphtml"
til at fortælle Google, AT AMP-URL ‘ en er en alternativ version af det ikke-AMP-Indhold.
Hvis du kun har AMP-indhold, skal du bruge et selvhenvisende kanonisk tag.
Anbefalet læsning: gør dine sider synlige-amp.dev
Tag og kategori sider
de fleste CMS’ Opret dedikerede tags sider, når du bruger tags.
for eksempel, hvis du har en artikel om økologisk valleprotein, og du bruger både “proteinpulver” og “valle” som tags, så ender du med to tagsider som disse:
det forårsager ikke altid duplikatindhold i sig selv, men det kan.
det er tilfældet her, fordi der kun er en side på siden med disse to tags—så hver tagside er identisk.
to muligheder:
- brug IKKE tags. Det meste af tiden har de alligevel ringe eller ingen værdi.
- Ingenindeks dine tags sider. Dette løser ikke problemet med gennemsøgningsbudget, da Google stadig spilder tid på at gennemgå disse sider.
Bemærk, at kategorisider kan forårsage lignende problemer som tags-sider. Eksempel:
begge disse sider er næsten identiske, fordi der ikke er nogen produkter opført under nogen af kategorierne. Så alt, hvad vi er tilbage med, er standardskabelonkopien.
Løs dette ved at bruge et rimeligt antal kategorier på din hjemmeside, eller endda noindeksere din kategori sider.
vedhæftede billede URL’ er
mange CMS ‘ oprette dedikerede sider til vedhæftede billeder. Disse sider viser normalt intet andet end billedet og en eller anden kedelpladekopi.
da denne kopi er den samme på tværs af alle automatisk genererede sider, fører den til duplikatindhold.
Deaktiver dedikerede sider til billeder i dit CMS. Du kan gøre dette ved hjælp af et plugin som Yoast.
paginerede kommentarer
Dette forårsager duplikatindhold, da det effektivt opretter flere versioner af de samme URL ‘ er.
- example.com/post/
- example.com/post/comment-page-2
- example.com/post/comment-page-3
Sluk for kommentarpagination eller ingenindeks dine paginerede sider ved hjælp af et plugin som Yoast.
lokalisering
Hvis du serverer lignende indhold til personer i forskellige lokaliteter, der taler det samme sprog, kan det forårsage duplikatindhold.
Du kan f.eks. have forskellige versioner af din hjemmeside for personer i USA, Storbritannien og Australien. Fordi der sandsynligvis kun er mindre forskelle mellem indholdet, der serveres til hver lokalitet (f.eks.
ifølge John Mueller er oversat indhold ikke duplikatindhold.
brug hreflang-tags til at fortælle søgemaskiner om forholdet mellem variationerne.
søgeresultater sider
masser af hjemmesider har søgefelter. Brug af disse fører dig typisk til en parameteriseret søge-URL.Google ‘ s tidligere leder af Google, Matt Cutts, udtalte, at:
typisk tilføjer søgeresultater ikke værdi til brugerne, og da Vores kernemål er at give de bedst mulige søgeresultater, udelukker vi generelt søgeresultater fra vores søgeindeks. (Ikke alle URL ‘ er, der indeholder ting som “/results” eller “/search”, er selvfølgelig søgeresultater.)Matt Cutts, tidligere leder af GoogleSådan løses dette problembrug et robotmetatag til at fjerne søgesider fra Google indeks eller blokere adgangen til søgeresultatsider i robotter.TST. Afstå fra internt at linke til søgeresultatsider.
Staging environment
et staging environment er en kopi eller næsten duplikeret version af din hjemmeside, der bruges til testformål.
forestil dig for eksempel, at du vil installere et nyt plugin eller ændre en kode på din hjemmeside. Du ønsker måske ikke at skubbe det direkte til et live-sted med hundreder af tusinder af daglige besøgende. Risikoen for katastrofe er for høj. Løsningen er først at teste ændringerne i et iscenesættelsesmiljø.Iscenesættelsesmiljøer bliver et SEO-problem, når Google indekserer dem, fordi det resulterer i duplikatindhold.
Sådan løses dette problemBeskyt dit iscenesættelsesmiljø ved hjælp af HTTP-godkendelse, IP-hvidliste eller VPN-adgang. Hvis det allerede er indekseret, skal du bruge et robots noindeks-direktiv for at få det fjernet.
Sådan kontrolleres duplikatindhold på din side
gå over til Ahrefs’ Site Audit og start en gennemgang.
Når du er færdig, skal du gå til rapporten om indholdskvalitet.
se efter klynger af dubletter og næsten dubletter uden en kanonisk. Disse er fremhævet i orange.
Klik på en af disse klynger for at se de berørte sider.
Undersøg årsagen til det duplikerede indhold, og tag derefter den passende handling.
Bemærk, at disse ikke altid vil være problemer, der skal rettes, især i tilfælde af næsten dubletter.
ikke en Ahrefs bruger?se efter disse duplikatindholdsrelaterede advarsler i Google Search Console:
- Duplicate uden brugervalgt canonical
- Duplicate, Google valgte en anden canonical end user
- Duplicate, indsendt URL ikke valgt som canonical
Lær mere om, hvordan du håndterer disse advarsler her.
for at se, hvordan Google behandler en bestemt URL, skal du bruge URL-Inspektionsværktøjet.
Du kan også tjekke for duplikerede titelmærker, metabeskrivelser og H1s i HTML-tags-rapporten.
dårlige dubletter er det, du leder efter. Dette er sider med duplikatmetatags, men forskellige kanonikaler.
vælg disse ved at klikke på “dårlige dubletter” under HTML-tags & indhold.
Klik på en af de gule søjler for at se de berørte sider.
sider med duplikattitler, metabeskrivelser eller H1 ‘ er er ofte meget ens.
for eksempel har disse to det samme titeltag, og indholdet er næsten identisk, fordi produktet er det samme. Den eneste forskel er, at en af siderne er til en 3‑pakke øjeblikkelig belysning firelogs, mens den anden er for kun en.
Google siger, at du skal minimere lignende indhold som dette:
hvis du har mange sider, der ligner hinanden, kan du overveje at udvide hver side eller konsolidere siderne til en.et lille antal lignende sider er dog usandsynligt, at det er meget af et problem.
Sådan kontrolleres for duplikatindholdsproblemer på tværs af internettet
skrabning og syndikering af indhold kan også føre til duplikatindholdsproblemer. Men det er normalt kun et problem, hvis du ser skrabede versioner af dit indhold, der overstiger dig.
sker det? Ja, men det er ofte mere et problem for nye eller svage hjemmesider. Hvorfor? Fordi de sider, der skraber dit indhold, ofte er mere autoritative. Det” narrer ” undertiden Google til at tro, at deres er originalen.
Hvis du har en lille hjemmeside, kan du ofte finde skrabet indhold ved at søge på Google efter et uddrag af tekst fra din side i citater.
for større sider skal du bruge et automatiseret værktøj som Copyscape. Dette søger på internettet efter andre forekomster af indholdet på din side(r).
uanset hvilken metode du bruger, vil de fleste resultater være fra spammy og lavkvalitetssider.
generelt er disse ikke noget at bekymre sig om. Men hvis du ser, at en legitim hjemmeside skrabet dit indhold, og er bekymret for, at det kan stjæle din trafik, smide URL’ en i Ahrefs ‘ site opdagelsesrejsende at se en organisk trafik skøn.
Hvis det får mere trafik end din side, kan der være et problem.
i dette tilfælde har du tre muligheder:
- nå ud og anmode om, at de fjerner indholdet.
- Ræk ud og bed om, at de tilføjer et kanonisk link til originalen på din hjemmeside.
- Indsend en anmodning om fjernelse af DMCA via Google.
Hvis du forsætligt syndikerer indhold til andre hjemmesider, er det værd at bede dem om at tilføje et kanonisk link til originalen. Det vil eliminere risikoen for problemer med duplikatindhold.
genudgivelse af indhold på din egen hjemmeside?Hvis du genudgiver indhold fra andre på din hjemmeside, er der to måder at forhindre problemer med duplikeret indhold på:
- Kanonikaliser tilbage til originalen.
- Ingenindeks siden.
Endelige tanker
stress ikke over duplikatindhold for meget. Det er normalt meget mindre af et problem, end det menes at være.
Hvis du har en håndfuld dublerede eller næsten dublerede sider, er det usandsynligt, at der er meget af et problem. Det samme gælder, når du citerer indhold fra en anden hjemmeside eller andre sider på din hjemmeside. Små mængder duplikat-eller kedelpladeindhold skal være okay. Google har systemer til at håndtere sådanne ting.
hvad du skal være på udkig efter er tekniske SEO-uheld, der fører til generering af hundreder eller tusinder af sider med duplikatindhold, såsom forkert implementering af facetteret navigation på e-handelssider.
disse kan skabe kaos på dit gennemsøgningsbudget, blandt andet.