Luty 21, 2020

Duplicate content – czym jest? jak go uniknąć? Poradnik

duplicate content google

Witajcie na blogu 1stplace.pl. W dzisiejszym materiale przybliżę Ci czym jest “duplicate content” oraz czemu jest tak ważny w kontekście pozycjonowania organicznego. Odpowiednia budowa strony oraz oryginalne i wartościowe dla użytkownika treści to jedne z najważniejszych czynników wpływających na sukces danego serwisu w wyszukiwarkach internetowych.

Co to jest duplicate content?

Duplicate content to inaczej “powtarzające się treść” lub “powielana treść” w serwisie internetowym, jest też szczególną “zmorą” większych sklepów internetowych oraz mniejszych prywatnych serwisów blogowych. Skopiowany tekst wpływa negatywnie na wyniki strony internetowej w wyszukiwarkach oraz w niektórych przypadkach może zmniejszyć konwersję.

Wg. informacji Google za duplicate content uważa się powielane treści w zakresie różnych adresów URL oraz treści powtarzających się w obrębie jednej strony danego serwisu internetowego.

Powielone treści możemy podzielić na wewnętrzne oraz zewnętrzne .

a) zewnętrzny duplicate content – jest to powielona treść w kilku miejscach “różnych stron” w internecie, dla przykładu podam może być to opis techniczny producenta, który jest wykorzystywany przez kilka sklepów internetowych lub opis produktu, a również dana definicja.

b) wewnętrzny duplicate content – jest to powtarzająca się treść wewnątrz serwisu, najczęściej w takich miejscach jak opisy produktów, kategorie, autorzy treści blogowych, ukryte podstrony serwisu.

Dlaczego Google i inne wyszukiwarki nie lubią powielanych treści?

  • Stawia to algorytm przed krokiem określenia oryginału wpisu oraz wybrania, która strona jest najbardziej wartościowa dla zapytania użytkownika,
  • Unikalne i wartościowe treści są po prostu bardziej pożądane przez użytkownika.

Co nie jest uważane za powtarzalne treści?

Są wyjątki w kopiowanej treści są to między innymi: te same teksty w różnych językach, cytaty innych użytkowników oznaczone jako element składni HTML 5 <blockquote> oraz fragmenty tekstów. Oczywiście mowa tutaj o zdrowych ilościach np. 100 znaków, aniżeli 1000 znaków treści innego autora.

Jak uniknąć powielanej treści “duplicate content” na swojej stronie? Poradnik

Istnieją sprawdzone metody na uniknięcie powielania treści w serwisie. Na początek warto z założenia postawić na tworzenie tylko unikalnych treści. Jednak w sytuacji, gdy mamy już serwis oraz nie jesteśmy pewni w 100% co do unikalności treści warto sprawdzić ile treści mamy skopiowanych lub powtarzających się na stronie.

Jak wyszukać powtarzające się treści na stronie?

  1. Ręczne sprawdzenie – bardzo czasochłonne zajęcie. Niestety w przypadku sklepów internetowych jest to zajęcie liczone w miesiącach. W przypadku mniejszych stron www nie ma problemu z znalezieniem powielanych treści, jeśli wie się gdzie szukać.
  2. Zewnętrzne aplikacje webowe np. Copyscrape, Siteliner.com, Duplichecker.com – w przypadku, gdy mamy ograniczony budżet oraz posiadamy podstawową wiedzę o SEO możemy wykorzystać zewnętrzne aplikacje webowe. Pozwalają one na znalezienie zjawiska powielania treści na stronie oraz w wynikach wyszukiwania takich wyszukiwarek jak Google czy Bing. Wymienione rozwiązania są zarówno bezpłatne, jak też płatne w większych pakietach. Polegają one na analizie adresów url w serwisie oraz dostępnych treści.
  3. Wewnętrzne aplikacje SEO np. Screaming Frog – najszybsze i najbardziej skuteczne rozwiązanie. Dzięki specjalnym programom możemy wyszukać duplicate content w każdym miejscu na naszej stronie www! Aplikacje działają na metodzie pobierania danych z elementów klas, jest to rozwiązanie przeznaczone raczej dla osób specjalizujących się w SEO lub tworzeniu stron i serwisów www.

Unikanie tworzenia powielonych treści

Poniżej znajduje się lista czynności, które warto wykonać, aby wyeliminować zjawisko powielania się treści na stronie. Są one w 100% zgodne z wytycznymi i rekomendacjami od Google.

  1. Przekierowania 301 – przekierowania możemy wykonać w panelu naszego systemu CMS lub w pliku .htaccess. Podobne strony możemy przekierować do jednej “najbardziej” odpowiedniej lub usunąć i przekierować stare nieużywane strony do np. strony głównej serwisu.
  2. Budowa URL – zwracaj uwagę na budowę adresów URL swojego serwisu w przypadku dedykowanych rozwiązań możemy znaleźć te same treści w przypadku wersji http:// oraz https:// . Warto też sprawdzić czy nie mamy dostępnych tych samych treściach na stronach “twojadomena.pl/wpis” oraz “twojadomena.pl/wpis/”, kluczowy jest tutaj “/”.
  3. Domeny najwyższego poziomu – często w przy dużych serwisach (wielojęzycznych) oraz wielu subdomenach, możemy nieświadomie powielać treści np. na blogu oraz w kluczowych miejscach. Warto zadbać o odpowiednią architekturę, aby uniknąć duplicate content na swojej stronie.
  4. Nie udostępniaj treści zewnątrz – kontroluj swoje treści, nie udostępniaj ich na portalach takich jak Facebook czy Pinterest oraz forach internetowych. Takie treści mogą być uznane jako “powielone”. Dobrym pomysłem jest tutaj przygotowanie krótkich opisów na zewnętrzne portale (które mogą się powtarzać w każdych ilościach).
  5. Unikalność oraz brak schematów – zadbaj, aby na stronie było jak najmniej powtarzających się elementów np. w stopce, menu, elementach szablonu – Google to doceni!
  6. Nie publikuj niegotowych stron – jeśli Twoja strona nie jest skończona warto dodać do projektu parametr “noindex” oraz “nofollow” w innym przypadku możemy zaindeksować powieloną treść z innych podstron naszego serwisu oraz negatywnie wpłynąć na zakres wyników wyszukiwania w przeglądarkach.
  7. Usuń niepotrzebne treści – dobrym przykładem są tutaj treści szablonowe takie jak “Lorem ipsum” oraz inne automatycznie generowane treści.
  8. Sprawdź swój system CMS – każdy system CMS ma swoją specyficzną budowę. Warto go poznać, zasięgnąć opinii ekspertów lub zasięgnąć sprawdzonych źródeł. W kolejnym punkcie omówię kilka popularnych problemów na również popularnych systemach CMS takich jak WordPress oraz Prestashop.
  9. Rel=”canonical” – jeśli zależy nam na dobrym SEO oraz wynikach wyszukiwania, warto wskazać atrybut “canonical” np. przy paginacji serwisu.
  10. Google Search Console – warto podpiąć swoją stronę do narzędzia Google, aby mieć pod kontrolą ewentualne problemy ze swoją stroną.

Popularne przykłady problemów z duplikacją treści na popularnych systemach CMS

Poniżej kilka ROZWIĄZAŃ jeśli chodzi o uniknięcie duplicate content.

a) WordPress

  • wyłączenie z indeksu katalogów autorów dostępne w ścieżce /author/

  • wyłączenie z indeksu tagów wpisów, jeśli są one robione w ilościach hurtowych /tag/

  • wyłączenie indeksacji zbędnych kategorii wpisów (w przypadku, gdy dużo treści się w nich pojawia wprost z wpisu) /category/

  • wyłączenie dodatkowych podstron dedykowanych wtyczek np. /extra-label-plugin/

b) Prestashop

  • włączenie atrybutu rel=”canonical” na listowanych stron sklepu
  • wyłączenie z indeksu wersji roboczych oraz stron testowych stosowanego szablonu
  • częstym błędem negatywnym w kontekście SEO wynikających z niewiedzy deweloperów Prestashop są pobierane opisy kategorii do dodatkowych opisów w strukturze menu. Warto je usunąć!
  • w niedomyślnym systemie blogowym częstym zjawiskiem są problemy z licznymi podkategoriami. Warto jest sprawdzić oraz zredukować do minimum.
  • indeksowanie się zaimportowanych produktów (niewidocznych w serwisie) – warto je wyłączyć do czasu publikacji na stronie www i wykonania odpowiedniej analizy.

Podsumowanie

Duplicate Content to zdecydowanie negatywne zjawisko im bardziej postaramy się, aby je usunąć tym nasze pozycje w wynikach wyszukiwarek takich jak Google czy Bing będą naturalnie lepsze. Do walki z zjawiskiem mamy wiele narzędzi zarówno płatnych jak też bezpłatnych, jednak kluczowa w tym przypadku jest wiedza gdzie szukać oraz jak wydajnie kontrolować to zjawisko w celu pełnej eliminacji.