Czym jest sitemapa i jak ją stworzyć

Last modified: 17.03.2023
Estimated reading time: 5 min
Tagi:

Sitemap to plik XML, który zawiera informacje o wszystkich ważnych stronach, plikach, obrazach czy filmach w Twojej witrynie. Zapewnia wyszukiwarkom przegląd wszystkich dostępnych treści, które powinny być odkryte, indeksowane.

Pomaga to robotom indeksującym zrozumieć, co znajduje się na Twojej stronie. Pomaga również znaleźć strony, które nie są powiązane wewnętrznie w witrynie.

Dobrą praktyką jest dodanie lokalizacji sitemapy do pliku robots.txt. Przykład Sitemap:

Sitemap: https://www.marketingminer.com/sitemap.xml

Jak wygląda sitemapa XML?

Oto jak wygląda typowa sitemapa XML:

Oto jak wygląda typowa sitemapa XML

Wiele CMS-ów tworzy i zarządza sitemapami automatycznie i mogą one wyglądać nieco inaczej. Jednak ich cel jest zawsze taki sam.

YoastSEO XML sitemap

W powyższym przykładzie widać automatycznie wygenerowaną sitemapę XML przez YoastSEO, wtyczkę do WordPressa. Pamiętaj, że nie jest ważne jak wygląda sitemapa, liczy się funkcjonalność.

Indeks Sitemap

Wszystkie sitemapy są ograniczone do maksymalnie 50 000 adresów URL. Jeśli przekroczysz limit, będziesz musiał stworzyć nowy. Jeśli rozbijesz swoją listę na wiele sitemap, możesz opcjonalnie stworzyć indeks sitemap. Indeks sitemapy to plik XML (taki sam jak sitemapa), który zawiera linki do wielu plików sitemapy.

Przyjrzyjmy się przykładowi sitemapy XML, aby bardziej szczegółowo przeanalizować jej części:

<?xml version="1.0" encoding="UTF-8"?>
  <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <sitemap>
      <loc>https://www.marketingminer.com/sitemap1.xml</loc>
    </sitemap>
    <sitemap>
      <loc>https://www.marketingminer.com/sitemap2.xml.gz</loc>
    </sitemap>
  </sitemapindex>

Zestaw URL

Każda sitemap musi posiadać znacznik <urlset>, który opisuje, która wersja standardu protokołu XML sitemap jest używana. Często zobaczysz wersję 0.9, która jest obsługiwana przez większość wyszukiwarek.

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

URL

Teraz dochodzimy do najważniejszej części, czyli znacznika <url> . Każda definicja adresu URL może zawierać następujące znaczniki:

  • <loc > – zawiera bezwzględny adres URL. Powinien on odnosić się do kanonicznego adresu URL strony, którą chcesz zaindeksować. Jest to wymagana właściwość dla wszystkich znaczników <url> .
  • <lastmod> – odnosi się do czasu, w którym zawartość tego adresu URL była ostatnio aktualizowana. Data jest w formacie W3C date-time (yyyy-mm-dd).
  • <priority> – określa priorytet adresu URL, w stosunku do wszystkich innych linków z sitemapy w skali od 0.0 do 1.0. Wyższa liczba jest ważniejsza.
  • <changefreq> – reprezentuje jak często może zmieniać się treść na stronie. Ten znacznik informuje crawlery jak często powinny pobierać stronę. Ważne wartości: zawsze, godzinowo, codziennie, tygodniowo, miesięcznie, rocznie, nigdy.

Przykład:

<url>
     <loc>https://www.marketingminer.com/en</loc>
     <lastmod>2020-10-08T13:32:20+00:00</lastmod>
     <priority>1.00</priority>
     <changefreq>monthly</changefreq>
</url>

Inne sitemapy

Sitemapy nie zawierają tylko adresów URL stron internetowych, można również tworzyć niestandardowe sitemapy dla treści medialnych, jak również sitemapy wiadomości.

  • Wideo sitemap – zawiera informacje o wideo.
  • Image sitemap – dostarcza informacji o obrazkach na Twojej stronie.
  • Google News sit emap – ta sitemap jest przydatna szczególnie dla stron informacyjnych, gdy ważne jest, aby Google jak najszybciej odkrył artykuły informacyjne. Aby to osiągnąć, Twoja strona musi najpierw zostać przyjęta do Google News .

Mapa strony wideo

Wideo sitemap jest doskonałym sposobem, jak poinformować crawler o swoich filmów, które są hostowane na własnym serwerze, aby zrozumieć, co treść jest o. Zalecamy dodawanie nowych treści wideo tylko wtedy, gdy są one jeszcze świeże.

Oto jak wygląda sitemapa wideo ze wszystkimi wymaganymi parametrami:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
   <url>
     <loc>https://www.marketingminer.com/video/sitemap.html</loc>
     <video:video>                       <video:thumbnail_loc>https://www.marketingminer.com.com/thumbs/sitemap.jpg</video:thumbnail_loc>
       <video:title>XML sitemap file example</video:title>
       <video:description>What sitemap.xml is and how to create it step by step
         time</video:description>
       <video:content_loc>
          https://youtube.com/sitemap_video.mp4</video:content_loc>
       <video:player_loc>
         https://www.example.com/videoplayer.php?sitemap_video=123</video:player_loc>
      </video:video>
   </url>
</urlset>
TIP: Find out more information about video sitemaps (with optional tags included) in Google’s documentation: https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps.

Mapa strony

Image sitemaps są kluczowe dla bycia znalezionym przez wyszukiwarki. Pomagają one Google odkryć obrazy, które normalnie nie zostałyby znalezione. Na przykład obrazy, do których Twoja strona dociera za pomocą kodu JavaScript.

Oto przykładowa sitemapa obrazu:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
  <url>
    <loc>https://www.marketingminer.com.com/image_sitemap.html</loc>
    <image:image>
      <image:loc>https://www.marketingminer.com.com/sitemap.jpg</image:loc>
    </image:image>
   </url>
</urlset>

Wraz z tagiem alt, image sitemaps dostarczają robotom indeksującym dodatkowe informacje o obrazach na stronie.

TIP: Find out more about image sitemaps and best practices here: https://developers.google.com/search/docs/advanced/sitemaps/image-sitemaps

Mapa strony Google News

Jeśli chcesz zwiększyć szanse na pokazanie się Twoich treści w Google News, powinieneś rozważyć stworzenie sitemapy aktualności, która została stworzona właśnie w tym celu.

Oto przykład Google news sitemap:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
   <loc>https://www.marketingminer.com/en/blog/wordpress-plugin-v-1-0-launched.html</loc>
   <news:news>
   <news:publication>
     <news:name>Marketing Miner for WordPress has launched</news:name>
     <news:language>en</news:language>
   </news:publication>
   <news:publication_date>2021-04-20</news:publication_date>
     <news:title>Marketing Miner for WordPress has launched</news:title>
    </news:news>
  </url>
</urlset>

Google news sitemaps są nieco inne, ponieważ nie mogą zawierać żadnych artykułów, które zostały opublikowane więcej niż dwa dni temu. Starsze adresy URL zostaną automatycznie usunięte z sitemapy aktualności, aby przechowywać tylko świeże treści.

TIP: Learn more about Google News sitemaps here: https://developers.google.com/search/docs/advanced/sitemaps/news-sitemap.

Czy potrzebujesz pliku sitemap.xml?

Google znajduje nowe strony poprzez indeksowanie linków, które odkrywa na stronach. Ale jeśli Twoja strona jest nowa, bez bogatej historii, backlinków i świetnej struktury linkowania wewnętrznego, to naprawdę trudno jest robotom wyszukiwarek odkryć Twoją treść.

W takim przypadku musisz wdrożyć sitemapę na swojej stronie internetowej, aby wymienić wszystkie ważne strony, które chcesz, aby roboty wyszukiwarek znalazły i zaindeksowały, aby użytkownicy mogli je zobaczyć w wynikach wyszukiwania.

Oto kiedy powinieneś rozważyć posiadanie pliku sitemap.xml na swojej stronie internetowej:

  • Nowe strony internetowe – Jak już wspomnieliśmy, jeśli masz nową stronę internetową, upewnij się, że stworzysz sitemapę XML i prześlesz ją do Google Search Console. Dzięki temu działaniu Google z łatwością odkryje Twoje treści i zaindeksuje je.
  • Duże witryny – Jeśli masz witrynę z dużą ilością stron docelowych i słabą strukturą linkowania wewnętrznego, zalecamy dynamiczne dodawanie nowych stron docelowych do sitemapy, aby upewnić się, że indeks wyszukiwarki ich nie przeoczy. Dotyczy to głównie dużych serwisów eCommerce.
  • Serwisy informacyjne – Strony, które regularnie produkują wiele aktualnych artykułów (zazwyczaj serwisy informacyjne) powinny również posiadać sitemapy. Poprawiają one szybkość, z jaką roboty Google znajdują Twoje warte uwagi treści, aby je zaindeksować i pokazać w Wiadomościach Google. W przypadku witryn informacyjnych mówimy o Google News Sitemap, o którym wspomnieliśmy już powyżej.
  • Rich media content – Jak omawialiśmy wcześniej, jeśli twoja zawartość medialna jest trudno dostępna (na przykład obrazy, do których twoja strona dociera za pomocą kodu JavaScript), zalecamy stosowanie różnych typów sitemaps (wideo, obraz…).

Dowiedz się o sitemapach

  • Przesłanie sitemapy nie gwarantuje automatycznie, że link w niej zawarty zostanie zaindeksowany i pokazany w wynikach wyszukiwania.
  • Każda sitemap może zawierać maksymalnie 50 000 adresów URL i nie może być większa niż 50 Mb. Dla dużych stron internetowych zalecamy stworzenie pliku indeksu sitemap , który zawiera linki do wszystkich Twoich sitemap (na obrazku poniżej możesz zobaczyć jak to wygląda dla WordPressa).
  • Do sitemapy powinieneś dołączać tylko indeksowalne, kanoniczne adresy URL. Upewnij się, że używasz pełnych bezwzględnych adresów URL, a nie względnych adresów URL.
  • Google zaleca umieszczenie pliku sitemap w katalogu głównym witryny i nazwanie go sitemap.xml.
  • Plik indeksu sitemap musi być zakodowany w standardzie UTF-8 .
  • Dobrą praktyką jest dodanie swojego sitemap.xml do pliku robots.txt.

Jak tworzyć sitemapy

Tworząc sitemapę należy pamiętać, że trzeba ją zbudować ręcznie, gdy nie korzystamy z systemu CMS, który może tworzyć dynamicznie generowane sitemapy. Poniżej przyjrzyjmy się obu sposobom bardziej szczegółowo.

Ręczne tworzenie sitemapy

Jeśli nie używasz systemu CMS z automatycznie generowaną sitemapą, możesz stworzyć ją ręcznie (zalecamy sprawdzenie najpierw yourdomainname.com/sitemap.xml, aby upewnić się, że Twoja sitemapa już nie istnieje).

W tym przypadku, Screaming Frog narzędzie będzie najlepszym sposobem na wygenerowanie sitemapy za darmo, jeśli Twoja strona nie ma więcej niż 500 adresów URL. Jeśli Twoja strona jest duża, będziesz musiał rozważyć płatne opcje.

Polecamy również skorzystanie z narzędzia XML Sitemap Generator, które przeszukuje wszystkie Twoje ważne strony internetowe i automatycznie tworzy sitemapy: https://www.xml-sitemaps.com/.

TIP: Here’s a list of recommended web sitemap generators by Google: https://code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki.  

Kiedy twój plik sitemap.xml zostanie wygenerowany, upewnij się, że pobierzesz go i prześlesz do głównego katalogu strony.

TIP: A search engine crawler doesn’t have to necessarily find all important web pages and for this reason, we recommend looking at your generated sitemap.xml file first to ensure that all important pages, that you want to be indexed, are included. 

WordPress

Większość CMS-ów takich jak WordPress, Prestashop, Joomla, Wix czy Shopify posiada już wtyczki generujące dynamiczne pliki sitemaps.xml.

W tym poradniku przyglądamy się najczęściej używanej platformie CMS, WordPress, oraz temu, jak można tworzyć pliki sitemap.xml za pomocą wtyczki Yoast SEO.

Na początku musisz przejść na tę stronę, aby pobrać wtyczkę Yoast SEO: https://wordpress.org/plugins/wordpress-seo/.

Po pobraniu i zainstalowaniu wtyczki, wróć do WordPressa i w lewym menu przejdź do SEO > Ogólne > Funkcje i w XML sitemaps wybierz ON:

WordPress YoastSEO sitemap XML ON

Teraz wtyczka Yoast SEO może automatycznie wygenerować plik sitemap.xml, który będzie dostępny pod adresem yourdomainname.com/sitemap.xml lub yourdomainname.com/sitemap_index.xml dla indeksu sitemap.

Jak dodać sitemapę do Google Search Console

Kiedy plik sitemap.xml jest gotowy i wgrany na Twoją stronę, możesz go przesłać do Google, aby jak najszybciej go zaindeksować. Jest więcej sposobów jak dać znać Google o swoich sitemapach.

Najszybszym sposobem powiadomienia Google jest pingowanie z lokalizacją sitemapy: http://www.google.com/ping?sitemap=yourdomainname.com/sitemap.xml

Po przesłaniu mapy strony, powinieneś zobaczyć ten komunikat jako potwierdzenie, że została ona przyjęta.

Google sitemap ping

Jak widać powyżej, Google zaleca dodanie swojej sitemapy do Google Search Console, aby monitorować jej status submit lub crawl i ewentualnie inne kwestie.

Zaloguj się na swoje konto Google Search Console i przejdź do Sitemaps. W tej sekcji możesz dodać adres URL swojej sitemapy (najczęściej jest to sitemap.xml lub sitemap_index.xml).

Dodaj nową sitemapę do Google Search Console

I to jest to! Po przesłaniu plików sitemap, powinieneś zobaczyć kolumnę Status. To tutaj możesz dowiedzieć się, czy sitemapa została załadowana i przetworzona pomyślnie lub z błędami.

Przetwarzanie statusu Sitemap w Google Search Console

Po kliknięciu przycisku Zobacz pokrycie indeksu lub przejściu do sekcji Pokrycie w lewym menu, można wyświetlić szczegółowe informacje o konkretnych adresach URL, które były indeksowane.

Wygląda to mniej więcej tak:

Pokrycie wskaźnikiem w SGR

Jeśli masz jakiekolwiek problemy z indeksowaniem Twojej witryny, polecamy zajrzeć do sekcji Błędy Sitemap na tej stronie, aby dowiedzieć się więcej szczegółów: https://support.google.com/webmasters/answer/7451001#errors&zippy=%2Ccomplete-error-list

Dowiedz się więcej o tym, czym są sitemapy i Google Search Console tutaj:

Wniosek

Jeśli korzystasz z systemu CMS, takiego jak WordPress, to wygenerowanie sitemapy jest stosunkowo szybkie i łatwe dzięki wykorzystaniu ich wtyczek.

Jeśli nie, możesz stworzyć swoją sitemap ręcznie lub wybrać narzędzia firm trzecich do jej stworzenia. Narzędzia te będą indeksować wszystkie adresy URL i tworzyć nową sitemapę, którą będziesz musiał najpierw edytować, aby upewnić się, że nie zawiera ona stron, których nie chcesz pokazywać w wynikach wyszukiwania.

Nie zapomnij przesłać swojej sitemapy do Google, aby mieć pewność, że Googlebot znajdzie ją i zaindeksuje jak najszybciej.

Czy ten artykuł był pomocny?
Dislike

Czytaj dalej

Poprzedni: Czym są Featured Snippets i jak optymalizować swoje treści
Następny: Robots.txt: co to jest i jak działa
Have questions? Search our knowledgebase.