Sitemap to plik XML, który zawiera informacje o wszystkich ważnych stronach, plikach, obrazach czy filmach w Twojej witrynie. Zapewnia wyszukiwarkom przegląd wszystkich dostępnych treści, które powinny być odkryte, indeksowane.
Pomaga to robotom indeksującym zrozumieć, co znajduje się na Twojej stronie. Pomaga również znaleźć strony, które nie są powiązane wewnętrznie w witrynie.
Dobrą praktyką jest dodanie lokalizacji sitemapy do pliku robots.txt. Przykład Sitemap:
Sitemap: https://www.marketingminer.com/sitemap.xml
Jak wygląda sitemapa XML?
Oto jak wygląda typowa sitemapa XML:
Wiele CMS-ów tworzy i zarządza sitemapami automatycznie i mogą one wyglądać nieco inaczej. Jednak ich cel jest zawsze taki sam.
W powyższym przykładzie widać automatycznie wygenerowaną sitemapę XML przez YoastSEO, wtyczkę do WordPressa. Pamiętaj, że nie jest ważne jak wygląda sitemapa, liczy się funkcjonalność.
Indeks Sitemap
Wszystkie sitemapy są ograniczone do maksymalnie 50 000 adresów URL. Jeśli przekroczysz limit, będziesz musiał stworzyć nowy. Jeśli rozbijesz swoją listę na wiele sitemap, możesz opcjonalnie stworzyć indeks sitemap. Indeks sitemapy to plik XML (taki sam jak sitemapa), który zawiera linki do wielu plików sitemapy.
Przyjrzyjmy się przykładowi sitemapy XML, aby bardziej szczegółowo przeanalizować jej części:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.marketingminer.com/sitemap1.xml</loc>
</sitemap>
<sitemap>
<loc>https://www.marketingminer.com/sitemap2.xml.gz</loc>
</sitemap>
</sitemapindex>
Zestaw URL
Każda sitemap musi posiadać znacznik <urlset>, który opisuje, która wersja standardu protokołu XML sitemap jest używana. Często zobaczysz wersję 0.9, która jest obsługiwana przez większość wyszukiwarek.
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
URL
Teraz dochodzimy do najważniejszej części, czyli znacznika <url> . Każda definicja adresu URL może zawierać następujące znaczniki:
- <loc > – zawiera bezwzględny adres URL. Powinien on odnosić się do kanonicznego adresu URL strony, którą chcesz zaindeksować. Jest to wymagana właściwość dla wszystkich znaczników <url> .
- <lastmod> – odnosi się do czasu, w którym zawartość tego adresu URL była ostatnio aktualizowana. Data jest w formacie W3C date-time (yyyy-mm-dd).
- <priority> – określa priorytet adresu URL, w stosunku do wszystkich innych linków z sitemapy w skali od 0.0 do 1.0. Wyższa liczba jest ważniejsza.
- <changefreq> – reprezentuje jak często może zmieniać się treść na stronie. Ten znacznik informuje crawlery jak często powinny pobierać stronę. Ważne wartości: zawsze, godzinowo, codziennie, tygodniowo, miesięcznie, rocznie, nigdy.
Przykład:
<url>
<loc>https://www.marketingminer.com/en</loc>
<lastmod>2020-10-08T13:32:20+00:00</lastmod>
<priority>1.00</priority>
<changefreq>monthly</changefreq>
</url>
Inne sitemapy
Sitemapy nie zawierają tylko adresów URL stron internetowych, można również tworzyć niestandardowe sitemapy dla treści medialnych, jak również sitemapy wiadomości.
- Wideo sitemap – zawiera informacje o wideo.
- Image sitemap – dostarcza informacji o obrazkach na Twojej stronie.
- Google News sit emap – ta sitemap jest przydatna szczególnie dla stron informacyjnych, gdy ważne jest, aby Google jak najszybciej odkrył artykuły informacyjne. Aby to osiągnąć, Twoja strona musi najpierw zostać przyjęta do Google News .
Mapa strony wideo
Wideo sitemap jest doskonałym sposobem, jak poinformować crawler o swoich filmów, które są hostowane na własnym serwerze, aby zrozumieć, co treść jest o. Zalecamy dodawanie nowych treści wideo tylko wtedy, gdy są one jeszcze świeże.
Oto jak wygląda sitemapa wideo ze wszystkimi wymaganymi parametrami:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
<url>
<loc>https://www.marketingminer.com/video/sitemap.html</loc>
<video:video> <video:thumbnail_loc>https://www.marketingminer.com.com/thumbs/sitemap.jpg</video:thumbnail_loc>
<video:title>XML sitemap file example</video:title>
<video:description>What sitemap.xml is and how to create it step by step
time</video:description>
<video:content_loc>
https://youtube.com/sitemap_video.mp4</video:content_loc>
<video:player_loc>
https://www.example.com/videoplayer.php?sitemap_video=123</video:player_loc>
</video:video>
</url>
</urlset>
Mapa strony
Image sitemaps są kluczowe dla bycia znalezionym przez wyszukiwarki. Pomagają one Google odkryć obrazy, które normalnie nie zostałyby znalezione. Na przykład obrazy, do których Twoja strona dociera za pomocą kodu JavaScript.
Oto przykładowa sitemapa obrazu:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>https://www.marketingminer.com.com/image_sitemap.html</loc>
<image:image>
<image:loc>https://www.marketingminer.com.com/sitemap.jpg</image:loc>
</image:image>
</url>
</urlset>
Wraz z tagiem alt, image sitemaps dostarczają robotom indeksującym dodatkowe informacje o obrazach na stronie.
Mapa strony Google News
Jeśli chcesz zwiększyć szanse na pokazanie się Twoich treści w Google News, powinieneś rozważyć stworzenie sitemapy aktualności, która została stworzona właśnie w tym celu.
Oto przykład Google news sitemap:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>https://www.marketingminer.com/en/blog/wordpress-plugin-v-1-0-launched.html</loc>
<news:news>
<news:publication>
<news:name>Marketing Miner for WordPress has launched</news:name>
<news:language>en</news:language>
</news:publication>
<news:publication_date>2021-04-20</news:publication_date>
<news:title>Marketing Miner for WordPress has launched</news:title>
</news:news>
</url>
</urlset>
Google news sitemaps są nieco inne, ponieważ nie mogą zawierać żadnych artykułów, które zostały opublikowane więcej niż dwa dni temu. Starsze adresy URL zostaną automatycznie usunięte z sitemapy aktualności, aby przechowywać tylko świeże treści.
Czy potrzebujesz pliku sitemap.xml?
Google znajduje nowe strony poprzez indeksowanie linków, które odkrywa na stronach. Ale jeśli Twoja strona jest nowa, bez bogatej historii, backlinków i świetnej struktury linkowania wewnętrznego, to naprawdę trudno jest robotom wyszukiwarek odkryć Twoją treść.
W takim przypadku musisz wdrożyć sitemapę na swojej stronie internetowej, aby wymienić wszystkie ważne strony, które chcesz, aby roboty wyszukiwarek znalazły i zaindeksowały, aby użytkownicy mogli je zobaczyć w wynikach wyszukiwania.
Oto kiedy powinieneś rozważyć posiadanie pliku sitemap.xml na swojej stronie internetowej:
- Nowe strony internetowe – Jak już wspomnieliśmy, jeśli masz nową stronę internetową, upewnij się, że stworzysz sitemapę XML i prześlesz ją do Google Search Console. Dzięki temu działaniu Google z łatwością odkryje Twoje treści i zaindeksuje je.
- Duże witryny – Jeśli masz witrynę z dużą ilością stron docelowych i słabą strukturą linkowania wewnętrznego, zalecamy dynamiczne dodawanie nowych stron docelowych do sitemapy, aby upewnić się, że indeks wyszukiwarki ich nie przeoczy. Dotyczy to głównie dużych serwisów eCommerce.
- Serwisy informacyjne – Strony, które regularnie produkują wiele aktualnych artykułów (zazwyczaj serwisy informacyjne) powinny również posiadać sitemapy. Poprawiają one szybkość, z jaką roboty Google znajdują Twoje warte uwagi treści, aby je zaindeksować i pokazać w Wiadomościach Google. W przypadku witryn informacyjnych mówimy o Google News Sitemap, o którym wspomnieliśmy już powyżej.
- Rich media content – Jak omawialiśmy wcześniej, jeśli twoja zawartość medialna jest trudno dostępna (na przykład obrazy, do których twoja strona dociera za pomocą kodu JavaScript), zalecamy stosowanie różnych typów sitemaps (wideo, obraz…).
Dowiedz się o sitemapach
- Przesłanie sitemapy nie gwarantuje automatycznie, że link w niej zawarty zostanie zaindeksowany i pokazany w wynikach wyszukiwania.
- Każda sitemap może zawierać maksymalnie 50 000 adresów URL i nie może być większa niż 50 Mb. Dla dużych stron internetowych zalecamy stworzenie pliku indeksu sitemap , który zawiera linki do wszystkich Twoich sitemap (na obrazku poniżej możesz zobaczyć jak to wygląda dla WordPressa).
- Do sitemapy powinieneś dołączać tylko indeksowalne, kanoniczne adresy URL. Upewnij się, że używasz pełnych bezwzględnych adresów URL, a nie względnych adresów URL.
- Google zaleca umieszczenie pliku sitemap w katalogu głównym witryny i nazwanie go sitemap.xml.
- Plik indeksu sitemap musi być zakodowany w standardzie UTF-8 .
- Dobrą praktyką jest dodanie swojego sitemap.xml do pliku robots.txt.
Jak tworzyć sitemapy
Tworząc sitemapę należy pamiętać, że trzeba ją zbudować ręcznie, gdy nie korzystamy z systemu CMS, który może tworzyć dynamicznie generowane sitemapy. Poniżej przyjrzyjmy się obu sposobom bardziej szczegółowo.
Ręczne tworzenie sitemapy
Jeśli nie używasz systemu CMS z automatycznie generowaną sitemapą, możesz stworzyć ją ręcznie (zalecamy sprawdzenie najpierw yourdomainname.com/sitemap.xml, aby upewnić się, że Twoja sitemapa już nie istnieje).
W tym przypadku, Screaming Frog narzędzie będzie najlepszym sposobem na wygenerowanie sitemapy za darmo, jeśli Twoja strona nie ma więcej niż 500 adresów URL. Jeśli Twoja strona jest duża, będziesz musiał rozważyć płatne opcje.
Polecamy również skorzystanie z narzędzia XML Sitemap Generator, które przeszukuje wszystkie Twoje ważne strony internetowe i automatycznie tworzy sitemapy: https://www.xml-sitemaps.com/.
Kiedy twój plik sitemap.xml zostanie wygenerowany, upewnij się, że pobierzesz go i prześlesz do głównego katalogu strony.
WordPress
Większość CMS-ów takich jak WordPress, Prestashop, Joomla, Wix czy Shopify posiada już wtyczki generujące dynamiczne pliki sitemaps.xml.
W tym poradniku przyglądamy się najczęściej używanej platformie CMS, WordPress, oraz temu, jak można tworzyć pliki sitemap.xml za pomocą wtyczki Yoast SEO.
Na początku musisz przejść na tę stronę, aby pobrać wtyczkę Yoast SEO: https://wordpress.org/plugins/wordpress-seo/.
Po pobraniu i zainstalowaniu wtyczki, wróć do WordPressa i w lewym menu przejdź do SEO > Ogólne > Funkcje i w XML sitemaps wybierz ON:
Teraz wtyczka Yoast SEO może automatycznie wygenerować plik sitemap.xml, który będzie dostępny pod adresem yourdomainname.com/sitemap.xml lub yourdomainname.com/sitemap_index.xml dla indeksu sitemap.
Jak dodać sitemapę do Google Search Console
Kiedy plik sitemap.xml jest gotowy i wgrany na Twoją stronę, możesz go przesłać do Google, aby jak najszybciej go zaindeksować. Jest więcej sposobów jak dać znać Google o swoich sitemapach.
Najszybszym sposobem powiadomienia Google jest pingowanie z lokalizacją sitemapy: http://www.google.com/ping?sitemap=yourdomainname.com/sitemap.xml
Po przesłaniu mapy strony, powinieneś zobaczyć ten komunikat jako potwierdzenie, że została ona przyjęta.
Jak widać powyżej, Google zaleca dodanie swojej sitemapy do Google Search Console, aby monitorować jej status submit lub crawl i ewentualnie inne kwestie.
Zaloguj się na swoje konto Google Search Console i przejdź do Sitemaps. W tej sekcji możesz dodać adres URL swojej sitemapy (najczęściej jest to sitemap.xml lub sitemap_index.xml).
I to jest to! Po przesłaniu plików sitemap, powinieneś zobaczyć kolumnę Status. To tutaj możesz dowiedzieć się, czy sitemapa została załadowana i przetworzona pomyślnie lub z błędami.
Po kliknięciu przycisku Zobacz pokrycie indeksu lub przejściu do sekcji Pokrycie w lewym menu, można wyświetlić szczegółowe informacje o konkretnych adresach URL, które były indeksowane.
Wygląda to mniej więcej tak:
Jeśli masz jakiekolwiek problemy z indeksowaniem Twojej witryny, polecamy zajrzeć do sekcji Błędy Sitemap na tej stronie, aby dowiedzieć się więcej szczegółów: https://support.google.com/webmasters/answer/7451001#errors&zippy=%2Ccomplete-error-list
Dowiedz się więcej o tym, czym są sitemapy i Google Search Console tutaj:
Wniosek
Jeśli korzystasz z systemu CMS, takiego jak WordPress, to wygenerowanie sitemapy jest stosunkowo szybkie i łatwe dzięki wykorzystaniu ich wtyczek.
Jeśli nie, możesz stworzyć swoją sitemap ręcznie lub wybrać narzędzia firm trzecich do jej stworzenia. Narzędzia te będą indeksować wszystkie adresy URL i tworzyć nową sitemapę, którą będziesz musiał najpierw edytować, aby upewnić się, że nie zawiera ona stron, których nie chcesz pokazywać w wynikach wyszukiwania.
Nie zapomnij przesłać swojej sitemapy do Google, aby mieć pewność, że Googlebot znajdzie ją i zaindeksuje jak najszybciej.