W ciągu ostatnich lat powstało wiele artykułów i poradników dotyczących sitemap.xml, czyli mapy witryny, jednak pomimo szerokiej dostępności informacji, wciąż napotykamy na błędy w tej dziedzinie. W związku z tym postanowiliśmy zebrać i uporządkować wiedzę na temat prawidłowego tworzenia i wykorzystania tego narzędzia. Mapa witryny w formacie XML jest kluczowym elementem, który ułatwia wyszukiwarkom, takim jak Google, skanowanie i indeksowanie dużych stron internetowych, co pozwala na efektywne wyświetlanie każdej ważnej podstrony w wynikach wyszukiwania. Stanowi ona listę publicznie dostępnych adresów URL, czyli zbiór linków, które mają być widoczne w wyszukiwarkach i dostępne dla użytkowników, podobnie jak plik robots.txt. W moim artykule znajdziesz zbiór najlepszych praktyk dotyczących budowy i zarządzania mapą strony, co jest niezbędne, jeśli posiadasz własną stronę internetową i chcesz mieć pewność, że Twój plik sitemap.xml jest skonstruowany poprawnie.
spis treści:
Sitemap.xml to nic innego jak mapa strony internetowej, zaprojektowana z myślą o ułatwieniu robotom wyszukiwarek indeksowania kluczowych zasobów witryny, w tym tych najnowszych czy tych, które mogą być trudno dostępne z powodu specyficznej struktury serwisu lub skomplikowanego linkowania wewnętrznego. Zgodnie z zaleceniami Google, plik mapy witryny nie powinien przekraczać 50 MB i zawierać więcej niż 50,000 adresów URL. Powinien być również utworzony w formacie XML, co oznacza „Rozszerzalny język znaczników” (ang. Extensible Markup Language). Format XML jest szeroko stosowany do strukturalnego przekazywania danych, dzięki swojej niezależności od platform, co czyni go popularnym i wszechstronnym rozwiązaniem.
Jednakże, przy tworzeniu mapy witryny, administratorzy serwisów, blogerzy czy właściciele e-commerce mogą napotkać na pokusę umieszczenia w niej każdej pojedynczej podstrony, co nie zawsze jest optymalnym rozwiązaniem. Strony takie jak regulaminy, które często są oznaczone jako „nofollow”, czy strony z tagiem „noindex”, nie powinny być uwzględniane w mapie witryny. W dalszej części artykułu przybliżę, które adresy URL warto uwzględnić w sitemap.xml, aby skutecznie zarządzać zawartością serwisu w oczach wyszukiwarek.
Przeczytaj również Link authority – czym jest i jakie ma znaczenie?
Format XML, o którym wcześniej rozmawialiśmy, ułatwia strukturalne przedstawienie danych, głównie dzięki zastosowaniu specyficznych znaczników, które pełnią określone funkcje. Dzięki jednolitemu sposobowi przedstawiania informacji o adresach URL, pliki sitemap.xml są łatwo interpretowane przez roboty wyszukiwarek podczas przeglądania treści strony. Poniżej przedstawiam trzy kluczowe znaczniki, które są niezbędne dla funkcjonowania każdej mapy witryny:
Warto również pamiętać, że plik sitemap.xml najlepiej jest zapisywać w kodowaniu UTF-8, aby zapewnić kompatybilność i prawidłowe odczytywanie znaków przez różne systemy i przeglądarki.
Kluczowe znaczniki, które znajdują się w pliku sitemap.xml, są niezbędne do poprawnego przedstawienia struktury witryny dla robotów indeksujących, takich jak te używane przez Google. Oto one:
Te znaczniki służą do zbudowania struktury pliku sitemap.xml, umożliwiając wyszukiwarkom skuteczne skanowanie i indeksowanie stron internetowych, co przyczynia się do lepszej widoczności witryny w wynikach wyszukiwania.
W pliku sitemap.xml istnieją także znaczniki, które nie są wymagane, ale mogą być dodane, aby dostarczyć robotom indeksującym więcej informacji:
Te dodatkowe znaczniki w sitemap.xml umożliwiają bardziej szczegółowe zarządzanie informacjami przekazywanymi do wyszukiwarek, choć ich wpływ na proces indeksowania może być ograniczony.
Możliwe do zastosowania wartości dla <changefreq> obejmują:
Znacznik ten miał na celu ułatwienie wyszukiwarkom zaplanowanie częstotliwości indeksacji stron w zależności od częstości wprowadzanych na nich zmian.
Sprawdź nasze usług:
Plik sitemap.xml musi być umieszczony na serwerze witryny, której dotyczy. Dla przykładu, jeżeli chodzi o Twoją stronę internetową, odpowiedni plik mapy witryny powinien być dostępny pod linkiem takim jak Twojadomena.pl/sitemap.xml. Należy zauważyć, że zarówno nazwa tego pliku, jak i jego położenie na serwerze mogą być zróżnicowane. Kluczowe jest, by plik był łatwo dostępny, choć może on znajdować się w różnych miejscach na serwerze i posiadać różne nazwy, przykładowo:
Zobacz również Lazy Loading jak wpływa na SEO
Jak już wspomniałem na wstępie artykułu, nie wszystkie adresy URL powinny zostać włączone do mapy witryny. Często napotykam na błędnie skonfigurowane mapy witryn, co może niekorzystnie wpłynąć na budżet indeksowania strony przez roboty wyszukiwarek. Dlatego ważne jest, aby w mapie witryny znalazły się tylko te podstrony, które są rzeczywiście wartościowe. Do tej kategorii zaliczamy głównie:
W zależności od charakteru witryny, wartościowymi adresami URL zazwyczaj będą:
Przeczytaj również co to jest adres URL i z jakich elementów się składa ?
W poprzedniej części artykułu podkreśliłem, jakie adresy URL należy włączyć do mapy witryny. Nie mniej istotne jest jednak zrozumienie, które adresy URL powinny być z niej wykluczone podczas jej tworzenia. Do tej kategorii zalicza się głównie:
- Adresy URL prowadzące do przekierowań,
- Strony wyświetlające błędy 40X oraz 50X,
- Strony wykluczone w pliku robots.txt,
- Strony oznaczone tagiem noindex,
- Strony, które nie niosą większej wartości dla użytkowników, takie jak regulaminy czy polityki prywatności,
- Strony związane z paginacją,
- Strony generowane przez wyszukiwanie na witrynie,
- Strony zawierające parametry filtrowania lub sortowania treści.
Zobacz również Jak dane strukturalne wpływają na pozycjonowanie strony ? Co to są rich snippets
W zależności od rozmiaru naszej strony internetowej i typu używanego systemu zarządzania treścią (CMS), tworzenie mapy witryny może być realizowane przy użyciu bezpłatnych narzędzi do generowania sitemap.xml lub za pomocą narzędzi i wtyczek zintegrowanych z naszym CMS-em lub dostępnych jako dodatki.
Rozpocznijmy od WordPressa, który jest najczęściej wybieranym systemem zarządzania treścią w Polsce, zajmującym blisko 49% rynku według danych z https://trends.builtwith.com/cms/open-source/country/Poland. Najprostszym i najszybszym sposobem na wygenerowanie mapy witryny dla WordPressa jest użycie wtyczki Yoast SEO. Ta wtyczka automatycznie generuje sitemap.xml, pozwalając użytkownikowi na łatwe dostosowanie ustawień i wybór, które elementy strony mają być w niej uwzględnione. Yoast SEO charakteryzuje się intuicyjnością i prostotą w użyciu, a jej darmowa wersja oferuje wystarczające funkcjonalności dla większości administratorów stron.
Skupmy się teraz na Shoperze, platformie SaaS, która cieszy się rosnącą popularnością w Polsce. W przeciwieństwie do innych systemów, Shoper eliminuje potrzebę instalowania zewnętrznych wtyczek do generowania mapy witryny. Platforma ta automatycznie przygotowuje sitemapę za użytkownika. Można znaleźć mapę witryny Shoper pod adresem:
https://nazwa-twojej-domeny.pl/console/integration/execute/name/GoogleSitemap
Jeżeli korzystasz z CMS-a, który nie oferuje wbudowanej opcji tworzenia mapy witryny ani nie posiada odpowiedniego modułu dodatkowego, nie musisz od razu przechodzić do ręcznego tworzenia sitemapy. Istnieje wiele narzędzi online, zarówno bezpłatnych, jak i płatnych, które mogą wygenerować mapę witryny za Ciebie.
Bezpłatne generatory map witryn często mają ograniczenia, takie jak maksymalna liczba adresów URL, którą można włączyć do sitemapy, zazwyczaj do 500. Wersje płatne tych narzędzi zwykle nie posiadają takich ograniczeń, co czyni je lepszym wyborem dla większych stron internetowych. Dla mniejszych witryn, gdzie limit 500 adresów URL nie stanowi problemu, bezpłatne narzędzia są w pełni wystarczające.
Alternatywnie, możesz skorzystać z narzędzi typu crawler, takich jak Screaming Frog, które podczas skanowania strony mogą automatycznie generować mapę witryny. Wersja darmowa Screaming Frog umożliwia zeskanowanie do 500 zasobów na stronie.
Szczegółowe wskazówki dotyczące tworzenia mapy witryny za pomocą Screaming Frog znajdziesz w ich oficjalnym poradniku: https://www.screamingfrog.co.uk/xml-sitemap-generator/
Warto jednak pamiętać, że mapy witryn utworzone manualnie lub za pomocą jednorazowych narzędzi nie aktualizują się automatycznie przy dodawaniu nowych stron, produktów czy wpisów. Dlatego ważne jest regularne odświeżanie i aktualizowanie sitemapy, aby odzwierciedlała ona aktualny stan witryny.
Mapy witryn mogą się różnić w zależności od charakterystyki i rozmiaru strony internetowej, dlatego istnieje kilka rodzajów sitemap, które najlepiej dopasują się do konkretnych potrzeb. Warto zapoznać się z różnymi typami map stron, takimi jak sitemap index, mapa witryny dla grafik, a także zrozumieć, jak mapy witryn mogą wspierać obecność Twojej strony w Google News.
To typowa mapa witryny zapisana w formacie XML, zawierająca linki do różnych stron w ramach naszej strony internetowej. Zwykle jest dostępna pod nazwą sitemap.xml.
Indeks mapy witryny to specjalna forma mapy witryny, która agreguje linki do innych, mniejszych map witryn. Jest stosowana głównie na bardzo dużych stronach, gdzie pojedyncza mapa witryny mogłaby przekroczyć limit 50 MB. W takich przypadkach, większą mapę dzieli się na kilka mniejszych, a ich odnośniki umieszcza się właśnie w indeksie map witryn.
Ponadto, popularna wtyczka Yoast SEO automatycznie generuje indeks map witryn, obejmujący różne typy treści na stronie. Dzięki temu tworzone są oddzielne mapy witryn dla takich elementów jak strony, wpisy blogowe, kategorie blogowe czy profile autorów.
Jeżeli chcesz, by Twoje obrazy były widoczne w Google Grafika, kluczowe będzie stworzenie specjalnej mapy witryny przeznaczonej dla plików graficznych, która zawierałaby linki do nich. Chociaż roboty indeksujące zazwyczaj łatwo odnajdują i indeksują obrazy, funkcje takie jak ładowanie leniwe (lazyload) mogą sprawić, że proces ten stanie się trudniejszy. Przygotowanie mapy dla plików graficznych jest stosunkowo prostą czynnością.
Warto zaznaczyć, że w starszych wersjach map witryn dla obrazów można było znaleźć tagi takie jak image:caption, image:geo_location, image:title, image:license, które obecnie zostały usunięte z oficjalnej dokumentacji, więc nie ma potrzeby ich dołączania do mapy dla każdego obrazu.
Mapa witryny dla artykułów w Google News jest niezwykle ważna dla wydawców internetowych, którzy chcą, aby ich treści były widoczne w tym popularnym serwisie informacyjnym. Google News stało się kluczowym punktem dostępu do aktualności dla wielu użytkowników, co sprawia, że obecność w nim jest pożądana przez wydawców. W mapie witryny przeznaczonej dla Google News powinny znaleźć się linki wyłącznie do artykułów opublikowanych w ciągu ostatnich dwóch dni. Artykuły starsze niż 48 godzin powinny być z niej usuwane, aby mapa witryny zawierała tylko najświeższe treści.
Zobacz również Jak wybrać słowa kluczowe
Tworzenie mapy witryny ma na celu ułatwienie pracy robotom indeksującym, a nie jest przeznaczone bezpośrednio dla użytkowników czy samych twórców strony. Aby zapewnić, że roboty Google będą miały łatwy dostęp do Twojej mapy witryny, warto ją opublikować i zgłosić za pomocą Google Search Console, narzędzia analitycznego, z którego prawdopodobnie już korzystasz. Jeśli jeszcze nie masz konta w Google Search Console, możesz zapoznać się z instrukcjami dostępnymi na stronie: https://ks.pl/slownik/co-to-jest-google-search-console.
Gdy Twoja strona jest już zarejestrowana w Google Search Console, możesz przesłać mapę witryny, wykonując następujące kroki:
Krok 2
Podaj ścieżkę do Twojej sitemapy, najczęściej sitemap.xml lub sitemap-index.xml
Krok 3
Zweryfikuj stan sitemapy po jej przesłaniu. Po przesłaniu sitemapy wyświetlą się informacje o dacie przesłania, ostatnim odczycie oraz stanie i wykrytych adresach URL.
Warto zwrócić uwagę: Jeżeli podczas próby przesłania mapy witryny pojawi się komunikat „Nie udało się pobrać” zamiast potwierdzenia „Sukces”, warto spróbować wysłać plik ponownie. W przypadku, gdy problem będzie się powtarzał, należy zweryfikować, czy plik jest rzeczywiście dostępny pod podanym adresem URL.
Wprowadzenie map witryn w 2005 roku stanowiło znaczący krok w kierunku lepszej indeksacji treści stron internetowych przez wyszukiwarki. Webmasterzy dążący do osiągnięcia jak najlepszej widoczności swoich stron w wynikach wyszukiwania szybko zaczęli wykorzystywać to narzędzie. Z biegiem lat, algorytmy wyszukiwarek oraz ich roboty indeksujące stały się bardziej zaawansowane, coraz skuteczniej eksplorując i indeksując zawartość stron.
Analiza i optymalizacja mapy witryny to obecnie kluczowe działania w ramach audytów SEO. Uważam, że przy dobrze zorganizowanej strukturze strony i efektywnym linkowaniu wewnętrznym, roboty nie powinny napotykać trudności z indeksacją podstron, choć w ostatnich latach proces ten może odbywać się nieco wolniej.
Tworzenie mapy witryny jest szybkim i łatwym sposobem na ułatwienie wyszukiwarkom odszukania nawet tych stron, które są trudno dostępne, jak na przykład strony osierocone. Chociaż samo posiadanie mapy witryny nie wpłynie bezpośrednio na ranking strony w wyszukiwarkach, może przyspieszyć proces indeksowania przez roboty. Ważne jest, aby pamiętać o zgłoszeniu sitemapy w Google Search Console.
1. Co to jest mapa strony XML?Mapa strony XML to plik, który pomaga wyszukiwarkom lepiej zrozumieć strukturę Twojej witryny internetowej, zawierając informacje o wszystkich dostępnych stronach, ich znaczeniu oraz czasie ostatniej aktualizacji.
2. Dlaczego mapa strony XML jest ważna?Mapa strony XML jest ważna, ponieważ ułatwia wyszukiwarkom indeksowanie treści strony, co może przyczynić się do lepszego jej pozycjonowania w wynikach wyszukiwania.
3. Jak stworzyć mapę strony XML?Mapę strony XML można stworzyć ręcznie, ale dla większej wygody zaleca się korzystanie z narzędzi online lub wtyczek dostępnych dla popularnych systemów zarządzania treścią (CMS), takich jak WordPress.
4. Jak przesłać mapę strony XML do Google Search Console?Aby przesłać mapę strony XML do Google Search Console, należy zalogować się do swojego konta, wybrać właściwą witrynę, przejść do sekcji „Mapy witryn” i użyć opcji dodawania/testowania mapy witryny, podając pełny adres URL mapy.
5. Czy mapa strony XML wpływa na SEO?Tak, mapa strony XML może mieć pozytywny wpływ na SEO, ponieważ ułatwia robotom wyszukiwarek szybsze i dokładniejsze indeksowanie treści strony, co może poprawić jej widoczność w wynikach wyszukiwania.
6. Jak często należy aktualizować mapę strony XML?Mapę strony XML należy aktualizować za każdym razem, gdy dodajesz nowe treści na stronę lub dokonujesz zmian, które mogą wpłynąć na jej strukturę lub istotne elementy.
7. Czy każda strona internetowa potrzebuje mapy strony XML?Choć nie jest to wymóg, posiadanie mapy strony XML jest zalecane dla każdej strony internetowej, szczególnie tych o dużej liczbie treści, aby ułatwić wyszukiwarkom ich indeksowanie.
8. Co zrobić, jeśli mapa strony XML nie jest prawidłowo indeksowana?Jeśli mapa strony XML nie jest prawidłowo indeksowana, sprawdź, czy nie zawiera błędów, czy jest poprawnie sformatowana oraz czy wszystkie zawarte w niej adresy URL są dostępne i nie zwracają błędów serwera. Możesz również skorzystać z narzędzi Google Search Console do zdiagnozowania i naprawy problemów.