powrot do bloga
/
/
seo
/
Czym jest mapa strony xml poradnik

Czym jest mapa strony xml poradnik

Hauer Mateusz LinkedIn
Czym jest mapa strony xml poradnik

W ciągu ostatnich lat powstało wiele artykułów i poradników dotyczących sitemap.xml, czyli mapy witryny, jednak pomimo szerokiej dostępności informacji, wciąż napotykamy na błędy w tej dziedzinie. W związku z tym postanowiliśmy zebrać i uporządkować wiedzę na temat prawidłowego tworzenia i wykorzystania tego narzędzia. Mapa witryny w formacie XML jest kluczowym elementem, który ułatwia wyszukiwarkom, takim jak Google, skanowanie i indeksowanie dużych stron internetowych, co pozwala na efektywne wyświetlanie każdej ważnej podstrony w wynikach wyszukiwania. Stanowi ona listę publicznie dostępnych adresów URL, czyli zbiór linków, które mają być widoczne w wyszukiwarkach i dostępne dla użytkowników, podobnie jak plik robots.txt. W moim artykule znajdziesz zbiór najlepszych praktyk dotyczących budowy i zarządzania mapą strony, co jest niezbędne, jeśli posiadasz własną stronę internetową i chcesz mieć pewność, że Twój plik sitemap.xml jest skonstruowany poprawnie.

spis treści:

Czym jest sitemap.xml


Sitemap.xml to nic innego jak mapa strony internetowej, zaprojektowana z myślą o ułatwieniu robotom wyszukiwarek indeksowania kluczowych zasobów witryny, w tym tych najnowszych czy tych, które mogą być trudno dostępne z powodu specyficznej struktury serwisu lub skomplikowanego linkowania wewnętrznego. Zgodnie z zaleceniami Google, plik mapy witryny nie powinien przekraczać 50 MB i zawierać więcej niż 50,000 adresów URL. Powinien być również utworzony w formacie XML, co oznacza „Rozszerzalny język znaczników” (ang. Extensible Markup Language). Format XML jest szeroko stosowany do strukturalnego przekazywania danych, dzięki swojej niezależności od platform, co czyni go popularnym i wszechstronnym rozwiązaniem.

Jednakże, przy tworzeniu mapy witryny, administratorzy serwisów, blogerzy czy właściciele e-commerce mogą napotkać na pokusę umieszczenia w niej każdej pojedynczej podstrony, co nie zawsze jest optymalnym rozwiązaniem. Strony takie jak regulaminy, które często są oznaczone jako „nofollow”, czy strony z tagiem „noindex”, nie powinny być uwzględniane w mapie witryny. W dalszej części artykułu przybliżę, które adresy URL warto uwzględnić w sitemap.xml, aby skutecznie zarządzać zawartością serwisu w oczach wyszukiwarek.

Mapa strony w formacie XML (sitemap.xml) – kompleksowy poradnik
Mapa strony w formacie .xml

Przeczytaj również Link authority – czym jest i jakie ma znaczenie?

Z czego składa się sitemap.xml

Format XML, o którym wcześniej rozmawialiśmy, ułatwia strukturalne przedstawienie danych, głównie dzięki zastosowaniu specyficznych znaczników, które pełnią określone funkcje. Dzięki jednolitemu sposobowi przedstawiania informacji o adresach URL, pliki sitemap.xml są łatwo interpretowane przez roboty wyszukiwarek podczas przeglądania treści strony. Poniżej przedstawiam trzy kluczowe znaczniki, które są niezbędne dla funkcjonowania każdej mapy witryny:

  • <url>: Określa konkretny adres URL strony, który ma być zaindeksowany przez wyszukiwarkę.
  • <loc>: Wskazuje bezpośredni adres URL, który ma być zaindeksowany.
  • <lastmod>: Informuje o dacie ostatniej modyfikacji strony, co pomaga robotom zrozumieć, czy strona została zaktualizowana od ostatniego indeksowania.
  • <changefreq>: Szacuje częstotliwość zmian na stronie, co może wpływać na częstotliwość odwiedzin robotów.
  • <priority>: Wskazuje priorytet danego URL-a w kontekście innych stron w witrynie, co może wpływać na kolejność indeksowania.

Warto również pamiętać, że plik sitemap.xml najlepiej jest zapisywać w kodowaniu UTF-8, aby zapewnić kompatybilność i prawidłowe odczytywanie znaków przez różne systemy i przeglądarki.

Najważniejsze znaczniki w sitemap.xml

Kluczowe znaczniki, które znajdują się w pliku sitemap.xml, są niezbędne do poprawnego przedstawienia struktury witryny dla robotów indeksujących, takich jak te używane przez Google. Oto one:

  • <urlset>: Jest to główny element otwierający i zamykający plik mapy witryny, zawierający w sobie wszystkie inne tagi i określający standard używanego protokołu. Stanowi ramę dla całej struktury pliku sitemap.xml.
  • <url>: Jest to główny tag dla każdego adresu URL, który ma zostać zaindeksowany przez roboty. Wewnątrz tego znacznika konieczne jest umieszczenie co najmniej jednego tagu <loc>, który jest wymagany do prawidłowego zapisu. Tag <url> może również zawierać inne, dodatkowe znaczniki, które omówię dalej.
  • <loc>: Znacznik <loc> wskazuje dokładną lokalizację (URL) podstrony, która ma być zaindeksowana, z pełnym adresem, łącznie z protokołem http lub https. Jest to kluczowy element informujący roboty o dokładnej ścieżce dostępu do danej strony na witrynie.

Te znaczniki służą do zbudowania struktury pliku sitemap.xml, umożliwiając wyszukiwarkom skuteczne skanowanie i indeksowanie stron internetowych, co przyczynia się do lepszej widoczności witryny w wynikach wyszukiwania.

Opcjonalne znaczniki w sitemap.xml


W pliku sitemap.xml istnieją także znaczniki, które nie są wymagane, ale mogą być dodane, aby dostarczyć robotom indeksującym więcej informacji:

  • <lastmod>: Ten znacznik podaje datę ostatniej modyfikacji zawartości na konkretnej podstronie. Dzięki niemu roboty indeksujące mogą stwierdzić, czy treść na stronie uległa zmianie od czasu ostatniego skanowania. Format daty używany w <lastmod> to standard W3C Datetime, co pozwala na wprowadzenie daty w formacie RRRR-MM-DD, bez konieczności dodawania godziny.
  • <priority>: Jest to opcjonalny tag mający na celu wskazanie robotom, które strony są dla właściciela witryny priorytetowe i powinny być indeksowane jako pierwsze. Skala priorytetu mieści się w przedziale od 0.0 do 1.0, przy czym standardowy priorytet dla większości podstron to 0.5. Wartość tego tagu jest jednak kwestionowana pod kątem użyteczności, szczególnie po tym, jak Gary Illyes z Google w 2017 roku wspomniał, że roboty często ignorują tę informację.

Te dodatkowe znaczniki w sitemap.xml umożliwiają bardziej szczegółowe zarządzanie informacjami przekazywanymi do wyszukiwarek, choć ich wpływ na proces indeksowania może być ograniczony.

  • <changefreq>: w sitemap.xml służy do wskazania, jak często zawartość danej podstrony jest aktualizowana. Intencją tego elementu jest pomoc w określeniu, jak często roboty indeksujące powinny ponownie skanować stronę, aby odzwierciedlić dokonywane na niej zmiany.

Możliwe do zastosowania wartości dla <changefreq> obejmują:

  • always: dla dokumentów, których zawartość zmienia się przy każdym odświeżeniu,
  • hourly: dla stron aktualizowanych co godzinę,
  • daily: dla treści odświeżanej codziennie,
  • weekly: dla stron, na których wprowadza się zmiany raz w tygodniu,
  • monthly: dla podstron aktualizowanych raz na miesiąc,
  • yearly: dla treści, które zmieniają się raz do roku,
  • never: dla zawartości, która nie ulega zmianom.

Znacznik ten miał na celu ułatwienie wyszukiwarkom zaplanowanie częstotliwości indeksacji stron w zależności od częstości wprowadzanych na nich zmian.

Sprawdź nasze usług:

Gdzie umieścić plik sitemap.xml

Plik sitemap.xml musi być umieszczony na serwerze witryny, której dotyczy. Dla przykładu, jeżeli chodzi o Twoją stronę internetową, odpowiedni plik mapy witryny powinien być dostępny pod linkiem takim jak Twojadomena.pl/sitemap.xml. Należy zauważyć, że zarówno nazwa tego pliku, jak i jego położenie na serwerze mogą być zróżnicowane. Kluczowe jest, by plik był łatwo dostępny, choć może on znajdować się w różnych miejscach na serwerze i posiadać różne nazwy, przykładowo:

  • twojadomena.pl/mapa-strony.xml,
  • twojadomena.pl/folder/sitemap.xml
  • twojadomena.pl/dodatkowy-folder/mapa-strony.xml

Zobacz również Lazy Loading jak wpływa na SEO

Jakie adresy URL powinny znaleźć się w mapie strony?

Jak już wspomniałem na wstępie artykułu, nie wszystkie adresy URL powinny zostać włączone do mapy witryny. Często napotykam na błędnie skonfigurowane mapy witryn, co może niekorzystnie wpłynąć na budżet indeksowania strony przez roboty wyszukiwarek. Dlatego ważne jest, aby w mapie witryny znalazły się tylko te podstrony, które są rzeczywiście wartościowe. Do tej kategorii zaliczamy głównie:

  • Strony, które zwracają status 200 OK,
  • Strony, które nie są zablokowane przez plik robots.txt,
  • Adresy URL określone jako kanoniczne,
  • Strony, które dostarczają wartość dla użytkowników,
  • Strony, które nie są chronione hasłem ani nie mają ograniczonego dostępu.

W zależności od charakteru witryny, wartościowymi adresami URL zazwyczaj będą:

  • Strona główna, strony kategorii i produktów, wpisy na blogu, kategorie blogowe, strony typu FAQ oraz strony statyczne, na przykład te zawierające informacje o firmie.

Przeczytaj również co to jest adres URL i z jakich elementów się składa ?

Jakie adresy URL nie powinny znaleźć się w mapie strony?

W poprzedniej części artykułu podkreśliłem, jakie adresy URL należy włączyć do mapy witryny. Nie mniej istotne jest jednak zrozumienie, które adresy URL powinny być z niej wykluczone podczas jej tworzenia. Do tej kategorii zalicza się głównie:

- Adresy URL prowadzące do przekierowań,

- Strony wyświetlające błędy 40X oraz 50X,

- Strony wykluczone w pliku robots.txt,

- Strony oznaczone tagiem noindex,

- Strony, które nie niosą większej wartości dla użytkowników, takie jak regulaminy czy polityki prywatności,

- Strony związane z paginacją,

- Strony generowane przez wyszukiwanie na witrynie,

- Strony zawierające parametry filtrowania lub sortowania treści.

Zobacz również Jak dane strukturalne wpływają na pozycjonowanie strony ? Co to są rich snippets

Jak wygenerować sitemapę? - Najpopularniejsze metody

W zależności od rozmiaru naszej strony internetowej i typu używanego systemu zarządzania treścią (CMS), tworzenie mapy witryny może być realizowane przy użyciu bezpłatnych narzędzi do generowania sitemap.xml lub za pomocą narzędzi i wtyczek zintegrowanych z naszym CMS-em lub dostępnych jako dodatki.

Jak wygenerować sitemap.xml dla WordPress?

Rozpocznijmy od WordPressa, który jest najczęściej wybieranym systemem zarządzania treścią w Polsce, zajmującym blisko 49% rynku według danych z https://trends.builtwith.com/cms/open-source/country/Poland. Najprostszym i najszybszym sposobem na wygenerowanie mapy witryny dla WordPressa jest użycie wtyczki Yoast SEO. Ta wtyczka automatycznie generuje sitemap.xml, pozwalając użytkownikowi na łatwe dostosowanie ustawień i wybór, które elementy strony mają być w niej uwzględnione. Yoast SEO charakteryzuje się intuicyjnością i prostotą w użyciu, a jej darmowa wersja oferuje wystarczające funkcjonalności dla większości administratorów stron.

Mapa witryny w Shoper

Skupmy się teraz na Shoperze, platformie SaaS, która cieszy się rosnącą popularnością w Polsce. W przeciwieństwie do innych systemów, Shoper eliminuje potrzebę instalowania zewnętrznych wtyczek do generowania mapy witryny. Platforma ta automatycznie przygotowuje sitemapę za użytkownika. Można znaleźć mapę witryny Shoper pod adresem:

https://nazwa-twojej-domeny.pl/console/integration/execute/name/GoogleSitemap

Stworzenie sitemap xml dla CMS-ów, które nie mają takich funkcjonalności

Jeżeli korzystasz z CMS-a, który nie oferuje wbudowanej opcji tworzenia mapy witryny ani nie posiada odpowiedniego modułu dodatkowego, nie musisz od razu przechodzić do ręcznego tworzenia sitemapy. Istnieje wiele narzędzi online, zarówno bezpłatnych, jak i płatnych, które mogą wygenerować mapę witryny za Ciebie.

Bezpłatne generatory map witryn często mają ograniczenia, takie jak maksymalna liczba adresów URL, którą można włączyć do sitemapy, zazwyczaj do 500. Wersje płatne tych narzędzi zwykle nie posiadają takich ograniczeń, co czyni je lepszym wyborem dla większych stron internetowych. Dla mniejszych witryn, gdzie limit 500 adresów URL nie stanowi problemu, bezpłatne narzędzia są w pełni wystarczające.

Alternatywnie, możesz skorzystać z narzędzi typu crawler, takich jak Screaming Frog, które podczas skanowania strony mogą automatycznie generować mapę witryny. Wersja darmowa Screaming Frog umożliwia zeskanowanie do 500 zasobów na stronie.

Szczegółowe wskazówki dotyczące tworzenia mapy witryny za pomocą Screaming Frog znajdziesz w ich oficjalnym poradniku: https://www.screamingfrog.co.uk/xml-sitemap-generator/

Warto jednak pamiętać, że mapy witryn utworzone manualnie lub za pomocą jednorazowych narzędzi nie aktualizują się automatycznie przy dodawaniu nowych stron, produktów czy wpisów. Dlatego ważne jest regularne odświeżanie i aktualizowanie sitemapy, aby odzwierciedlała ona aktualny stan witryny.

Najpopularniejsze typy sitemap.xml

Mapy witryn mogą się różnić w zależności od charakterystyki i rozmiaru strony internetowej, dlatego istnieje kilka rodzajów sitemap, które najlepiej dopasują się do konkretnych potrzeb. Warto zapoznać się z różnymi typami map stron, takimi jak sitemap index, mapa witryny dla grafik, a także zrozumieć, jak mapy witryn mogą wspierać obecność Twojej strony w Google News.

Klasyczna mapa witryny

To typowa mapa witryny zapisana w formacie XML, zawierająca linki do różnych stron w ramach naszej strony internetowej. Zwykle jest dostępna pod nazwą sitemap.xml.

Mapa zbiorcza sitemap-index.xml

Indeks mapy witryny to specjalna forma mapy witryny, która agreguje linki do innych, mniejszych map witryn. Jest stosowana głównie na bardzo dużych stronach, gdzie pojedyncza mapa witryny mogłaby przekroczyć limit 50 MB. W takich przypadkach, większą mapę dzieli się na kilka mniejszych, a ich odnośniki umieszcza się właśnie w indeksie map witryn.

Ponadto, popularna wtyczka Yoast SEO automatycznie generuje indeks map witryn, obejmujący różne typy treści na stronie. Dzięki temu tworzone są oddzielne mapy witryn dla takich elementów jak strony, wpisy blogowe, kategorie blogowe czy profile autorów.

Mapa witryny z plikami graficznymi i materiałami wideo

Jeżeli chcesz, by Twoje obrazy były widoczne w Google Grafika, kluczowe będzie stworzenie specjalnej mapy witryny przeznaczonej dla plików graficznych, która zawierałaby linki do nich. Chociaż roboty indeksujące zazwyczaj łatwo odnajdują i indeksują obrazy, funkcje takie jak ładowanie leniwe (lazyload) mogą sprawić, że proces ten stanie się trudniejszy. Przygotowanie mapy dla plików graficznych jest stosunkowo prostą czynnością.

Warto zaznaczyć, że w starszych wersjach map witryn dla obrazów można było znaleźć tagi takie jak image:caption, image:geo_location, image:title, image:license, które obecnie zostały usunięte z oficjalnej dokumentacji, więc nie ma potrzeby ich dołączania do mapy dla każdego obrazu.

Mapa strony dla artykułów w Google News

Mapa witryny dla artykułów w Google News jest niezwykle ważna dla wydawców internetowych, którzy chcą, aby ich treści były widoczne w tym popularnym serwisie informacyjnym. Google News stało się kluczowym punktem dostępu do aktualności dla wielu użytkowników, co sprawia, że obecność w nim jest pożądana przez wydawców. W mapie witryny przeznaczonej dla Google News powinny znaleźć się linki wyłącznie do artykułów opublikowanych w ciągu ostatnich dwóch dni. Artykuły starsze niż 48 godzin powinny być z niej usuwane, aby mapa witryny zawierała tylko najświeższe treści.

Zobacz również Jak wybrać słowa kluczowe

Jak przesłać sitemap.xml w Google Search Console?


Tworzenie mapy witryny ma na celu ułatwienie pracy robotom indeksującym, a nie jest przeznaczone bezpośrednio dla użytkowników czy samych twórców strony. Aby zapewnić, że roboty Google będą miały łatwy dostęp do Twojej mapy witryny, warto ją opublikować i zgłosić za pomocą Google Search Console, narzędzia analitycznego, z którego prawdopodobnie już korzystasz. Jeśli jeszcze nie masz konta w Google Search Console, możesz zapoznać się z instrukcjami dostępnymi na stronie: https://ks.pl/slownik/co-to-jest-google-search-console.

Gdy Twoja strona jest już zarejestrowana w Google Search Console, możesz przesłać mapę witryny, wykonując następujące kroki:

  1. Przejdź do sekcji „Mapy witryn” w menu po lewej stronie.
Google Search Console - Mapy witryn
Google Search Console - Mapy witryn

Krok 2

Podaj ścieżkę do Twojej sitemapy, najczęściej sitemap.xml lub sitemap-index.xml

Google Search Console - Dodanie ścieżki do mapy witryny
Google Search Console - Dodaj ścieżki do mapy witryny

Krok 3

Zweryfikuj stan sitemapy po jej przesłaniu. Po przesłaniu sitemapy wyświetlą się informacje o dacie przesłania, ostatnim odczycie oraz stanie i wykrytych adresach URL.

Przesłana mapa witryny w Google Search Console
Przesłana mapa witryny w Google Search Console

Warto zwrócić uwagę: Jeżeli podczas próby przesłania mapy witryny pojawi się komunikat „Nie udało się pobrać” zamiast potwierdzenia „Sukces”, warto spróbować wysłać plik ponownie. W przypadku, gdy problem będzie się powtarzał, należy zweryfikować, czy plik jest rzeczywiście dostępny pod podanym adresem URL.

Dlaczego sitemap.xml jest tak ważna z punktu widzenia pozycjonowania?


Wprowadzenie map witryn w 2005 roku stanowiło znaczący krok w kierunku lepszej indeksacji treści stron internetowych przez wyszukiwarki. Webmasterzy dążący do osiągnięcia jak najlepszej widoczności swoich stron w wynikach wyszukiwania szybko zaczęli wykorzystywać to narzędzie. Z biegiem lat, algorytmy wyszukiwarek oraz ich roboty indeksujące stały się bardziej zaawansowane, coraz skuteczniej eksplorując i indeksując zawartość stron.

Analiza i optymalizacja mapy witryny to obecnie kluczowe działania w ramach audytów SEO. Uważam, że przy dobrze zorganizowanej strukturze strony i efektywnym linkowaniu wewnętrznym, roboty nie powinny napotykać trudności z indeksacją podstron, choć w ostatnich latach proces ten może odbywać się nieco wolniej.

Tworzenie mapy witryny jest szybkim i łatwym sposobem na ułatwienie wyszukiwarkom odszukania nawet tych stron, które są trudno dostępne, jak na przykład strony osierocone. Chociaż samo posiadanie mapy witryny nie wpłynie bezpośrednio na ranking strony w wyszukiwarkach, może przyspieszyć proces indeksowania przez roboty. Ważne jest, aby pamiętać o zgłoszeniu sitemapy w Google Search Console.

FAQ: Czym jest mapa strony XML - Poradnik

1. Co to jest mapa strony XML?Mapa strony XML to plik, który pomaga wyszukiwarkom lepiej zrozumieć strukturę Twojej witryny internetowej, zawierając informacje o wszystkich dostępnych stronach, ich znaczeniu oraz czasie ostatniej aktualizacji.

2. Dlaczego mapa strony XML jest ważna?Mapa strony XML jest ważna, ponieważ ułatwia wyszukiwarkom indeksowanie treści strony, co może przyczynić się do lepszego jej pozycjonowania w wynikach wyszukiwania.

3. Jak stworzyć mapę strony XML?Mapę strony XML można stworzyć ręcznie, ale dla większej wygody zaleca się korzystanie z narzędzi online lub wtyczek dostępnych dla popularnych systemów zarządzania treścią (CMS), takich jak WordPress.

4. Jak przesłać mapę strony XML do Google Search Console?Aby przesłać mapę strony XML do Google Search Console, należy zalogować się do swojego konta, wybrać właściwą witrynę, przejść do sekcji „Mapy witryn” i użyć opcji dodawania/testowania mapy witryny, podając pełny adres URL mapy.

5. Czy mapa strony XML wpływa na SEO?Tak, mapa strony XML może mieć pozytywny wpływ na SEO, ponieważ ułatwia robotom wyszukiwarek szybsze i dokładniejsze indeksowanie treści strony, co może poprawić jej widoczność w wynikach wyszukiwania.

6. Jak często należy aktualizować mapę strony XML?Mapę strony XML należy aktualizować za każdym razem, gdy dodajesz nowe treści na stronę lub dokonujesz zmian, które mogą wpłynąć na jej strukturę lub istotne elementy.

7. Czy każda strona internetowa potrzebuje mapy strony XML?Choć nie jest to wymóg, posiadanie mapy strony XML jest zalecane dla każdej strony internetowej, szczególnie tych o dużej liczbie treści, aby ułatwić wyszukiwarkom ich indeksowanie.

8. Co zrobić, jeśli mapa strony XML nie jest prawidłowo indeksowana?Jeśli mapa strony XML nie jest prawidłowo indeksowana, sprawdź, czy nie zawiera błędów, czy jest poprawnie sformatowana oraz czy wszystkie zawarte w niej adresy URL są dostępne i nie zwracają błędów serwera. Możesz również skorzystać z narzędzi Google Search Console do zdiagnozowania i naprawy problemów.

Zobacz również

Jesteś gotowy na POWER ?

Potrzebujesz świeżego spojrzenia ?

Rozwiń i zaangażuj użytkowników.
Usprawnij obsługę procesów sprzedaży oraz doświadczenia Klientów.

Uwolnij z nami swój  potencjał cyfrowy
agencja digital marketing