XML mapa stranica

Pregled sadržaja

Mapa stranica je datoteka koja sadrži jednostavni popis svih stranica projekta. Njezin cilj je omogućiti tražilicama lakši pronalazak stranica kada dublje unutrašnje stranice nisu baš povezane s osnovnim stranicama te mogu biti izolirane od ostatka stranica na većim projektima. Datoteka tako omogućuje jednostavan pregled svih stranica koje se mogu indeksirati.

Sadrži još neke dodatne informacije o svakom URL-u: kad je ažurirano, koliko se često mijenja, koliko je određena stranica važna u odnosu na druge stranice te eventualno sadrži dodatne informacije o slikama i video sadržaju. Korištenje mape stranica ne garantira da će sve stranice na popisu biti indeksirane niti ne utječe na način rangiranja stranica u rezultatima pretraga.

Koliko je bitno imati mapu stranica za tražilice?

Datoteka nije obavezna ali može poboljšati pokrivenost indeksiranjem ako tražilice ne uspijevaju doprijeti do određenih stranica. Google ne treba ovu datoteku da sazna koje sve stranice postoje na domeni jer može do njih doći prateći interne linkove. Međutim, ovako mu se olakšava posao i daje mu se pregledan popis za učinkovitu analizu.

Mapa stranica je korisna u slučaju kada:

  • ako je web stranica velika – ako bi zbog velikog broja stranica koje tražilica treba indeksirati neke stranice naprosto predvidjela i preskočila
  • ako ima stranice koje su izolirane od glavnog dijela stranica i nije povezana – ako na neke stranice ne upućuju linkovi tada tražilica nema mogućnost saznati za nju
  • ako je web stranica nova – na novo kreirane web stranice ne vode vanjski linkovi pa ih tražilica neće moći otkriti. Ovo nije bitno kod WordPress jer on šalje obavijesti (pingove) tražilicama da im javi o novim objavama
  • ako sadrži puno medijskih zapisa – ako webstranica ima puno medijskih datoteka (slike, videozapisi) koje nisu svugdje prikazane jer tražilice njihove podatke uzimaju sa samih stranica gdje se učitavaju

Mapa stranice nije toliko značajna u slučajevima kada:

  • stranica je mala – ako vam stranica ima manje od 100 stranica tražilice je bez problema indeksiraju odjednom
  • sve stranice su interno povezane – tražilice mogu pronaći sve unutrašnje stranice bez problema prateći njihove interne linkove

Dodatne vrste mapa stranica

Osim osnovnog popisa web stranica, postoji još nekoliko tipova koji se mogu zasebno definirati i potom uključiti u indeks mapu.

Slikovna mapa

Slike je moguće dodatni običnoj mapi ili kreirati zasebnu datoteku samo sa popisom slika.

Podaci dostupni za implementaciju:

  • <image:image> – obavezan podatak koji okružuje sve podatke vezane uz sliku koju prezentira
  • <image:loc> – obavezan podatak, definira točan URL na sliku
  • <image:title> – opcionalni podatak, naziv slike
  • <image:caption> – opcionalni podatak, opisuje sliku sa više informacija
  • <image:geo_location> – opcionalni podatak, geografska lokacija
  • <image:license> – opcionalni podatak, URL na kojem se nalazi autorski podaci ali slika može sadržati i meta podaci definirane unutar koda same slike

Primjer XML mape slika:

<url>
    <loc>http://trgovina.hr/</loc>
    <image:image>
        <image:loc>http://trgovina.hr/proizvod-1.jpg</image:loc>
    </image:image>
    <image:image>
        <image:loc>http://trgovina.hr/proizvod-2.jpg</image:loc>
    </image:image>
</url>

Video mapa

Video mapom se može označiti popis videozapisa koji su ugrađeni (embedani) u web stranicu ali se nalaze na vanjskim poslužiteljima, kao što je to slučaj kod Youtube ili Vimeo filmića. Kao i kod slikovne mape, videozapisi se također mogu uključiti u običnu mapu ili prebaciti u zasebnu. Svaka stranica može imati više videozapisa ali poželjno je da se datoteke koje nisu značajno vezane uz stranicu izostave. Svaki zapis sadrži neke obavezne, neke preporučene i neke opcionalne vrijednosti no sve one mogu dodatno opisati sadržaj te ako imamo te podatke poželjno ih je navesti.

Obavezni podaci koje je nužno navesti:

  • <url> – matični element koji okružuje <loc> i <video:video> zapis
  • <loc> – stranica na kojoj se video prikazuje
  • <video:video> – matični element koji objedinjuje sve podatke
  • <video:thumbnail_loc> – istaknuta slika videozapisa u JPG ili PNG formatu, veličine između 160×90 do 1920×1080
  • <video:title> – naslov videozapisa
  • <video:description> – opis s maksimalno 2048 znakova
  • <video:content_loc> – direktan puni link do same datoteke videa, treba biti jedan od uobičajenih podržanih formata

Nekoliko opcionalnih podataka:

  • <video:duration> – vrijeme trajanja u sekundama
  • <video:rating> – ocjena između 0.0 i 5.0
  • <video:view_count> – broj pregleda
  • <video:publication_date> – datum prve objave u ISO 8601 međunarodnom standardu
  • <video:family_friendly> – je li sadržaj prikladan za djecu

Lista nije iscrpna, za više podataka pogledajte službeni popis svih definicija tagova za videozapise.

Primjer XML mape videozapisa:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
    <url>
        <loc>http://trgovina.hr/videos/</loc>
        <video:video>
            <video:thumbnail_loc>http://trgovina.hr/thumbs/izrada-web-stranica.jpg</video:thumbnail_loc>
            <video:title>Izrada web stranica</video:title>
            <video:description>Edukativni video gdje prikazujemo kako izrađujemo web stranice</video:description>
            <video:content_loc>http://streamserver.example.com/izrada-web-stranica.mp4</video:content_loc>
            <video:duration>600</video:duration>
            <video:rating>4.2</video:rating>
            <video:view_count>12345</video:view_count>
            <video:publication_date>2022-11-05T19:20:30+08:00</video:publication_date>
            <video:family_friendly>yes</video:family_friendly>
        </video:video>
    </url>
</urlset>

Mapa videozapisa pomaže da se na rezultatima pretrage prikažu videozapisi pored samog linka i opisa, što sigurno značajno povećava postotak klikanja. Za više detalje oko toga pogledajte članak cjelokupne video SEO optimizacije.

Struktura mape stranica

Svaka mapa obavezno mora imati:

  • na početku dokumenta navedenu xml specifikaciju uz UTF-8 kodiranje
  • osnovni <urlset> tag
  • svaki URL naveden unutar <url> taga
  • navedeni <loc> tag koji sadrži potpuni URL, dakle zajedno sa protokolom (http ili https) i završnom kosom crtom ako ju server podržava

Opcionalno, može još uključivati:

  • <lastmod> – datum posljednjeg ažuriranja u ISO 8601 međunarodnom standardu
  • <changefreq> – odnosi se na učestalost mijenjanja stranice (stalno, svaki sat, dnevno, tjedno, mjesečno, godišnje, nikada). Za ovaj tag Google kaže da ga ne uzima u obzir
  • <priorit> – tag koji je vezan za prioritet, raspon vrijednosti između 0.0 i 1.0, osnovna vrijednost je 0.5. Ovaj tag ne odnosi se niti ima utjecaj na rangiranje na rezultatima pretraga, već je čisto relativna oznaka prioriteta svih vaših stranica za red čekanja na indeksiranje
  • <image:image> – tag koji definira istaknutu sliku stranice, sa dodatnim unutrašnjim tagovima <image:loc> za punu putanju do slike i <image:title> radi naslova

Primjer koda XML mape stranica

<?xml version="1.0" encoding="UTF-8"?> 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">   
    <url>     
        <loc>http://www.trgovina.hr/</loc>     
        <lastmod>2018-06-04</lastmod>   
    </url> 
</urlset>

S obzirom da datoteka ne smije prelaziti više od 50 MB ili sadržavati više od 50 000 URL-ova, za potrebe većih projekata može se kreirati nekoliko manjih datoteka a koje se pozivaju u matičnoj datoteci. Ovo ograničenje postoji da se web poslužitelj ne zamrzne prilikom posluživanja velikih datoteka.

  • osnovni <sitemapindex> tag koji okružuje sve mape
  • <sitemap> – okružuje pojedinačnu mapu
  • <loc> – određuje puni URL datoteke koja osim XML formata može biti i običan tekstualni zapis
  • <lastmod> – datum posljednjeg ažuriranja u ISO 8601 međunarodnom standardu

Primjer takvog koda za indeks XML datoteke koji samo referencira druge datoteke mapa stranica:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
     <sitemap>
          <loc>https://trgovina.hr/post-sitemap.xml</loc>
          <lastmod>2022-12-16T18:00:46+00:00</lastmod>
     </sitemap>
     <sitemap>
          <loc>https://trgovina.hr/page-sitemap.xml</loc>
          <lastmod>2022-09-15T14:06:56+00:00</lastmod>
     </sitemap>
     <sitemap>
          <loc>https://trgovina.hr/product-sitemap.xml</loc>
          <lastmod>2022-08-17T11:29:47+00:00</lastmod>
     </sitemap>
</sitemapindex>

Za više informacija pogledajte službenu dokumentaciju formata XML mapa.

Kreiranje mape stranica

Ako koristite WordPress, od verzije 5.5 mapa stranica je automatski dostupna pod nazivom wp-sitemap.xml. Ova mapa ima samo osnovne značajke i za više mogućnosti dobro je instalirati SEO Yoast koji generira novu mapu pod imenom sitemap_index.xml. Glavna prednost korištenja Yoast dodatka je što automatski uskladi zapise u datoteci prilikom ažuriranja neke stranice u administraciji.

Ako ne koristite WordPress mapu možete generirati pomoću online alata XML-sitemaps, besplatna verzija omogućuje kreiranje do 500 stranica. Ili ako ste vični možete generirati iz terminala pomoću Gulp paketa gulp-sitemap.

Proslijeđivanje mape tražilicama

Kreiranu mapu potrebno je pokazati tražilicama:

  • Google – prijavite se na Search Console, u izborniku potražite Sitemaps i u traženo polje ubacite putanju do datoteke
  • Bing – prijavite se u Bing Webmaster Tool, na izborniku odaberite Sitemaps i kliknite na gumb “Submit sitemap”
  • dodavanjem u robots.txt datoteku koji se stavlja u root projekta

U Search Console možemo vidjeti greške ukoliko postoje ili stranice koje nisu indeksirane.