Kako izraditi i poslati Sitemapove. Detaljan vodič za datoteku Sitemap Sitemap xml datoteka - Dostupne direktive

Ovaj će vas članak naučiti kako izraditi Sitemap i pružiti Google pristup njemu.

Izrada i slanje Sitemapova

Formati datoteka karte web mjesta

Google podržava nekoliko formata datoteka karte web stranice, opisanih u nastavku. Svi formati trebaju koristiti standardni protokol. Google trenutno ne podržava atribut U datotekama Sitemapa.

Svi formati podliježu sljedećim ograničenjima: Sitemap može sadržavati najviše 50.000 URL-ova i njegova nekomprimirana veličina ne smije premašiti 50 MB. Ako veličina datoteke ili broj adresa navedenih u njoj prelazi ta ograničenja, podijelite je na nekoliko dijelova. Možete stvoriti indeksnu datoteku Sitemapa s popisom svih vaših Sitemapova i poslati ih Googleu odjednom.

Tekstna datoteka

Ako vaša karta web-lokacije ima samo adrese stranica, Googleu možete poslati običnu tekstualnu datoteku s tim URL-ovima (po jedan u svakom retku). Primjer:

Http://www.example.com/file1.html http://www.example.com/file2.html

  • Morate koristiti UTF-8 kodiranje.
  • Datoteka ne smije sadržavati ništa osim popisa URL-ova.
  • Ovoj tekstualnoj datoteci može se dati bilo koji naziv, ali mora koristiti nastavak .txt (na primjer, sitemap.txt).

Google stranice

Ako je vaša web-lokacija izrađena i potvrđena pomoću Google Sites, karta web-lokacije izrađuje se automatski. Ne možete ga promijeniti, ali ga možete poslati Googleu da biste dobili podatke za izvješćivanje. Imajte na umu da ako postoji više od 1000 stranica u jednom poddirektoriju, Sitemap se možda neće ispravno prikazati.

  • Ako su vaše stranice hostirane na Google web-lokacijama, vaša karta web-lokacije trebala bi se nalaziti na http://sites.google.com/site/ VashSait /system/feeds/sitemap .
  • Ako je stranica izrađena pomoću Google Apps, URL Sitemapa trebao bi biti: http://sites.google.com/ VašaDomena /VashSait /system/feeds/sitemap .

Datotečne ekstenzije karti web stranica

Google podržava proširenu sintaksu u Sitemapu za sljedeće vrste informacija. Pomoću njega možete dodati opise videozapisa, slika i drugog sadržaja kako biste poboljšali njegovo indeksiranje.

XML Sitemap je popis URL-ova web stranice u XML formatu. Datoteka Sitemap je dizajnirana da informira tražilice (kao što su Google, Bing, Yahoo, Yandex, MSN i drugi) o stranicama na web stranici koje bi trebale biti indeksirane. Sitemap značajno ubrzava skeniranje stranice. Osim toga, Sitemap vam omogućuje prijenos informacija o svim stranicama vaše stranice, uključujući one koje tražilice ne mogu dobiti uobičajenim indeksiranjem.

Izrada Sitemapa posebno je korisno kada:

  • Na vašoj se stranici nove stranice generiraju automatski i često.
  • Vaša stranica je nova i ukazuje na mali broj poveznica.
  • Vaša stranica ima veliku arhivu stranica sa sadržajem koje su loše ili uopće nisu povezane jedna s drugom.

XML Sitemaps Protocol: Što sadrži Sitemap?

U skladu sa XML Sitemaps Protocol i zahtjevima tražilica, Sitemap datoteka ne smije sadržavati više od 50.000 stranica i ne smije prelaziti veličinu od 10 MB. To znači da ako vaše web mjesto sadrži više od 50.000 stranica i veličina datoteke Sitemap od 10 MB, morate stvoriti više Sitemapova.

... https://whatsappss.ru/hr/URL ... ...

Osim potrebnog URL parametra, XML Sitemaps protokol pruža dodatne oznake za svaku stranicu:

Lastmod– označava datum posljednje izmjene.

Datum (ISO 8601)

Changefreq– vjerojatna učestalost sadržaja stranice. Valjane vrijednosti su:

  • uvijek – svaki put kada se stranica učita
  • po satu – svaki sat
  • dnevno – svaki dan
  • tjedno – jednom tjedno
  • mjesečno – jednom mjesečno
  • godišnje – jednom godišnje
  • nikad – znači da sadržaj stranice ostaje nepromijenjen.
Sintaksa:

Važeća vrijednost

Prioritet– prioritet stranice u odnosu na druge stranice na vašem web-mjestu. Valjani raspon - od 0,0 do 1,0. Ova oznaka omogućuje tražilicama da znaju koje su stranice po vašem mišljenju najvrjednije.

Decimala od 0,0 do 1,0

Ova stranica sadrži gotovo sve informacije o kojima trebate znati Sitemap.

Sitemap je karta web-mjesta osmišljena da pomogne robotima tražilica indeksirati web-mjesto. Ime Sitemap je standardna, odnosno prihvaćena prema zadanim postavkama.

Sitemap se obično pohranjuje na hosting poslužitelju u imeniku javni_html mjesto. Sitemap se obično piše u posljednja dva retka datoteke - tamo možete postaviti druga imena za dvije datoteke sitemapa, kao i drugu lokaciju za datoteke kako biste pokušali sakriti te datoteke od zlonamjernih programa i ljudi. I najpopularnije tražilice su obaviještene o nazivu i koordinatama pojedinačnih datoteka, šaljući druge tražilice dalje u šumu.

Smatram da su to jeftini trikovi, jer datoteka mora biti u direktoriju javni_html mjesto. Čak i ako se ukloni, budući da to nije potrebno, napadač koji može doći do ovog direktorija također može zamijeniti tri datoteke kako bi preusmjerio posjetitelje stranice na bilo koje drugo mjesto i njegove stranice. Mislim da se tako ponekad napadaju neke stranice.

Sitemap moju stranicu kreira dodatak Google XML Sitemaps verzija 3.4 Na hosting poslužitelju dvije su datoteke pohranjene u public_html direktoriju web mjesta: Sitemap.xml I Sitemap.xml.gz, a obje se datoteke stvaraju gotovo istovremeno.

Datoteka Sitemap.xml, koji trenutno ima duljinu od 103 KB, generira gore spomenuti dodatak kada se promijeni bilo koja stranica stranice.

Datoteka Sitemap.xml.gz, duljine 10 KB, pomoćni je i sadrži u šifriranom obliku neke informacije potrebne robotu.

Dana 03/07/14, nakon traženja savjeta na Internetu, uspio sam izvući dešifriranu mapu moje stranice s Interneta. Danas ovo nisam mogao ponoviti, a jučer mi nije palo na pamet da zapišem algoritam za vađenje kartice. Međutim, sada to nije važno, malo kasnije shvatit ćete zašto.

Evo početka i kraja datoteke koju sam jučer konvertirao:
http://site/ 2014-03-07T19:23:22+00:00 dnevno 1.0
http://site/stroitelstvo/sayt/cms-wordpress 2014-03-07T19:23:22+00:00 dnevno 0,6
http://site/posadki/ogorod/pomidoryi 2014-03-07T18:06:27+00:00 dnevno 0,6
…… http://site/voprosyi/otvet-15 2013-03-19T13:25:35+00:00 dnevno 0,6
http://site/sample-page/roshhi/hvoynyie/listvennitsa 2013-03-05T13:01:35+00:00 dnevno 0,6
http://site/uzorak-stranice/roshhi/listvennyie/lipyi 2013-03-05T12:30:19+00:00 dnevno 0,6

U rezultirajućoj datoteci, unosi koji se odnose na pojedinačne stranice bili su kontinuirani i odvojeni samo s dva razmaka. Nisam bio previše lijen da ga podijelim u uređivaču Bilježnica datoteku u retke i spremljenu u TXT formatu. Zatim je dvaput kopirao sadržaj datoteke u stupce s praznim listovima Excel. Saznao sam da je napravljen 591 zapis s adresama stranica stranice. U drugom sam stupcu poredao unose abecednim redom.

Budući da je u uredniku Bilježnica sadrži primitivnu naredbu za zamjenu, u koju je kopiran cijeli sadržaj pretvorene datoteke Riječ. Zatim, na naredbu zamjene " Ctrl+H"zamijenio http sa htp, a zatim obrnuto. U oba slučaja izvršena je 591 zamjena.

Tako je bilo moguće ne gubiti vrijeme na dijeljenje u retke, već odmah kopirati u Riječ i napravite zamjenu kako biste saznali broj stranica web-mjesta uključenih u Sitemap.

Ovdje su početak i dva retka kraja datoteke Sitemap.xml, kopirano s hostinga:





http://сайт/
2014-03-08T18:55:00+00:00
daily
1.0


http://сайт/stroitelstvo/sayt/sitemap
2014-03-08T18:55:00+00:00
daily
0.6


http://сайт/voprosyi/otvet-15
2013-03-19T13:25:35+00:00
daily
0.6


http://сайт/sample-page/roshhi/hvoynyie/listvennitsa
2013-03-05T13:01:35+00:00
daily
0.6

Zadnji unos odnosi se na stranicu kreiranu prije više od godinu dana!

Zaglavlje datoteke sadrži informacije o načinu na koji je ova datoteka stvorena: verziju WordPressa, naziv dodatka i, sudeći po unosu u zaglavlju, naziv vanjske stranice koja se nalazi u Njemačkoj, gdje je standard nalazi se program koji stvara zapise vezane za stranice stranice, a također i datum i vrijeme te datum izrade mape stranice. Osim toga, sadrži informacije u skladu s kojim je standardima izrađena mapa stranice.

Same zapise vjerojatno stvara dodatak, pomoću procesora prijenosnog računala iz kojeg se unose promjene na stranice web-mjesta.

Ovi se unosi nalaze između и .

4 retka sadrže adresu stranice stranice, vrijeme zadnje izmjene, preporučenu učestalost pregledavanja stranice za robota i preporučeni prioritet gledanja. Što znači 6 znakova "+00:00" prisutnih u svakom drugom retku zasebnog unosa i zašto su potrebni potpuno je nejasno. Mislim da se to može razumjeti ispitivanjem korištenog standarda snimanja. Ali treba li nam?

Značajno je, prvo, da su zapisi poredani prema vremenu stvaranja stranica datoteke - to pomaže robotima da uštede vrijeme ne pregledavajući one stranice koje se nisu promijenile od zadnjeg indeksiranja.

Drugo, uvijek možete kopirati s hostinga na Riječ sav sadržaj duge datoteke Sitemap i brzo saznajte broj stranica uključenih u kartu web stranice. Učinio sam to za otprilike jednu minutu - sada ima 593 stranice na mapi web stranice, jer sam danas dodao dvije stranice.

Treće, sasvim je očito da datoteka Sitemap.xml je pretjerano dugačak i da su kreatori standarda iz nekog razloga odlučili izraditi ga u obliku koji ljudi mogu razumjeti. Zašto? Ako vas zanima, potražite informacije na internetu ili pitajte luminere, gurue i druge stručnjake.

Četvrto, roboti za pretraživanje vjerojatno ne čitaju cijelu datoteku, već samo do unosa stranice koja se nije promijenila od zadnje posjete robota karti web stranice. Stoga im redundancija duge datoteke karte web-mjesta nije važna s trenutačnim procesorima.

Peto, gore spomenuti dodatak radi izvrstan posao u stvaranju karte web stranice - može se i treba ga sigurno koristiti.

Šesto, uvijek možete pogledati nazive starih stranica u mapi web stranice i kopirati ih u njih adresna traka preglednik, uzrokuju redizajniranje stranica. Moram ovo učiniti s mnogo stranica kako bih stranice oslobodio prevelikog broja spremljenih revizija, a u isto vrijeme ih još jednom provjeriti.

Sedmo, siguran sam da možemo smisliti još mnogo toga korisne načine koristeći jasnu kartu web mjesta. Javit ću vam kad budem imao ideja.

Pozivam sve da se izjasne

Koji su potrebni za robote za pretraživanje. Neki će reći da to nije potrebno, jer su svi odjeljci već prikazani. Međutim, potreba za takvom stranicom postoji ako stranica sadrži pedesetak ili više stranica. Za tražilice i korisnike poslužit će kao vodič koji će im pomoći da razumiju gdje se nalaze ove ili one informacije.

XML i HTML datoteke

Budući da se ne koristi samo za robote za pretraživanje, već i za korisnike koji posjećuju stranicu, obično se sastavljaju dvije karte: u XML i HTML formatu.

Za izradu Sitemapa za pretraživačke robote koristite XML datoteku. Zahvaljujući njemu, roboti dodaju nove u svoju bazu podataka za pretraživanje. U nedostatku karte na web-mjestu s više stranica, velik broj stranica možda neće biti indeksiran ponekad jako dugo.

HTML datoteka koristi se za izradu karte web stranice za korisnike. Važnost ove karte leži u činjenici da njezina praktičnost izravno određuje hoće li korisnik pronaći informacije koje ga zanimaju ili ne. Stoga je takva karta stvorena za one internetske projekte u kojima svi odjeljci i njihovi pododjeljci ne stanu u glavni izbornik.

Kako izraditi Sitemap XML

Postoje tri načina za rješavanje ovog problema:

    Kupnja generatora za sitemap.

    Stvorite Sitemap koristeći online usluge.

    Ručno pisanje datoteke.

Kako bi se značajno uštedjelo vrijeme, predlaže se kupnja generatora. Stoga, ako je dvadeset do trideset dolara za kupnju licence mali gubitak novca za webmastera, tada kupnja, posebno za veliki internetski resurs, još uvijek neće naštetiti, jer tada nećete morati ručno stvarati web mjesto .

Za web mjesto koje sadrži nekoliko stotina stranica preporučuju se online usluge, gdje za izradu Sitemapa trebate samo navesti adresu internetskog izvora i preuzeti rezultat.

Najbolja opcija je ručna izrada karte. Da biste to učinili, morate znati oznake kao što su url, urlset, loc, lastmod, changefreg i priority. U ovom slučaju, prve tri oznake smatraju se obveznima, ali posljednje tri se mogu izostaviti.

Izrada Sitemapa u Joomli

Za izradu Sitemapa na web stranici, Joomla i Wordpress imaju posebne dodatke, kao i većina poznatih sustava administracija, zahvaljujući kojoj se mapa web mjesta izrađuje ručno ili automatski. Za velike internetske projekte koji stalno ažuriraju materijale, ovaj je dodatak vrlo prikladan.

U Joomli se zove Xmap, u Wordpressu se zove Google XML Sitemaps.

Automatska izrada karte web stranice

Besplatni mrežni poslužitelji pomažu vam da automatski izradite Sitemap ako vaša stranica nema više od pet stotina stranica. Evo kako je lako generirati kartu web stranice:

    Nakon što ste posjetili jedan od ovih internetskih izvora, trebate pronaći stavku "Generiraj Sitemap", kliknite gumb "Stvori" i automatski izradite datoteku Sitemapa.

    Pronađite “URL stranice” i tamo unesite adresu stranice za koju se karta izrađuje.

    Sustav može zahtijevati da unesete kontrolni kod. Također ga morate unijeti i kliknuti "Start".

    Prenesite gotovu kartu na web stranicu.

Ručni način izrade karte

Ova metoda je, s jedne strane, najteža, oduzima dragocjeno vrijeme, ali s druge strane, najviše pravi put, koristi se u slučajevima kada druge opcije nisu prikladne. Tako, na primjer, ako postoji mnogo stranica koje nisu posebno potrebne za uključivanje u mapu web-mjesta, ali one automatski završe tamo, naravno, ručna metoda će spasiti kartu od "predoziranja" takvim stranicama. Drugi razlog za odabir ove metode je loša navigacija web-stranicom.

Za implementaciju ručne izrade karte morate:

    Prikupite stranice za uključivanje u kartu.

    U excel datoteku umetnite sve adrese u treći stupac.

    Umetnite i url i loc u 1. i 2. stupac.

    U 4. i 5. stupac umetnite završni url i loc.

    Koristite funkciju "link" za povezivanje pet stupaca.

    Napravite sitemap.xml.

    Dodajte obje oznake urlset i /urlset ovoj datoteci.

    Između njih umetnite povezani stupac.

Rezultirajuća datoteka mora biti provjerena. To se može učiniti, na primjer, u Yandexu, na ploči webmastera.

Kako napraviti Sitemap za Yandex i Google

Nakon što se stranica izradi, ona se dodaje na stranicu. U tu svrhu datoteku s kartom web stranice treba nazvati Sitemap.xml i dodati je u korijenski direktorij. Da biste ga brzo pronašli, Google i Yandex imaju posebne alate. Zovu se "Webmaster Tools" (u Googleu) i "Yandex Webmaster" (u Yandexu).

Dodavanje Sitemapa na Google

Dodavanje Sitemapa u Yandex

Isto tako, prvo se morate prijaviti na Yandex Webmaster. Zatim idite na Indexing/Sitemap files, navedite stazu datoteke tamo i kliknite gumb "Dodaj".

    Današnji roboti za pretraživanje preuzimaju samo one datoteke koje ne sadrže više od pedeset tisuća URL-ova.

    Ako kartica premašuje deset megabajta, bolje ju je podijeliti u nekoliko datoteka. Zahvaljujući tome, poslužitelj neće biti preopterećen.

    Da biste ispravno izradili Sitemap xml, ako postoji nekoliko datoteka, trebate ih sve registrirati u indeksnoj datoteci, koristeći oznake sitemapindex, sitemap, loc i lastmod.

    Sve stranice moraju biti napisane sa ili bez prefiksa “www”.

    Potrebno kodiranje datoteke je UTF8.

    Također morate dodati indikaciju prostora imena jezika u datoteku.

Kako izraditi sitemap za korisnike

Budući da je takva karta stvorena za korisnike, trebala bi biti što jednostavnija i jasnija. Unatoč tome, potrebno je točno prenijeti sve podatke o strukturi stranice koja se koristi.

HTML karte općenito imaju poznatu korisničku strukturu koja se sastoji od odjeljaka i pododjeljaka istaknutih na određeni način, npr. CSS stilovi i grafičkih elemenata.

Za izradu Sitemapa za veliki internetski projekt, kao u slučaju XML karte, ovdje se također preporučuje razdvajanje. U ovom slučaju, to se provodi u obliku zasebnih kartica, eliminirajući glomaznost karte.

To će poboljšati funkcionalnost stranice JavaScript jezik, koja je dopuštena za korištenje u ovoj karti, jer nije stvorena za robote tražilice, već za korisnike.

Naručite datoteku karte web stranice

Preporučljivo je da stvorena datoteka koja sadrži Sitemap uvijek bude čista i uredna, osobito ako stranica ima velik broj stranica. Budući da roboti tražilica skeniraju karte web stranica vrlo brzo, možda jednostavno neće biti dovoljno vremena za pregled cijele datoteke velikog internetskog izvora.

Stoga, ako se naviknete dodavati stranice na kartu web stranice ne na dnu, već na vrhu, tada, s jedne strane, nema sumnje da će robot za pretraživanje imati vremena vidjeti adrese novih stranica, i s druge strane, na ovaj način će biti puno lakše kontrolirati sve stranice.

Koristeći naš generator karte web-lokacije, stvorite XML datoteke koje se mogu poslati Googleu, Yandexu, Bingu, Yahoou i drugim tražilicama kako bi im pomogli indeksirati vašu web-lokaciju.

Učinite to u tri jednostavna koraka:

  • Unesite puni URL web stranice u obrazac.
  • Pritisnite gumb "Start" i pričekajte da se stranica u potpunosti indeksira. U isto vrijeme, vidjet ćete puni broj radnih i neispravnih veza.
  • Klikom na gumb "Sitemap.xml" spremite datoteku na prikladno mjesto.

  • Sitemap je mapa web stranice u XML formatu koju je 2005. godine Google tražilica počela koristiti za indeksiranje web stranica. Datoteka s kartom web stranice način je organiziranja web stranice, identificirajući adresu i podatke za svaki odjeljak. Prethodno su karte web stranica prvenstveno bile namijenjene korisnicima web stranica. XML format razvijen je za tražilice, omogućujući im brže i učinkovitije pronalaženje podataka.

    Novi Sitemap protokol razvijen je kao odgovor na sve veću veličinu i složenost web stranica. Poslovne web stranice često sadrže tisuće proizvoda u svojim katalozima; popularnost blogova, foruma i oglasnih ploča tjera webmastere da ažuriraju svoje materijale, barem jednom dnevno. Tražilicama postaje sve teže pratiti sav materijal. Preko XML protokola tražilice mogu učinkovitije pratiti adrese, optimizirajući svoje pretraživanje postavljanjem svih informacija na jednu stranicu. XML također pokazuje koliko se često određena web stranica ažurira i bilježi posljednje promjene. XML mape nisu alat za optimizacija pretraživača. To ne utječe na rangiranje, ali omogućuje tražilicama točnije rangiranje i upite za pretraživanje. To se događa pružanjem podataka koje tražilice lako čitaju.

    Opće prihvaćanje XML protokola znači da programeri web stranica više ne moraju stvarati Različite vrste mape stranica za razne tražilice. Oni mogu stvoriti jednu datoteku za prikaz i zatim je ažurirati kada izvrše izmjene na web mjestu. Pojednostavljuje cijeli proces fino podešavanje i proširenja web stranica. I sami webmasteri počeli su uviđati prednosti korištenja ovog formata. Tražilice rangiraju stranice prema relevantnosti određenog sadržaja ključne riječi, ali prije XML formata sadržaji stranica često nisu bili ispravno predstavljeni. Ovo je često frustrirajuće za webmastere koji shvate da su njihovi napori da naprave web stranicu prošli nezapaženo. Blogovi, dodatne stranice, dodavanje multimedijskih datoteka traju nekoliko sati. Kroz XML datoteka ovi sati neće biti izgubljeni, vidjet će ih sve poznate tražilice.

    Da biste izradili svoj XML Sitemap i da tražilice budu u tijeku sa svim promjenama na Vašem web mjestu, isprobajte naš besplatni generator web-mjesta.