Ako vytvoriť a odoslať súbory Sitemap. Podrobná príručka k súboru Sitemap Súbor Sitemap xml - Dostupné smernice

Tento článok vás naučí, ako vytvoriť a poskytnúť súbor Sitemap Prístup Google jemu.

Vytváranie a odosielanie súborov Sitemap

Formáty súborov Sitemap

Google podporuje niekoľko formátov súborov sitemap, ktoré sú popísané nižšie. Všetky formáty by mali používať štandardný protokol. Google momentálne nepodporuje tento atribút V súboroch Sitemap.

Všetky formáty podliehajú nasledujúcim obmedzeniam: súbor Sitemap môže obsahovať maximálne 50 000 adries URL a jeho nekomprimovaná veľkosť nesmie presiahnuť 50 MB. Ak veľkosť súboru alebo počet adries v ňom uvedených presahuje tieto limity, rozdeľte ho na niekoľko častí. Môžete vytvoriť indexový súbor Sitemap so zoznamom všetkých vašich súborov Sitemap a odoslať ich do Google naraz.

Textový súbor

Ak váš súbor Sitemap obsahuje iba adresy stránok, môžete spoločnosti Google poslať súbor vo formáte obyčajného textu s týmito adresami URL (jedna na každom riadku). Príklad:

Http://www.example.com/file1.html http://www.example.com/file2.html

  • Musíte použiť kódovanie UTF-8.
  • Súbor by nemal obsahovať nič iné ako zoznam adries URL.
  • Tento textový súbor môže mať ľubovoľný názov, ale musí používať príponu .txt (napríklad sitemap.txt).

Webové stránky Google

Ak bola vaša lokalita vytvorená a overená pomocou služby Webové stránky Google, mapa lokality sa vytvorí automaticky. Nemôžete ho zmeniť, ale môžete ho odoslať spoločnosti Google, aby získal informácie o prehľadoch. Upozorňujeme, že ak je v jednom podadresári viac ako 1000 stránok, súbor Sitemap sa nemusí zobraziť správne.

  • Ak sú vaše stránky hosťované na stránkach Google, vaša mapa stránok by sa mala nachádzať na adrese http://sites.google.com/site/ VashSait /system/feeds/sitemap .
  • Ak bola stránka vytvorená pomocou Google Apps, adresa URL súboru Sitemap by mala byť: http://sites.google.com/ VašaDoména /VashSait /system/feeds/sitemap .

Prípony súborov Sitemap

Google podporuje rozšírenú syntax v súbore Sitemap pre nasledujúce typy informácií. Pomocou neho môžete pridávať popisy videí, obrázkov a iného obsahu, aby ste zlepšili jeho indexovanie.

XML Sitemap je zoznam adries URL webových stránok vo formáte XML. Súbor Sitemap je navrhnutý tak, aby informoval vyhľadávacie nástroje (ako sú Google, Bing, Yahoo, Yandex, MSN a iné) o stránkach na webovej lokalite, ktoré by mali byť indexované. Mapa stránok výrazne zrýchľuje skenovanie stránok. Mapa stránok vám navyše umožňuje prenášať informácie o všetkých stránkach vašej lokality vrátane tých, ktoré vyhľadávacie nástroje nedokážu získať bežným prehľadávaním.

Vytvorenie súboru Sitemap je obzvlášť užitočné, keď:

  • Na vašom webe sa nové stránky generujú automaticky a často.
  • Vaša stránka je nová a naznačuje malý počet odkazov.
  • Vaša lokalita má veľký archív stránok s obsahom, ktoré sú nekvalitné alebo spolu vôbec nesúvisia.

XML Sitemaps Protocol: Čo obsahuje Sitemap?

V súlade s XML Sitemaps Protocol a požiadaviek vyhľadávačov, súbor Sitemap by nemal obsahovať viac ako 50 000 stránok a nemal by presiahnuť veľkosť 10 MB. To znamená, že ak vaša lokalita obsahuje viac ako 50 000 stránok a veľkosť súboru Sitemap je väčšia ako 10 MB, musíte vytvoriť viacero súborov Sitemap.

... https://whatsappss.ru/sk/URL ... ...

Okrem požadovaného parametra adresy URL poskytuje protokol XML Sitemaps ďalšie značky pre každú stránku:

Lastmod– označuje dátum poslednej zmeny.

Dátum (ISO 8601)

Changefrekv– pravdepodobná frekvencia obsahu stránky. Platné hodnoty sú:

  • vždy – pri každom načítaní stránky
  • každú hodinu - každú hodinu
  • denne – každý deň
  • týždenne – raz týždenne
  • mesačne – raz za mesiac
  • ročne – raz ročne
  • nikdy – znamená, že obsah stránky zostáva nezmenený.
Syntax:

Platná hodnota

Priorita– prioritu stránky vzhľadom na ostatné stránky na vašej lokalite. Platný rozsah - od 0,0 do 1,0. Táto značka umožňuje vyhľadávačom vedieť, ktoré stránky považujete za najhodnotnejšie.

Desatinné od 0,0 do 1,0

Táto stránka obsahuje takmer všetky informácie, o ktorých potrebujete vedieť Sitemap.

Sitemap je mapa stránok navrhnutá tak, aby pomohla robotom vyhľadávacích nástrojov indexovať stránku. názov Sitemap je štandardný, teda štandardne akceptovaný.

Sitemap je zvyčajne uložený na hostiteľskom serveri v adresári public_html stránky. Sitemap sa zvyčajne zapisuje do posledných dvoch riadkov súboru - tam môžete nastaviť iné názvy pre dva súbory sitemap, ako aj iné umiestnenie súborov, aby ste sa pokúsili tieto súbory skryť pred škodlivými programami a ľuďmi. A najpopulárnejšie vyhľadávače sú informované o názve a súradniciach súborov jednotlivo a posielajú ďalšie vyhľadávače ďalej do lesa.

Považujem to za lacné triky, pretože súbor musí byť v adresári public_html stránky. Aj keď je odstránený, keďže to nie je potrebné, útočník, ktorý sa môže dostať do tohto adresára, môže nahradiť tri súbory, aby presmeroval návštevníkov stránky na akúkoľvek inú stránku a jej stránky. Myslím, že takto sú občas napadnuté niektoré stránky.

Sitemap moja stránka je vytvorená pluginom Google XML Sitemaps verzia 3.4 Na hostiteľskom serveri sú v adresári public_html lokality uložené dva súbory: Sitemap.xml A Sitemap.xml.gz a oba súbory sa vytvárajú takmer súčasne.

Súbor Sitemap.xml, ktorý má momentálne dĺžku 103 KB, je vygenerovaný vyššie spomínaným pluginom pri zmene ktorejkoľvek stránky webu.

Súbor Sitemap.xml.gz, s dĺžkou 10 KB, je pomocná a obsahuje v zašifrovanej forme niektoré informácie potrebné pre robota.

Dňa 07.03.2014 sa mi po hľadaní rád na internete podarilo vytiahnuť z internetu dešifrovanú mapu mojej stránky. Dnes som to nemohol zopakovať a včera ma nenapadlo zapísať si algoritmus extrakcie karty. Teraz na tom však nezáleží; o niečo neskôr pochopíte prečo.

Tu je začiatok a koniec súboru, ktorý som včera skonvertoval:
http://site/ 2014-03-07T19:23:22+00:00 denne 1.0
http://site/stroitelstvo/sayt/cms-wordpress 2014-03-07T19:23:22+00:00 denne 0.6.
http://site/posadki/ogorod/pomidoryi 2014-03-07T18:06:27+00:00 denne 0.6.
…… http://site/voprosyi/otvet-15 2013-03-19T13:25:35+00:00 denne 0.6
http://site/sample-page/roshhi/hvoynyie/listvennitsa 2013-03-05T13:01:35+00:00 denne 0.6
http://site/sample-page/roshhi/listvennyie/lipyi 2013-03-05T12:30:19+00:00 denne 0.6

Vo výslednom súbore boli záznamy týkajúce sa jednotlivých strán súvislé a boli oddelené iba dvoma medzerami. Nebol som lenivý si to v editore rozdeliť Poznámkový blok súbor do riadkov a uložený vo formáte TXT. Potom skopírujte obsah súboru dvakrát do stĺpcov prázdnych listov Excel. Zistil som, že bolo vytvorených 591 záznamov s adresami stránok lokality. V druhom stĺpci som zoradil záznamy podľa abecedy.

Keďže v editore Poznámkový blok obsahuje primitívny príkaz na nahradenie, do ktorého sa skopíruje celý obsah konvertovaného súboru Slovo. Potom na príkaz náhrady " Ctrl+H"nahradil http za htp a potom naopak. V oboch prípadoch bolo vykonaných 591 výmen.

Tak bolo možné nestrácať čas delením do riadkov, ale rovno kopírovať do Slovo a vykonajte náhradu, aby ste zistili počet zahrnutých stránok lokality Sitemap.

Tu je začiatok a dva riadky konca súboru Sitemap.xml, skopírované z hostingu:





http://сайт/
2014-03-08T18:55:00+00:00
daily
1.0


http://сайт/stroitelstvo/sayt/sitemap
2014-03-08T18:55:00+00:00
daily
0.6


http://сайт/voprosyi/otvet-15
2013-03-19T13:25:35+00:00
daily
0.6


http://сайт/sample-page/roshhi/hvoynyie/listvennitsa
2013-03-05T13:01:35+00:00
daily
0.6

Posledný záznam sa týka stránky vytvorenej pred viac ako rokom!

Hlavička súboru obsahuje informácie o prostriedkoch, ktorými bol tento súbor vytvorený: verzia WordPress, názov doplnku a, súdiac podľa záznamu v hlavičke, názov externej stránky umiestnenej v Nemecku, kde je štandard sa nachádza program, ktorý vytvára záznamy týkajúce sa stránok lokality a tiež dátum a čas a dátum vytvorenia mapy lokality. Okrem toho obsahuje informácie, podľa akých štandardov bola mapa lokality vytvorená.

Samotné záznamy pravdepodobne vytvára plugin pomocou procesora notebooku, z ktorého sa vykonávajú zmeny na stránkach lokality.

Tieto položky sa nachádzajú medzi и .

4 riadky obsahujú adresu stránky webu, čas poslednej úpravy, odporúčanú frekvenciu prezerania stránky pre robota a odporúčanú prioritu prezerania. Čo znamená 6 znakov „+00:00″ v každom druhom riadku samostatného záznamu a prečo sú potrebné, je úplne nejasné. Myslím, že to možno pochopiť preskúmaním použitého štandardu nahrávania. Ale potrebujeme to?

Po prvé, je dôležité, že záznamy sú zoradené podľa času vytvorenia stránok súboru – to pomáha robotom šetriť čas tým, že neprezerajú tie stránky, ktoré sa od posledného indexovania nezmenili.

Po druhé, vždy môžete kopírovať z hostingu na Slovo celý obsah dlhého súboru Sitemap a rýchlo zistiť počet stránok zahrnutých v mape lokality. Urobil som to asi za minútu – teraz je na mape stránok 593 stránok, keďže som dnes pridal dve stránky.

Po tretie, je celkom zrejmé, že spis Sitemap.xml je príliš dlhá a že sa tvorcovia noriem z nejakého dôvodu rozhodli vytvoriť ju vo forme, ktorej ľudia rozumejú. prečo? Ak máte záujem, hľadajte informácie na internete alebo sa opýtajte svetiel, guruov a iných odborníkov.

Po štvrté, vyhľadávacie roboty pravdepodobne neprečítajú celý súbor, ale iba po vstup stránky, ktorý sa od poslednej návštevy robota na mape lokality nezmenil. A preto pre nich pri súčasných procesoroch redundancia dlhého súboru sitemap nie je dôležitá.

Po piate, vyššie uvedený plugin odvádza skvelú prácu pri vytváraní mapy stránok – môže a mal by sa bezpečne používať.

Po šieste, vždy sa môžete pozrieť na názvy starých stránok na mape lokality a skopírovať ich do adresný riadok prehliadač, spôsobí prepracovanie stránok. Musím to urobiť s mnohými stránkami, aby som stránky zbavil nadmerného počtu uložených revízií a zároveň ich dvakrát skontroloval.

Po siedme, som si istý, že môžeme prísť s mnohými ďalšími užitočné spôsoby pomocou prehľadnej mapy stránok. Dám vám vedieť, keď prídem na nápady.

Pozývam všetkých, aby sa vyjadrili

Ktoré sú potrebné pre vyhľadávacie roboty. Niektorí povedia, že to nie je potrebné, pretože všetky sekcie sú už zobrazené. Potreba takejto stránky však existuje, ak stránka obsahuje päťdesiat alebo viac stránok. Pre vyhľadávače a používateľov poslúži ako návod, ktorý im pomôže pochopiť, kde sa nachádza tá či oná informácia.

XML a HTML súbory

Keďže sa používa nielen pre vyhľadávacie roboty, ale aj pre používateľov navštevujúcich stránku, zvyčajne sa zostavujú dve mapy: vo formátoch XML a HTML.

Ak chcete vytvoriť súbor Sitemap pre vyhľadávacie roboty, použite súbor XML. Vďaka nej si roboty pridávajú nové do svojej vyhľadávacej databázy.V prípade absencie mapy na viacstránkovom webe nemusí byť veľké množstvo stránok indexované niekedy až veľmi dlho.

Súbor HTML sa používa na vytvorenie mapy webu pre používateľov. Význam tejto mapy spočíva v tom, že jej pohodlnosť priamo určuje, či používateľ nájde informácie, ktoré ho zaujímajú, alebo nie. Preto je takáto mapa vytvorená pre tie internetové projekty, v ktorých sa všetky sekcie a ich podsekcie nezmestia do hlavného menu.

Ako vytvoriť súbor Sitemap XML

Existujú tri spôsoby, ako vyriešiť tento problém:

    Nákup generátora pre mapu stránok.

    Vytvorte súbor Sitemap pomocou online služieb.

    Manuálne zapisovanie súboru.

Aby sa výrazne ušetril čas, navrhuje sa nákup generátorov. Preto, ak je dvadsať až tridsať dolárov na nákup licencie pre webmastera malým plytvaním peniazmi, potom ich nákup, najmä pre veľký internetový zdroj, stále neublíži, pretože potom nebudete musieť vytvárať stránky ručne. .

Pre stránky obsahujúce niekoľko stoviek stránok sa odporúčajú online služby, kde na vytvorenie súboru Sitemap stačí uviesť adresu internetového zdroja a stiahnuť výsledok.

Najlepšou možnosťou je manuálne vytvoriť mapu. Na to potrebujete poznať značky ako url, urlset, loc, lastmod, changefreg a priorita. V tomto prípade sa prvé tri štítky považujú za povinné, no od posledných troch možno upustiť.

Vytvorenie súboru Sitemap v Joomle

Na vytvorenie súboru Sitemap na webovej stránke majú Joomla a Wordpress špeciálne doplnky, ako väčšina známe systémy administrácia, vďaka ktorej sa mapa stránok vytvára manuálne alebo automaticky. Pre veľké internetové projekty, ktoré neustále aktualizujú materiály, je tento doplnok veľmi pohodlný.

V Joomle sa nazýva Xmap, vo Wordpresse sa nazýva Google XML Sitemaps.

Automatické vytváranie sitemap

Bezplatné online servery vám pomôžu vytvoriť súbor Sitemap automaticky, ak vaša lokalita nemá viac ako päťsto stránok. Tu je návod, aké ľahké je vygenerovať mapu lokality:

    Po návšteve jedného z týchto internetových zdrojov musíte nájsť položku „Generovať súbor Sitemap“, kliknúť na tlačidlo „Vytvoriť“ a automaticky vytvoriť súbor Sitemap.

    Nájdite „URL stránky“ a zadajte tam adresu stránky, pre ktorú sa vytvára mapa.

    Systém môže vyžadovať zadanie overovacieho kódu. Musíte ho tiež zadať a kliknúť na „Štart“.

    Hotovú mapu nahrajte na webovú stránku.

Manuálny spôsob vytvorenia mapy

Táto metóda je na jednej strane najťažšia, zaberá drahocenný čas, no na druhej strane je správna cesta, používa sa v prípadoch, keď iné možnosti nie sú vhodné. Napríklad, ak existuje veľa stránok, ktoré nie je potrebné zahrnúť do mapy stránok, ale automaticky tam skončia, manuálna metóda samozrejme zachráni mapu pred „predávkovaním“ takýmito stránkami. Ďalším dôvodom pre výber tejto metódy je zlá navigácia na stránke.

Ak chcete implementovať manuálne vytváranie máp, musíte:

    Zbierajte stránky, ktoré chcete zahrnúť do mapy.

    V excelovom súbore vložte všetky adresy do tretieho stĺpca.

    Do 1. a 2. stĺpca vložte url aj loc.

    Do 4. a 5. stĺpca vložte záverečnú url a loc.

    Pomocou funkcie „link“ spojte päť stĺpcov.

    Vytvorte súbor sitemap.xml.

    Do tohto súboru pridajte značky urlset aj /urlset.

    Vložte medzi ne spojený stĺpec.

Výsledný súbor je potrebné skontrolovať. Dá sa to urobiť napríklad v Yandex na paneli správcu webu.

Ako vytvoriť súbor Sitemap pre Yandex a Google

Po vytvorení sa lokalita pridá na lokalitu. Na tento účel by sa mal súbor s mapou lokality nazvať Sitemap.xml a mal by sa pridať do koreňového adresára. Na rýchle nájdenie majú Google a Yandex špeciálne nástroje. Nazývajú sa „Nástroje správcu webu“ (v Google) a „Správca webu Yandex“ (v Yandex).

Pridanie súboru Sitemap do Google

Pridanie súboru Sitemap do Yandex

Podobne sa musíte najprv prihlásiť do správcu webu Yandex. Potom prejdite na súbory Indexovanie/Sitemap, zadajte tam cestu k súboru a kliknite na tlačidlo „Pridať“.

    Vyhľadávacie roboty dnes zoberú iba tie súbory, ktoré neobsahujú viac ako päťdesiattisíc adries URL.

    Ak karta presahuje desať megabajtov, je lepšie ju rozdeliť do viacerých súborov. Vďaka tomu nebude server preťažený.

    Ak chcete správne vytvoriť súbor Sitemap xml, ak existuje niekoľko súborov, musíte ich všetky zaregistrovať v indexovom súbore pomocou značiek sitemapindex, sitemap, loc a lastmod.

    Všetky strany musia byť napísané s predponou „www“ alebo bez nej.

    Požadované kódovanie súboru je UTF8.

    Do súboru musíte pridať aj označenie jazykového priestoru názvov.

Ako vytvoriť mapu stránok pre používateľov

Keďže takáto mapa je vytvorená pre používateľov, mala by byť čo najjednoduchšia a najprehľadnejšia. Napriek tomu je potrebné presne sprostredkovať všetky informácie o štruktúre používanej stránky.

HTML mapy majú vo všeobecnosti známu užívateľskú štruktúru pozostávajúcu zo sekcií a podsekcií zvýraznených špecifickým spôsobom, napr. CSS štýly a grafických prvkov.

Na vytvorenie Sitemap pre veľký internetový projekt, ako v prípade XML mapy, sa aj tu odporúča rozdelenie. V tomto prípade sa vykonáva vo forme samostatných kariet, čím sa eliminuje objemnosť mapy.

Zlepší to funkčnosť stránky jazyk JavaScript, ktorú je povolené používať v tejto mape, pretože nie je vytvorená pre roboty vyhľadávacích nástrojov, ale pre používateľov.

Objednajte si súbor sitemap

Je vhodné, aby vytvorený súbor obsahujúci Sitemap bol vždy čistý a uprataný, najmä ak má stránka veľký počet stránok. Keďže roboty vyhľadávacích nástrojov skenujú mapy stránok veľmi rýchlo, na zobrazenie celého súboru veľkého internetového zdroja jednoducho nemusí byť dostatok času.

Preto, ak si zvyknete pridávať stránky do mapy stránok nie dole, ale hore, potom na jednej strane nie je pochýb o tom, že vyhľadávací robot bude mať čas zobraziť adresy nových stránok a na druhej strane bude takto oveľa jednoduchšie ovládať všetky stránky.

Pomocou nášho generátora máp stránok vytvorte súbory XML, ktoré možno odoslať spoločnostiam Google, Yandex, Bing, Yahoo a iným vyhľadávacím nástrojom, aby ste im pomohli indexovať vašu stránku.

Urobte to v troch jednoduchých krokoch:

  • Do formulára zadajte celú webovú adresu.
  • Kliknite na tlačidlo "Štart" a počkajte, kým sa stránka úplne neprejde. Zároveň uvidíte plný počet funkčných a nefunkčných odkazov.
  • Kliknutím na tlačidlo „Sitemap.xml“ uložte súbor na vhodné miesto.

  • Sitemap je mapa stránok vo formáte XML, ktorú v roku 2005 začal vyhľadávač Google používať na indexovanie webových stránok. Súbor sitemap je spôsob, ako usporiadať webovú stránku, pričom identifikuje adresu a údaje pre každú sekciu. Predtým boli mapy stránok primárne zamerané na používateľov stránok. Formát XML bol vyvinutý pre vyhľadávacie nástroje, ktoré im umožňujú rýchlejšie a efektívnejšie nájsť údaje.

    Nový protokol Sitemap bol vyvinutý v reakcii na rastúcu veľkosť a zložitosť webových stránok. Firemné webové stránky často obsahujú vo svojich katalógoch tisíce produktov; popularita blogov, fór a násteniek núti webmasterov aktualizovať svoje materiály, najmenej raz za deň. Pre vyhľadávače je čoraz ťažšie sledovať všetok materiál. Cez XML protokol vyhľadávače môžu efektívnejšie sledovať adresy a optimalizovať ich vyhľadávanie umiestnením všetkých informácií na jednu stránku. XML tiež ukazuje, ako často sa konkrétna webová lokalita aktualizuje a zaznamenáva posledné zmeny. XML mapy nie sú nástrojom na optimalizácia pre vyhľadávače. Nemá to vplyv na hodnotenie, ale umožňuje vyhľadávačom vytvárať presnejšie hodnotenia a vyhľadávacie dopyty. To sa deje poskytovaním údajov, ktoré sú pre vyhľadávače ľahko čitateľné.

    Všeobecná akceptácia protokolu XML znamená, že vývojári webových stránok už nemusia vytvárať Rôzne druhy mapy stránok pre rôzne vyhľadávače. Môžu vytvoriť jeden súbor pre zobrazenie a potom ho aktualizovať, keď vykonajú zmeny na lokalite. Zjednodušuje to celý proces jemné ladenie a rozšírenia webových stránok. Samotní webmasteri začali vidieť výhody používania tohto formátu. Vyhľadávače zoraďujú stránky podľa relevantnosti konkrétneho obsahu Kľúčové slová, ale pred formátom XML často nebol obsah stránok reprezentovaný správne. To je často frustrujúce pre webmasterov, ktorí si uvedomia, že ich snahy o vytvorenie webovej stránky zostali nepovšimnuté. Blogy, ďalšie stránky, pridávanie multimediálnych súborov trvá niekoľko hodín. Cez XML súbor tieto hodiny nebudú premárnené, uvidia ich všetky známe vyhľadávače.

    Ak chcete vytvoriť svoj súbor XML Sitemap a udržiavať vyhľadávacie nástroje aktuálne so všetkými zmenami na vašej stránke, vyskúšajte náš bezplatný generátor mapy stránok.