Jak vytvářet a odesílat soubory Sitemap. Podrobný průvodce souborem Sitemap Soubor Sitemap xml - Dostupné směrnice

Tento článek vás naučí, jak vytvořit a poskytnout soubor Sitemap Přístup Google jemu.

Vytváření a odesílání souborů Sitemap

Formáty souborů Sitemap

Google podporuje několik formátů souborů Sitemap, které jsou popsány níže. Všechny formáty by měly používat standardní protokol. Google v současnosti tento atribut nepodporuje V souborech Sitemap.

Všechny formáty podléhají následujícím omezením: soubor Sitemap může obsahovat maximálně 50 000 adres URL a jeho nekomprimovaná velikost nesmí přesáhnout 50 MB. Pokud velikost souboru nebo počet adres v něm uvedených překračuje tyto limity, rozdělte jej na několik částí. Můžete vytvořit indexový soubor Sitemap se seznamem všech vašich souborů Sitemap a odeslat je do Googlu všechny najednou.

Textový soubor

Pokud váš soubor Sitemap obsahuje pouze adresy stránek, můžete Googlu poslat prostý textový soubor s těmito adresami URL (jedna na každém řádku). Příklad:

Http://www.example.com/soubor1.html http://www.example.com/soubor2.html

  • Musíte použít kódování UTF-8.
  • Soubor by neměl obsahovat nic jiného než seznam adres URL.
  • Tento textový soubor může mít libovolný název, ale musí používat příponu .txt (například sitemap.txt).

Weby Google

Pokud byl váš web vytvořen a ověřen pomocí Webů Google, soubor Sitemap se vytvoří automaticky. Nemůžete to změnit, ale můžete to odeslat společnosti Google, abyste získali informace o přehledech. Upozorňujeme, že pokud je v jednom podadresáři více než 1000 stránek, soubor Sitemap se nemusí zobrazit správně.

  • Pokud jsou vaše stránky hostovány na Webech Google, měl by být váš soubor Sitemap umístěn na adrese http://sites.google.com/site/ VashSait /system/feeds/sitemap .
  • Pokud byl web vytvořen pomocí Google Apps, adresa URL souboru Sitemap by měla být: http://sites.google.com/ VašeDoména /VashSait /system/feeds/sitemap .

Přípony souborů Sitemap

Google podporuje rozšířenou syntaxi v souboru Sitemap pro následující typy informací. S ním můžete přidávat popisy videí, obrázků a dalšího obsahu, abyste zlepšili jeho indexování.

XML Sitemap je seznam adres URL webových stránek ve formátu XML. Soubor Sitemap je navržen tak, aby informoval vyhledávače (jako je Google, Bing, Yahoo, Yandex, MSN a další) o stránkách na webu, které by měly být indexovány. urychluje prohledávání stránek. Kromě toho vám Sitemap umožňuje přenášet informace o všech stránkách vašeho webu, včetně těch, které vyhledávače nemohou získat běžným procházením.

Vytvoření souboru Sitemap je zvláště užitečné, když:

  • Na vašem webu se nové stránky generují automaticky a často.
  • Váš web je nový a naznačuje malý počet odkazů.
  • Váš web má velký archiv stránek s obsahem, které jsou špatné nebo spolu vůbec nesouvisí.

Protokol XML Sitemaps: Co obsahuje soubor Sitemap?

V souladu s Protokol XML Sitemaps a požadavky vyhledávačů by soubor Sitemap neměl obsahovat více než 50 000 stránek a neměl by přesáhnout velikost 10 MB. To znamená, že pokud váš web obsahuje více než 50 000 stránek a velikost souboru Sitemap je větší než 10 MB, musíte vytvořit více souborů Sitemap.

... https://whatsappss.ru/cs/URL ... ...

Kromě požadovaného parametru adresy URL poskytuje protokol XML Sitemaps další značky pro každou stránku:

Lastmod– označuje datum poslední změny.

Datum (ISO 8601)

Frekvence změn– pravděpodobná frekvence obsahu stránky. Platné hodnoty jsou:

  • vždy – pokaždé, když se stránka načte
  • každou hodinu – každou hodinu
  • denně – každý den
  • týdně – jednou týdně
  • měsíčně – jednou za měsíc
  • ročně – jednou ročně
  • nikdy – znamená, že obsah stránky zůstane nezměněn.
Syntax:

Platná hodnota

Přednost– prioritu stránky vzhledem k ostatním stránkám na vašem webu. Platný rozsah - od 0,0 do 1,0. Tato značka umožňuje vyhledávačům vědět, které stránky považujete za nejhodnotnější.

Desetinné od 0,0 do 1,0

Tato stránka obsahuje téměř všechny informace, o kterých potřebujete vědět Sitemap.

Sitemap je mapa stránek navržená tak, aby pomohla robotům vyhledávačů indexovat stránky. název Sitemap je standardní, to znamená, že je standardně přijímáno.

Sitemap je obvykle uložen na hostitelském serveru v adresáři public_html místo. Sitemap se obvykle zapisuje na poslední dva řádky souboru – zde můžete nastavit jiné názvy pro dva soubory Sitemap a také jiné umístění souborů, abyste se pokusili tyto soubory skrýt před škodlivými programy a lidmi. A nejoblíbenější vyhledávače jsou informovány o jménu a souřadnicích souborů jednotlivě a posílají další vyhledávače dále do lesa.

Považuji to za levné triky, protože soubor musí být v adresáři public_html místo. I když je odstraněn, protože to není nutné, útočník, který se může dostat do tohoto adresáře, může také nahradit tři soubory, aby přesměroval návštěvníky webu na jakýkoli jiný web a jeho stránky. Myslím, že takto jsou občas napadeny některé stránky.

Sitemap můj web je vytvořen pluginem Google XML Sitemaps verze 3.4 Na hostitelském serveru jsou v adresáři public_html webu uloženy dva soubory: Sitemap.xml A Sitemap.xml.gz a oba soubory jsou vytvořeny téměř současně.

Soubor Sitemap.xml, který má aktuálně délku 103 KB, je generován výše zmíněným pluginem při změně jakékoli stránky webu.

Soubor Sitemap.xml.gz, o délce 10 KB, je pomocný a obsahuje v zašifrované podobě některé informace potřebné pro robota.

Dne 03.07.14 se mi po hledání rad na internetu podařilo vytáhnout z internetu dešifrovanou mapu mého webu. Dnes jsem to nebyl schopen zopakovat a včera mě nenapadlo sepsat algoritmus extrakce karty. Nyní je to však jedno; o něco později pochopíte proč.

Zde je začátek a konec souboru, který jsem včera převedl:
http://site/ 2014-03-07T19:23:22+00:00 denně 1.0
http://site/stroitelstvo/sayt/cms-wordpress 2014-03-07T19:23:22+00:00 denně 0,6
http://site/posadki/ogorod/pomidoryi 2014-03-07T18:06:27+00:00 denně 0.6
…… http://site/voprosyi/otvet-15 2013-03-19T13:25:35+00:00 denně 0.6
http://site/sample-page/roshhi/hvoynyie/listvennitsa 2013-03-05T13:01:35+00:00 denně 0,6
http://site/sample-page/roshhi/listvennyie/lipyi 2013-03-05T12:30:19+00:00 denně 0.6

Ve výsledném souboru byly záznamy týkající se jednotlivých stránek souvislé a oddělené pouze dvěma mezerami. Nebyl jsem líný si to v editoru rozdělit poznámkový blok soubor do řádků a uložen ve formátu TXT. Poté zkopírujte obsah souboru dvakrát do sloupců prázdného listu Vynikat. Zjistil jsem, že bylo vytvořeno 591 záznamů s adresami stránek webu. Ve druhém sloupci jsem položky seřadil abecedně.

Od v editoru poznámkový blok obsahuje primitivní příkaz nahrazení, do kterého byl zkopírován celý obsah převedeného souboru Slovo. Poté na příkaz nahrazení " Ctrl+H"nahradil http za htp a pak naopak. V obou případech bylo provedeno 591 výměn.

Bylo tedy možné neztrácet čas dělením do řádků, ale rovnou kopírovat do Slovo a proveďte náhradu, abyste zjistili počet zahrnutých stránek webu Sitemap.

Zde je začátek a dva řádky konce souboru Sitemap.xml, zkopírováno z hostingu:





http://сайт/
2014-03-08T18:55:00+00:00
daily
1.0


http://сайт/stroitelstvo/sayt/sitemap
2014-03-08T18:55:00+00:00
daily
0.6


http://сайт/voprosyi/otvet-15
2013-03-19T13:25:35+00:00
daily
0.6


http://сайт/sample-page/roshhi/hvoynyie/listvennitsa
2013-03-05T13:01:35+00:00
daily
0.6

Poslední záznam odkazuje na stránku vytvořenou před více než rokem!

Záhlaví souboru obsahuje informace o prostředcích, kterými byl tento soubor vytvořen: verze WordPressu, název pluginu a, soudě podle záznamu v záhlaví, název externího webu umístěného v Německu, kde je standard je umístěn program, který vytváří záznamy týkající se stránek webu a také datum a čas a datum vytvoření mapy webu. Navíc obsahuje informace, podle jakých standardů byla mapa webu vytvořena.

Samotné záznamy pravděpodobně vytváří plugin pomocí procesoru notebooku, ze kterého se provádějí změny na stránkách webu.

Tyto položky jsou umístěny mezi и .

4 řádky obsahují adresu stránky webu, čas poslední úpravy, doporučenou frekvenci prohlížení stránky pro robota a doporučenou prioritu prohlížení. Co znamená 6 znaků „+00:00″ na každém druhém řádku samostatné položky a proč jsou potřeba, je zcela nejasné. Myslím, že to lze pochopit, když prozkoumám použitý záznamový standard. Ale potřebujeme to?

Zaprvé je důležité, že záznamy jsou seřazeny podle času vytvoření stránek souboru – to pomáhá robotům ušetřit čas tím, že neprohlížejí stránky, které se od posledního indexování nezměnily.

Za druhé, vždy můžete kopírovat z hostingu na Slovo veškerý obsah dlouhého souboru Sitemap a rychle zjistit počet stránek zahrnutých v mapě webu. Udělal jsem to asi za minutu – nyní je v mapě webu 593 stránek, protože jsem dnes přidal dvě stránky.

Za třetí je zcela zřejmé, že spis Sitemap.xml je příliš dlouhý a že se tvůrci standardů z nějakého důvodu rozhodli vytvořit jej ve formě, které lidé rozumějí. Proč? Máte-li zájem, hledejte informace na internetu nebo se zeptejte světoborců, guruů a dalších odborníků.

Za čtvrté, vyhledávací roboti pravděpodobně nečtou celý soubor, ale pouze do vstupu stránky, která se od poslední návštěvy robota na mapě webu nezměnila. A proto pro ně u současných procesorů není redundance dlouhého souboru sitemap důležitá.

Za páté, výše zmíněný plugin odvádí skvělou práci při vytváření mapy webu – může a měl by být bezpečně používán.

Za šesté, vždy se můžete podívat na názvy starých stránek v mapě webu a zkopírovat je do adresní řádek prohlížeč, způsobí přepracování stránek. Potřebuji to udělat s mnoha stránkami, abych zbavil stránky nadměrného počtu uložených revizí a zároveň je dvakrát zkontroloval.

Za sedmé, jsem si jistý, že můžeme přijít s mnoha dalšími užitečné způsoby pomocí přehledné mapy webu. Dám vám vědět, až mě napadnou.

Vyzývám všechny, aby se vyjádřili

Které jsou potřebné pro vyhledávací roboty. Někdo řekne, že to není potřeba, protože všechny sekce jsou již zobrazeny. Potřeba takové stránky však existuje, pokud web obsahuje padesát nebo více stránek. Pro vyhledávače a uživatele poslouží jako vodítko, které jim pomůže pochopit, kde je ta či ona informace obsažena.

XML a HTML soubory

Protože se používá nejen pro vyhledávací roboty, ale také pro uživatele navštěvující stránky, jsou obvykle sestavovány dvě mapy: ve formátech XML a HTML.

Chcete-li vytvořit soubor Sitemap pro vyhledávací roboty, použijte soubor XML. Díky ní si roboti přidávají nové do své vyhledávací databáze. Při absenci mapy na vícestránkovém webu nemusí být velké množství stránek indexováno někdy až velmi dlouho.

Soubor HTML se používá k vytvoření mapy webu pro uživatele. Význam této mapy spočívá v tom, že její pohodlnost přímo určuje, zda uživatel najde informace, které ho zajímají, či nikoli. Proto je taková mapa vytvořena pro ty internetové projekty, ve kterých se všechny sekce a jejich podsekce nevejdou do hlavního menu.

Jak vytvořit soubor Sitemap XML

Tento problém lze vyřešit třemi způsoby:

    Nákup generátoru pro mapu webu.

    Vytvořte soubor Sitemap pomocí online služeb.

    Ruční zápis souboru.

Pro výraznou úsporu času se navrhuje nákup generátorů. Pokud je tedy dvacet až třicet dolarů na nákup licence pro webmastera malou ztrátou peněz, pak jeho nákup, zejména pro velký internetový zdroj, stále neuškodí, od té doby nebudete muset vytvářet stránky ručně .

Pro web obsahující několik stovek stránek se doporučují online služby, kde pro vytvoření souboru Sitemap stačí uvést adresu internetového zdroje a stáhnout výsledek.

Nejlepší možností je vytvořit mapu ručně. K tomu potřebujete znát značky jako url, urlset, loc, lastmod, changefreg a priorita. V tomto případě jsou první tři značky považovány za povinné, ale od posledních tří lze upustit.

Vytvoření souboru Sitemap v Joomle

Pro vytvoření souboru Sitemap na webu mají Joomla a Wordpress speciální doplňky, jako většina známé systémy administrace, díky které se mapa stránek vytváří ručně nebo automaticky. Pro velké internetové projekty, které neustále aktualizují materiály, je toto přidání velmi výhodné.

V Joomle se nazývá Xmap, ve Wordpressu se nazývá Google XML Sitemaps.

Automatické vytváření sitemap

Bezplatné online servery vám pomohou vytvořit soubor Sitemap automaticky, pokud váš web nemá více než pět set stránek. Zde je návod, jak snadné je vytvořit soubor Sitemap:

    Po návštěvě jednoho z těchto internetových zdrojů musíte najít položku „Generovat soubor Sitemap“, kliknout na tlačítko „Vytvořit“ a automaticky vytvořit soubor Sitemap.

    Najděte „URL webu“ a zadejte tam adresu webu, pro který se mapa vytváří.

    Systém může vyžadovat zadání ověřovacího kódu. Musíte jej také zadat a kliknout na „Start“.

    Hotovou mapu nahrajte na web.

Manuální způsob vytvoření mapy

Tato metoda je na jednu stranu nejobtížnější, zabírá drahocenný čas, ale na druhou stranu je to nejvíce správná cesta, používá se v případech, kdy jiné možnosti nejsou vhodné. Pokud tedy například existuje mnoho stránek, které není zvláště nutné zahrnout do mapy webu, ale automaticky tam skončí, ruční metoda samozřejmě zachrání mapu před „předávkováním“ takových stránek. Dalším důvodem pro volbu této metody je špatná navigace na webu.

Chcete-li implementovat ruční vytváření map, musíte:

    Sbírejte stránky, které chcete zahrnout do mapy.

    V excelovém souboru vložte všechny adresy do třetího sloupce.

    Do 1. a 2. sloupce vložte url i loc.

    Do 4. a 5. sloupce vložte závěrečnou url a loc.

    Pomocí funkce „link“ spojte pět sloupců.

    Vytvořte soubor sitemap.xml.

    Přidejte do tohoto souboru značky urlset i /urlset.

    Mezi ně vložte připojený sloupek.

Výsledný soubor je třeba zkontrolovat. To lze provést například v Yandexu na panelu webmastera.

Jak vytvořit soubor Sitemap pro Yandex a Google

Po vytvoření je web přidán na web. Pro tento účel by se soubor s mapou webu měl jmenovat Sitemap.xml a měl by být přidán do kořenového adresáře. Pro rychlé nalezení mají Google a Yandex speciální nástroje. Nazývají se „Nástroje pro webmastery“ (v Googlu) a „Webmaster Yandex“ (v Yandexu).

Přidání souboru Sitemap na Google

Přidání souboru Sitemap na Yandex

Stejně tak se musíte nejprve přihlásit k webu Yandex Webmaster. Poté přejděte na Soubory indexování/Sitemap, zadejte tam cestu k souboru a klikněte na tlačítko „Přidat“.

    Vyhledávací roboti dnes vezmou pouze soubory, které neobsahují více než padesát tisíc adres URL.

    Pokud karta přesahuje deset megabajtů, je lepší ji rozdělit do více souborů. Díky tomu nedojde k přetížení serveru.

    Chcete-li správně vytvořit soubor Sitemap xml, pokud existuje několik souborů, musíte je všechny zaregistrovat do souboru indexu pomocí značek sitemapindex, sitemap, loc a lastmod.

    Všechny stránky musí být napsány s předponou „www“ nebo bez ní.

    Požadované kódování souboru je UTF8.

    Musíte také přidat označení jmenného prostoru jazyka v souboru.

Jak vytvořit mapu webu pro uživatele

Jelikož je taková mapa vytvořena pro uživatele, měla by být co nejjednodušší a přehledná. Navzdory tomu je nutné přesně zprostředkovat všechny informace o struktuře používaného webu.

HTML mapy mají obecně známou uživatelskou strukturu sestávající z sekcí a podsekcí zvýrazněných specifickým způsobem, např. CSS styly a grafické prvky.

Pro vytvoření Sitemap pro velký internetový projekt, jako v případě XML mapy, je zde také doporučeno rozdělení. V tomto případě se provádí ve formě samostatných záložek, čímž se eliminuje objemnost mapy.

Zlepší funkčnost stránky jazyk JavaScript, kterou je povoleno používat v této mapě, protože není vytvořena pro roboty vyhledávačů, ale pro uživatele.

Objednejte si soubor sitemap

Je vhodné, aby vytvořený soubor obsahující Sitemap byl vždy čistý a uklizený, zvláště pokud má web velký počet stránek. Protože roboti vyhledávačů skenují soubory Sitemap velmi rychle, nemusí být dostatek času na zobrazení celého souboru velkého internetového zdroje.

Pokud si tedy zvyknete přidávat stránky do mapy webu nikoli dole, ale nahoře, pak na jedné straně není pochyb o tom, že vyhledávací robot bude mít čas zobrazit adresy nových stránek a na druhou stranu tímto způsobem bude mnohem jednodušší ovládat všechny stránky.

Pomocí našeho generátoru souborů Sitemap vytvořte soubory XML, které lze odeslat do vyhledávačů Google, Yandex, Bing, Yahoo a dalších vyhledávačů, které jim pomohou indexovat váš web.

Udělejte to ve třech jednoduchých krocích:

  • Do formuláře zadejte úplnou adresu URL webu.
  • Klikněte na tlačítko "Start" a počkejte, dokud nebude stránka plně prohledána. Zároveň uvidíte plný počet funkčních i nefunkčních odkazů.
  • Kliknutím na tlačítko „Sitemap.xml“ uložte soubor na vhodné místo.

  • Sitemap je mapa stránek ve formátu XML, kterou v roce 2005 začal vyhledávač Google používat k indexování stránek webových stránek. Soubor Sitemap je způsob, jak uspořádat webovou stránku, identifikovat adresu a data pro každou sekci. Dříve byly soubory Sitemap zaměřeny především na uživatele webu. Formát XML byl vyvinut pro vyhledávače, které jim umožňují najít data rychleji a efektivněji.

    Nový protokol Sitemap byl vyvinut v reakci na rostoucí velikost a složitost webových stránek. Firemní webové stránky často obsahují tisíce produktů ve svých katalozích; popularita blogů, fór a nástěnek nutí webmastery aktualizovat své materiály, alespoň jednou denně. Pro vyhledávače je stále obtížnější sledovat veškerý materiál. Přes XML protokol vyhledávače mohou sledovat adresy efektivněji a optimalizovat jejich vyhledávání umístěním všech informací na jednu stránku. XML také ukazuje, jak často je konkrétní webová stránka aktualizována a zaznamenávána poslední změny. XML mapy nejsou nástrojem pro optimalizace pro vyhledávače. To neovlivňuje hodnocení, ale umožňuje vyhledávačům provádět přesnější hodnocení a vyhledávací dotazy. To se děje poskytováním dat, která jsou pro vyhledávače snadno čitelná.

    Obecné přijetí protokolu XML znamená, že vývojáři webových stránek již nemusí vytvářet Různé typy mapy stránek pro různé vyhledávače. Mohou vytvořit jeden soubor pro zobrazení a poté jej aktualizovat, když na webu provedou změny. Zjednodušuje to celý proces doladění a rozšíření webových stránek. Sami webmasteři začali vidět výhody používání tohoto formátu. Vyhledávače řadí stránky podle relevance konkrétního obsahu klíčová slova, ale před formátem XML často nebyl obsah stránek reprezentován správně. To je často frustrující pro webmastery, kteří si uvědomují, že jejich snahy o vytvoření webu zůstaly bez povšimnutí. Blogy, další stránky, přidávání multimediálních souborů trvá několik hodin. Přes XML soubor tyto hodiny nebudou promarněné, uvidí je všechny slavné vyhledávače.

    Chcete-li vytvořit svůj soubor Sitemap ve formátu XML a udržovat vyhledávače aktuální o všech změnách na vašem webu, vyzkoušejte náš bezplatný generátor souborů Sitemap.