Creați sitemap xml online. Creare sitemap

(Ultima actualizare: 17.02.2019)

Salut colegi! În această postare o să vă spun cum să creați și să configurați un Sitemap pentru WordPress, pentru motoarele de căutare precum Yandex, Google, Bing, [email protected]. Nu confundați XML cu HTML. Primul este potrivit pentru motoarele de căutare, iar al doilea este destinat în primul rând utilizatorilor. Probabil că știți deja ce este un sitemap XML. Permiteți-mi să vă reamintesc: aceasta este o listă de pagini ale site-ului/blogului dvs. pe care vizitatorii dvs. nu le văd, dar sunt doar vizibile clar. Fișierul XML Sitemap vă permite să informați Google și Yandex despre paginile site-ului dvs., astfel încât acestea să fie incluse în indexul motorului de căutare.

Plugin Google XML Sitemaps pentru WordPress

Sitemaps-urile XML pot ajuta motoarele de căutare să determine locația paginilor site-ului, paginilor de blog, când au fost actualizate ultima dată, frecvența actualizărilor și importanța față de alte pagini de pe resursa web, astfel încât motorul de căutare să poată indexa site-ul mai inteligent.

Ce este un Sitemap?

Sitemap - fișiere XML cu informații pentru motoarele de căutare (cum ar fi Google, Yandex, Bing, [email protected]) despre paginile site-ului care fac obiectul indexării. Mai simplu spus, acestea sunt adresele URL ale site-urilor pe care le trimiteți către motoarele de căutare.

Yandex acceptă formatele XML și TXT. Formatul XML permite transmiterea de informații suplimentare.

Pluginul ne va ajuta să creăm un blog sau o hartă a site-ului pe WordPress Google XML Sitemaps. Care generează un fișier XML, îl actualizează și așa mai departe. Tot ce aveți nevoie este un plugin, configurați-l și uitați de el. Instalarea Google XML Sitemaps este standard.

Google XML Sitemaps WordPress Plugin

Unul dintre cele mai bune plugin-uri WP. Acesta va oferi un sitemap XML complet pentru motoarele de căutare. A fost deja instalat de peste 24.243.146 de ori.


Pluginul Google XML Sitemaps

Utilizați acest plugin, vă va îmbunătăți considerabil SEO. Acesta va crea o hartă de site XML specială și va ajuta motoarele de căutare precum Google, Bing, Yandex și Mail Ru să indexeze mai bine resursa dvs. web. Cu o astfel de hartă a site-ului, este mult mai ușor pentru crawlere să vadă structura completă a site-ului dvs. și să o extragă mai eficient. Pluginul acceptă toate tipurile de pagini generate de WordPress, precum și adrese URL personalizate.

În plus, notifică toate motoarele de căutare majore de fiecare dată când postați conținut nou. Modulul este complet gratuit și tradus în rusă (deși nu complet, dar cele mai importante lucruri au fost traduse).

Instalați pluginul în modul obișnuit folosind funcția Plugins - Add New. În câmpul de căutare, introduceți numele Google XML Sitemaps:


Instalarea pluginului din panoul de administrare

Configurarea sitemap-urilor XML

După instalarea și activarea cu succes a pluginului, trebuie să-l configurați. În secțiunea „Setări”, faceți clic pe:

setări xml sitemap

Se va deschide pagina: XML Sitemap Generator pentru WordPress, unde trebuie să-l configurați. Pe această pagină, în partea de sus, veți vedea un link către cardul dvs.:


Link către harta xml a site-ului dvs

Puteți da clic pe el și să vedeți cum arată:

Sitemap XML pentru motoarele de căutare

Setările importante sunt în limba noastră nativă și puternică rusă, așa că nu vă va fi dificil să înțelegeți totul. Ce setari se pot face? Dezvoltatorul pluginului indică faptul că valorile implicite sunt potrivite pentru majoritatea site-urilor. Dar totuși, fiecare utilizator trebuie să decidă singur. Indicați ce categorii să excludeți de pe hartă, conținutul hărții site-ului, prioritățile, frecvența modificărilor și așa mai departe. Ar trebui sa fie cam asa:

Setări pentru site-ul dvs. de hărți xml

După toate setările, asigurați-vă că faceți clic pe „Actualizați setările”. Gata. Următorul pas este să adăugați fișierul Sitemap în motorul de căutare webmaster pentru a accelera indexarea site-ului WordPress. Și adăugați, de asemenea, un link către hartă în robots.txt.

Deci, ce pagini ar trebui să includeți în harta dvs.? Din motive SEO, se recomandă să includeți numai paginile pe care ați dori să le vedeți în căutări.

Acum, atunci când scrieți un articol, pluginul va informa motoarele de căutare (nu toate, ci doar Google, Bing, Yahoo și Ask.com) despre actualizarea blogului dvs. Pluginul îți va actualiza automat harta site-ului dacă postezi, așa că nu mai trebuie să faci nimic

Pentru alte motoare de căutare, trebuie să faceți acest lucru - citiți.

Vă rugăm să rețineți, prieteni, funcția XML Sitemaps este disponibilă în pluginuri SEO și .

Toate cele bune și ne vedem din nou. Pa! Pa!

Bună ziua, dragi cititori!

Indexarea resurselor web de către motoarele de căutare este o chestiune complexă. Și nu numai pentru webmasteri, ci și pentru motoarele de căutare înșiși și roboții lor. Pentru a le ușura sarcina, a fost inventat un astfel de lucru precum sitemap.xml. Cu ajutorul acestuia, roboții vor putea naviga pe paginile proiectului dumneavoastră. De exemplu, vedeți categorii, etichete, pagini cu conținut nestandard etc.

Sitemap-ul este important atât pentru scriitorii de articole, cât și pentru alte proiecte, precum magazinele online, stocurile de fotografii sau chiar paginile de destinație (mai ales dacă acestea conțin mai multe pagini). Astăzi vom vorbi despre cum poate fi creat chiar acest sitemap și vom aborda, de asemenea, subiectul celei mai preferate opțiuni pentru WordPress.

Vă voi spune mai detaliat de ce este necesar un Sitemap. Acesta este un fișier cu link-uri către pagini de blog/site care notifică motoarele de căutare despre structura actuală a resursei.

Poate fi static sau dinamic. Primul este relevant pentru aceleași resurse web statice, care nu se actualizează.

O astfel de hartă a site-ului este ușor creată folosind un generator automat și plasată în folderul rădăcină al resursei. A doua opțiune este relevantă pentru majoritatea proiectelor - toate modificările de conținut sunt luate în considerare și sunt introduse automat în fișierul xml.

Acest feed poate fi apoi adăugat la Yandex.Webmaster și Search Console. Datorită acestui fapt, motoarele de căutare vor ști despre toate schimbările care au loc asupra resursei tale. Fie că este vorba de lansarea unui articol nou sau de o simplă modificare a numărului de pe pagina de contact.

Desigur, în cazul unui fișier static creat folosind generatorul, va trebui să-l încărcați din nou la rădăcină, manual. Nu este cea mai convenabilă opțiune, dar dacă site-ul tău este scris în pur html + css și este actualizat o dată pe an, atunci acest lucru este totuși tolerabil.

Dacă lucrați cu un CMS, cum ar fi WordPress, atunci acest proces poate fi simplificat și accelerat cât mai mult posibil. Cu ajutorul pluginurilor puteți uita de orice manipulări manuale. Trebuie doar să organizați activitatea unei astfel de extensii, să configurați totul și apoi să trimiteți linkul către serviciile menționate mai sus. Este simplu, fără durere. Vom vorbi despre cum să facem asta mai târziu.

Cum se creează Sitemap.xml pentru WordPress

O hartă a site-ului, așa cum am spus deja, poate fi creată într-o varietate de moduri. Până la punctul de a-l scrie manual. Dar să nu ne oprim asupra acestui lucru, să trecem la a lua în considerare metode mai adecvate.

Puteți crea un sitemap folosind:

  • generator online;
  • programe (același generator, doar nu online);
  • pluginuri;
  • manual.

Să vorbim mai detaliat despre toate aceste opțiuni.

Generatoare și programe online

Cu ajutorul lor, veți crea o versiune statică a sitemap.xml. Nu va fi actualizat, deci este potrivit pentru proiectele în care modificările nu apar atât de des. Vă rugăm să rețineți că de fiecare dată pentru a vă menține harta actualizată, va trebui să reintroduceți serviciul și să îl generați, apoi înlocuiți fișierul vechi cu unul nou.

Dacă resursa dvs. web este actualizată în fiecare zi, atunci această variantă a sitemapului nu pare foarte atractivă. Cu toate acestea, în anumite circumstanțe, vă puteți permite această metodă. De exemplu, dacă site-ul dvs. este o carte de vizită sau o pagină de destinație cu mai multe pagini și informații despre companie.

Același lucru este valabil și pentru programele generatoare (de obicei, cele plătite). Pur și simplu creați un fișier xml care nu se actualizează și îl încărcați pe gazdă folosind FTP sau un manager de fișiere. În teorie, desigur, puteți aduce această metodă la bun sfârșit făcând-o semi-automată. Dar nu este nevoie de asta, deoarece cu ajutorul extensiilor speciale puteți crea un sitemap dinamic și puteți uita complet de astfel de probleme.

Deci, exemple de servicii online pentru crearea sitemapurilor:

  • XML-Sitemaps (până la 500 de pagini),
  • Generator gratuit de Sitemap (până la 5.000 de pagini),

Cum functioneaza?

Același lucru este valabil și pentru produsele software. Dar nu voi vorbi despre ele aici, așa că puteți căuta singuri informații despre ele.

Aici voi observa că unele servicii online oferă o opțiune de utilizare plătită, care constă într-un număr nelimitat de pagini sau aducerea procesului la semi-automatizare. Harta site-ului este actualizată în mod regulat folosind instrumentele încorporate ale acestor servicii. Tot ce trebuie să faceți este să configurați încărcarea automată. Cred că aceasta este o cârjă, mai ales pentru CMS, inclusiv WordPress.

Pluginuri

Aici trecem la partea principală a acestui material. Pluginurile, în opinia mea, sunt cel mai preferat mod de a crea un sitemap. Datorită acestor extensii grozave, nu trebuie să fiți la curent sau să descărcați fișiere ciudate. Trebuie doar să faceți clic pe butonul „Instalare” direct în panoul de administrare - și ați terminat.

Există o mulțime de pluginuri cu care puteți face acest lucru. Mai jos voi oferi o listă cu cele mai populare și populare și, de asemenea, voi vorbi pe scurt despre fiecare dintre ele.

  • Yoast SEO

Un plugin SEO multifuncțional, care, printre altele, include și un instrument de creare automată a sitemapului. Este activat implicit, așa că imediat după instalare veți primi o hartă gata făcută. Îl puteți găsi la: site.ru/sitemap_index.xml. Interesant este că pluginul creează sitemap-uri separate pentru postări, categorii, etichete și arhive. În teorie, va fi și mai ușor pentru motoarele de căutare să navigheze în toate aceste elemente.

  • Pachet SEO All in One

Există, de asemenea, posibilitatea de a crea sitemap-uri. Este un analog al pluginului anterior și al concurentului său direct. La fel ca Yoast SEO, harta este generată automat și ținută la zi.

  • Google XML Sitemaps

Dar aceasta este o soluție specializată pentru generarea automată a sitemap.xml. Google Sitemaps vă va permite să creați un sitemap ordonat, care va fi acceptat de aproape toate motoarele de căutare.

Este de remarcat faptul că acest plugin are peste un milion de instalări. Majoritatea acestor utilizatori au instalate și soluții bogate în funcții. Pur și simplu dezactivează aceste funcții, dând preferință Google XML Sitemaps.

Această extensie este ușor de instalat și configurat. Suportul este oferit de 9 ani, astfel încât dezvoltatorii pot fi cu siguranță de încredere (un mare plus pentru milioane de instalări). Cu siguranță îl recomand ca fiind una dintre cele mai bune metode.

  • Sitemap XML și fluxuri de Știri Google

Doi in unu. Cu acest supliment puteți crea nu numai o hartă xml, ci și un feed suplimentar pentru Știri Google. Acum pluginul are peste 100.000 de instalări, așa că vă sfătuiesc să fiți atenți și la el. Ca și în cazul restului variațiilor, acordarea este ușor de reprodus.

  • Google Sitemap de BestWebSoft

Un plugin din ce în ce mai popular cu suport pentru limba rusă. Este simplu: instalează-l pe resursa ta WordPress, după care sunt generate fișiere în format xml pentru toate taxonomiile tale.

În catalogul de pluginuri puteți găsi un număr mare de soluții diferite – bune și nu atât de bune. În orice caz, recomand să instalați numai produse dovedite cu recenzii bune și un fundal sub formă de timp sau număr de instalări pe proiectul dvs. În alte circumstanțe, riscați un fiasco din cauza unui produs de calitate scăzută.

De asemenea, observ că unele dintre extensiile prezentate necesită configurare. Luați în considerare acest fapt.

Manual

O metodă care necesită timp, cunoștințe și răbdare. Apropo, foarte nepractic. În general, va trebui să vă dați seama de sintaxa de markup xml și apoi să introduceți unul câte unul toate datele portalului dvs. acolo. Chiar dacă resursa dvs. web are doar câteva zeci de pagini, tot trebuie să munciți din greu, introducând datele pentru fiecare într-un document xml. Să nu mai vorbim de sute și mii, când pur și simplu vei înnebuni dacă încerci să o implementezi cu mâinile tale.

Va trebui să introduceți manual totul, de la url la orice imagine conținută în articol sau pe pagină. Desigur, va trebui să monitorizați sintaxa și corectitudinea completării acestor date. Dacă faceți vreo greșeală, motoarele de căutare pur și simplu nu vă vor accepta fișierul. Fiți extrem de atenți atunci când alegeți această metodă. Cel mai probabil, acest lucru este recomandabil doar pentru propria ta dezvoltare și pentru studierea markupului xml, dar nimic mai mult.

Ce să faci în continuare cu cardul

Pentru a ajuta motoarele de căutare să găsească o hartă a proiectului dvs., puteți utiliza servicii precum Yandex.Webmaster și Search Console. Fiecare dintre ele are instrumente pentru trimiterea sitemapurilor, precum și date despre toate erorile care ar fi putut apărea în timpul generării acestuia. Trebuie să știți linkul exact către hartă pentru a o adăuga. De regulă, se află chiar la rădăcină. Prin urmare, pentru a merge la fișierul xml, trebuie doar să specificați numele și formatul acestuia.

Adăugarea la Yandex.Webmaster

Accesați webmaster, apoi selectați site-ul nostru (dacă există mai multe dintre ele). Apoi, accesați fila Indexare – Fișiere Sitemap. Aici vom gestiona fișierele sitemap pentru proiectul nostru. Copiați adresa sitemap-ului în câmp, apoi faceți clic pe „Adăugați”.

După ce adăugați fișierul la serviciu, puteți face clic pe pictograma săgeată pentru ca motorul de căutare să înceapă să citească fișierul.

Search Console

Mergem la consolă, după care mergem la secțiunea Scanare – Fișiere Sitemap. Altfel totul este la fel. Adăugăm fișierul și îl verificăm pentru erori.

Concluzie

Sper că acum înțelegeți ce este un sitemap și de ce este necesar. După cum puteți vedea, nu este nimic complicat în a-l crea. Trebuie doar să știi modalitățile în care poți implementa această chestiune.

Cum să generați un sitemap depinde de dvs. Dar trebuie să remarc că pentru WordPress cea mai preferată metodă sunt pluginurile. Mai mult decât atât, majoritatea pluginurilor SEO multifuncționale au această opțiune încorporată, dar tot trebuie să alegeți un plugin SEO.

Sitemap-ul este extrem de important pentru optimizarea motoarelor de căutare, iar dacă doriți să aflați mai multe despre el, atunci vă invit să faceți . În acesta veți lua în considerare toate aspectele optimizării SEO a proiectelor.

Asta e tot, mulțumesc pentru atenție.

Am lansat o nouă carte, Social Media Content Marketing: How to Get Inside Your Followers' Heads and Make them to Love with Your Brand.

Abonati-va

A avea un sitemap xml () pe server este important din punct de vedere strategic pentru optimizare. Harta stochează structura paginilor curente ale resursei dvs. și servește pentru a se asigura că roboții de căutare navighează mai repede pe site și paginile dvs. sunt indexate mai rapid. Cu alte cuvinte: harta site-ului arată roboților de căutare cea mai scurtă cale către pagini. Iată un carusel.

Ce este mai exact în harta site-ului?

Fișier Sitemap. xml conține nu numai adresele URL ale paginilor, ci și informații suplimentare pentru fiecare pagină:

  • data ultimei modificări;
  • frecvența schimbărilor;
  • prioritate la nivel de amplasament.

Desigur, este foarte dificil să scrieți manual acest fișier. Mai ales dacă ai un magazin online mare. Conceput pentru a face viața mai ușoarăgenerator de hărți de site online (generator de hărți de site online), care face toată munca de rutină pentru tine.

În acest moment există destul de multe resurse pentru generarea hărților în acest articol voi vorbi despre cele mai popularegeneratoare online.

Cum se generează un sitemap și cum funcționează acest sistem infernal?

Aproape toate serviciile sunt despregenerarea de harti de site onlinelucrează pe același principiu. Chiar și interfața este aproximativ aceeași peste tot, doar stilul de design și locația butoanelor de control sunt diferite.

Deci treci la tipicgenerator online...Ce este cel mai probabil să vezi? Dreapta! Câmp de introducere a adresei URL. Introducem site-ul de care avem nevoie. De exemplu, vom folosi generatorul de hartă a site-ului cy-pr.com.

Introducem adresa site-ului nostru, selectăm frecvența de actualizare (dacă aveți nevoie), puteți folosi și data ultimei actualizări pentru comoditate (pentru a vă aminti când a fost creată harta) și faceți clic pe butonul „Creați”.

Odată apăsat, magia se întâmplă! Veți putea urmări modul în care serviciul harnic rulează pe site-ul dvs., înregistrând fiecare pagină într-un fișier. După un astfel de maraton, generatorul de hărți vă oferă întregul său manuscris cu o descriere a fiecărei pagini:

Acum trebuie să-l salvăm. Pentru a face acest lucru, deschideți notepad, lipiți acolo codul nostru, pe care ni l-a dat sistemul infernal, faceți clic pe „salvare ca”, apoi introduceți numele fișierului „ sitemap.xml ", selectați tipul "toate fișierele", selectați codificarea utf-8 și faceți clic pe butonul "salvare".

Am primit dosarul sitemap.xml:)

Atenție la registre! Titlul hărții site-ului trebuie să fie cu litere mici

Dacă ați făcut totul corect, veți primi următorul fișier:

Este important să rețineți că harta site-ului nu este din cauciuc - plafonul este de 50.000 url.Harta finalizată poate fi încărcată pe server. Principalul lucru este că nu uitați să scrieți în roboți că aveți o hartă! Roboții sunt dăunători și nu-i vor căuta ei înșiși :)

Dacă decideți să nu utilizați serviciilegenerarea sitemapului online, dar vrei să faci hardcore și să scrii totul singur, atunci ar trebui să-i cunoști pe toți din această listă:

  1. - Тег в котором указывается данные об url
  2. - В этом теге заключаются данные о многих url
  3. https://radiobud.ru/ro/ - Используется для указания url
  4. - Хранит дату последнего изменения
  5. - Данные о частотности изменения (могу использоваться атрибуты « always, hourly, daily, weekly, monthly, yearly, never» )
  6. Описывает приоритет страницы по сравнению с другими (от 0.1 - холоп до 1 - царь)

, и являются обязательными, остальные могут не использоваться.

Могучий пример

/сайт/ 2016-06-09T11:46:13+04:00 always 1.0 https://radiobud.ru/ro//сайт/category/ 2016-06-09T11:46:13+04:00 hourly 0.8 https://radiobud.ru/ro//сайт/page/ 2016-06-09T11:46:13+04:00 daily 0.6

Nu este treaba regelui să salveze fișierele

Bineînțeles că nu toate generatoare onlinevă dau codul, mulți generează un sitemap gata făcut sub forma unui fișier „ sitemap.xml „, trebuie doar să-l descărcați și să-l puneți în rădăcina site-ului.

Și dacă simți că lucrul cu fișiere nu este deloc pentru tine...

Există o soluție! Generator de harti site pentru panoul de administrare fără înregistrare și SMS.Să aruncăm o privire mai atentă la exemplul panoului de administrare WordPress.

Plugin „Harta site-ului” folosit pentru proiecte mici, nu afișează informații la fel de detaliate cageneratoare onlinefișiere slave, dar încă funcționează.

Pentru a instala, accesați secțiunea de meniu pluginuri > instalate > adăugați nou

În căutare, introduceți „Google Sitemaps”

Instalăm acest plugin, îl activăm și (Bam! Wow!) se creează harta site-ului. Poate fi configurat în continuare manual (dacă aveți nevoie). Există, de asemenea, multe alte plugin-uri pentru generarea de sitemap-uri. Nu doar pentru WP, ci și pentru alte CMS și în fiecare zi sunt din ce în ce mai multe.

Generator xml sitemap: cu sfaturi

  • Când creați un sitemap, nu uitați de dimensiune. Dacă fișierul cântărește mai mult de 10 MB, se recomandă împărțirea lui în mai multe părți. În acest fel, veți scuti serverul de supraîncărcări.
  • Toate adresele URL trebuie scrise uniform (cu www sau fără www)
  • Fișierul sitemap trebuie să fie codificat UTF-8
  • Indicați întotdeauna un spațiu de nume în limbaj XML xmlns="

Fișierele robots.txt și sitemap.xml fac posibilă organizarea indexării site-urilor. Aceste două fișiere se completează bine, deși în același timp rezolvă probleme opuse. Dacă robots.txt servește la interzicerea indexării secțiunilor întregi sau a paginilor individuale, atunci sitemap.xml, dimpotrivă, le spune roboților de căutare care adrese URL trebuie indexate. Să analizăm fiecare fișier separat.

Fișierul Robots.txt

robots.txt este un fișier în care sunt scrise reguli care restricționează accesul roboților de căutare la directoare și fișiere de site pentru a evita ca conținutul acestora să fie inclus în indexul motorului de căutare. Fișierul trebuie să fie localizat în directorul rădăcină al site-ului și să fie disponibil la: site.ru/robots.txt.

În robots.txt, trebuie să blocați toate paginile duplicate și de serviciu ale site-ului de la indexare. Adesea, CMS-ul public creează duplicate, articolele pot fi accesate în mai multe URL-uri în același timp, de exemplu; în categoriile site.ru/category/post-1/, etichetele site.ru/tag/post-1/ și archive site.ru/arhive/post-1/. Pentru a evita duplicarea, este necesar să interziceți indexarea etichetelor și arhiva vor rămâne în index; Prin pagini de servicii mă refer la paginile părții administrative a site-ului și paginile generate automat, de exemplu: rezultate la căutarea pe site.

Este pur și simplu necesar să scapi de duplicate, deoarece acestea privează paginile site-ului de unicitate. La urma urmei, dacă indexul conține mai multe pagini cu același conținut, dar accesibile la adrese URL diferite, atunci conținutul niciuna dintre ele nu va fi considerat unic. Drept urmare, motoarele de căutare vor coborî cu forță pozițiile unor astfel de pagini în rezultatele căutării.

Directive Robots.txt

Directivele sunt reguli sau puteți spune și comenzi pentru roboții de căutare. Cel mai important este User-agent, cu ajutorul lui puteți seta reguli pentru toți roboții sau pentru un anumit bot. Această directivă este scrisă mai întâi, iar după ea sunt indicate toate celelalte reguli.

# Pentru toți roboții User-agent: * # Pentru robotul Yandex User-agent: Yandex

O altă directivă obligatorie este Disallow, cu secțiunile sale de ajutor și paginile site-ului sunt închise, iar opusul ei este directiva Allow, care, dimpotrivă, permite forțat indexarea secțiunilor și paginilor specificate ale site-ului.

# Interziceți indexarea secțiunii Disallow: /folder/ # Permiteți indexarea subsecțiunii cu imagini Allow: /folder/images/

Pentru a indica oglinda principală a site-ului, de exemplu: cu sau fără www, se utilizează directiva Gazdă. Este de remarcat faptul că oglinda principală este înregistrată fără a specifica protocolul http://, dar trebuie specificat protocolul https://. Gazda este înțeleasă doar de roboții Yandex și Mail.ru și trebuie să introduceți directiva o singură dată.

# Dacă oglinda principală funcționează prin protocolul http fără www Host: site.ru # Dacă oglinda principală funcționează prin protocolul https cu www Host: https://www.site.ru

Sitemap este o directivă care indică calea către fișierul sitemap.xml, calea trebuie specificată în întregime cu protocolul, această directivă poate fi scrisă oriunde în fișier.

# Specificați calea completă către fișierul sitemap.xml Sitemap: http://site.ru/sitemap.xml

Pentru a simplifica regulile de scriere, există operatori simbolici speciali:

  • * - denotă orice număr de caractere, precum și absența acestora;
  • $ - înseamnă că simbolul dinaintea semnului dolarului este ultimul;
  • # - denotă un comentariu tot ceea ce este în linia după acest operator va fi ignorat de roboții de căutare.

După ce v-ați familiarizat cu directivele de bază și cu operatorii speciali, puteți deja schița conținutul unui fișier robots.txt simplu.

User-agent: * Disallow: /admin/ Disallow: /arhive/ Disallow: /tag/ Disallow: /modules/ Disallow: /search/ Disallow: *?s= Disallow: /login.php User-agent: Yandex Disallow: / admin/ Disallow: /arhive/ Disallow: /tag/ Disallow: /modules/ Disallow: /search/ Disallow: *?s= Disallow: /login.php # Permite robotului Yandex să indexeze imagini în secțiunea module Allow: /modules /* png Permite: /modules/*.jpg Gazdă: site.ru Sitemap: http://site.ru/sitemap.xml

Puteți găsi o descriere detaliată a tuturor directivelor cu exemple de utilizare a acestora în publicația de pe site-ul Yandex din secțiunea de ajutor.

Fișier Sitemap.xml

sitemap.xml este o așa-numită hartă a site-ului pentru motoarele de căutare. Fișierul sitemap.xml conține informații pentru roboții de căutare despre paginile site-ului care trebuie indexate. Conținutul fișierului trebuie să conțină adresele URL ale paginilor, dar nu este necesar să se indice prioritatea paginilor, frecvența accesării cu crawlere a paginii și data și ora la care paginile au fost modificate ultima dată.

De remarcat că sitemap.xml nu este obligatoriu, iar motoarele de căutare s-ar putea să nu-l țină cont, dar, în același timp, toate motoarele de căutare spun că deținerea fișierului este de dorit și ajută la indexarea corectă a site-ului, mai ales dacă paginile sunt creat dinamic sau site-ul are o structură complexă de cuibărit.

Există o singură concluzie: că fișierele robots.txt și sitemap.xml sunt necesare. Configurarea corectă a indexării este unul dintre factorii în plasarea paginilor site-ului în locuri mai înalte în rezultatele căutării, iar acesta este scopul oricărui site mai mult sau mai puțin serios.

Articol actualizat!


Salutare tuturor! Astăzi am decis să scriu un articol despre sitemap-ul XML, un element important.

Harta XML este un ghid pentru site-ul dvs. Acest ghid este creat special pentru roboții de căutare și îi ajută să găsească toate paginile care trebuie indexate.

Harta XML se află la rădăcina site-ului dvs. și este de obicei accesibilă la site.ru/sitemap.xml. Roboții învață despre existența sa în două moduri (care nu se exclud reciproc, dar se completează reciproc):

  • Adresa sitemap-ului este încărcată prin webmaster.
  • Linkul către harta site-ului se află în fișierul robots.txt.

Avantajele sitemap-ului XML:

  • ajută la găsirea și indexarea tuturor paginilor importante ale site-ului;
  • în Google Webmaster puteți vedea raportul dintre numărul de pagini din harta site-ului și numărul de pagini indexate și, de asemenea, puteți vedea erorile care au apărut în timpul indexării;
  • O hartă XML este una dintre modalitățile de a combate conținutul duplicat: atunci când un robot detectează 2 pagini identice, cel mai probabil o va indexa exact pe cea indicată în hartă.

Ce informații conține o hartă XML?

În primul rând, harta site-ului conține lista paginilor site-ului- este necesar. Poate conține și parametrii acestor pagini, ca:

    • Data ultimei modificări
    • Frecvența modificărilor (întotdeauna, oră, zilnic, săptămânal, lunar, anual, niciodată);
    • O prioritate – gradul de importanță al paginilor site-ului în timpul indexării, setat de la 0,0 la 1,0. Cu cât prioritatea este mai mare, cu atât această pagină este mai importantă în cadrul site-ului.

Cum se face un sitemap XML?

Puteți face manual un sitemap, dar trebuie să fiți de acord, de ce să pierdeți timpul cu asta dacă există generatoare de hărți XML online gratuite? Mai jos voi discuta unele dintre ele.

Servicii gratuite pentru generarea de sitemap XML

Cy-pr.com


Unul dintre cele mai ușor de utilizat servicii de generare de hărți XML. Aici trebuie doar să introduceți adresa site-ului web și să faceți clic pe butonul „Creați”. Dar o astfel de simplitate este și un dezavantaj: harta include link-uri către imagini și adrese dinamice ale paginilor.

Seolib.ru


Există o limită de 5 ori pe zi de la un IP. Ia în considerare eticheta noindex. De asemenea, puteți specifica căi care nu sunt parcurse sub formă de adrese specifice de pagină. Mi se pare că acest lucru nu este foarte convenabil, mai ales dacă există multe astfel de pagini. Când se generează o hartă XML, acest instrument include link-uri către imagini.

Mysitemapgenerator.com


Ia în considerare directivele din robots.txt, noindex, omite linkurile cu atributul nofollow. Există și o funcție de filtrare a datelor care vă permite să eliminați paginile cu anumite părți din adresă (de exemplu, .jpg) de pe hartă. Adevărat, doar un astfel de filtru este disponibil în versiunea gratuită. De asemenea, versiunea gratuită vă permite să descărcați maximum 500 de pagini și să generați 3 hărți XML pe zi de la o singură adresă IP.

Getrank.org


Versiunea gratuită a acestui generator limitează numărul de pagini la 500. O caracteristică utilă este excluderea parametrilor dinamici la generarea unei hărți XML. Personal, mi-a plăcut acest instrument deoarece nu includea imagini în mod implicit când l-am testat.

Web-site-map.com


Aici puteți genera o hartă XML pe zi de la o adresă IP. La fel ca și serviciul anterior, acesta vă permite să excludeți adresele URL cu parametrii specificați și, de asemenea, nu adaugă legături către imagini în mod implicit. Este de remarcat faptul că acest serviciu vă permite să includeți subdomenii în hărți XML, singura condiție este ca aceste subdomenii să fie adăugate la Google Webmaster Tools. Vă rugăm să rețineți că, în versiunea gratuită, adresa site-ului trebuie introdusă fără bara oblică „/”. De asemenea, acest serviciu ajută, astfel încât după generarea hărții să apară 2 link-uri de descărcare: către harta XML în sine și către o listă de link-uri rupte găsite în timpul generării acesteia.

Ce e de facut in continuare?

După generarea hărții, merită să o verificați pentru a vedea dacă există pagini suplimentare care nu sunt necesare în index (de exemplu, cele excluse în robots.txt). Corectitudinea hărții poate fi verificată cu ajutorul unui program special