Какво е карта на сайта или т.нар. Sitemap
XML карта на сайта или Sitemap е специален файл, който изброява URL адресите на страниците, достъпни за индексиране от роботи в търсачката. Използвайки го, можете:
- да изброите местоположението (URL) на всички индексирани страници в сайта
- да посочите датата и часа от последните промени на страницата
- да дадете приоритет на индексиране на страници
- да контролирате честотата на опресняване за всяка страница
Инструкциите и връзките във файла не носят задължителните условия за тяхното изпълнение, а само позволяват на търсачките да индексират по-добре сайта.
Роботите на търсачките обработват правилно текстовия формат .txt, кодиран в UTF-8 и файла, използвайки XML протокола. В първия случай е достатъчно да изброите необходимите URL адреси със списък в тялото на файла без допълнителни маркери. Обикновено Sitemap се намира в основната директория на даден сайт, но има изключения.
Кога се нуждаете от Sitemap за сайт?
Препоръчваме ви да попълните правилно файла наSitemap във всякакви ситуации. Има обаче случаи, когато наличието на правилната XML карта е жизненоважно за успеха на проекта:
- Дълбоко влагане на страници
- Наличието на целеви страници, които не са достъпни чрез навигация на потребителя. С други думи, ако никоя вътрешна връзка не води до страницата, тогава вероятността да я индексирате е изключително малка
- Използване на технологии, които усложняват индексирането от търсачките ( Ajax , JavaScript, Silverlight, Flash)
- Голям брой страници в сайта
HTML карта на сайта
Този тип карта на сайта е насочена основно към потребителя. Тази страница трябва да съдържа списък на всички индексирани страници, да приеме цялостния дизайн и да отразява структурата на сайта. Всички връзки от страницата трябва да съдържат котвата, потребителят трябва да разбере каква страница ще види при щракване.
Препоръчваме ви да поставите връзка към картата на сайта във футера, както и да покажете картата в HTML формат. Препоръчителния брой URL в един сайтмап не трябва да надвишава 50 000. Ако имате повече страници, можете да разделите картата на няколко файла по раздели (категории) примерно.
Персонализираната карта на сайта ви позволява също да подобрите индексирането на сайтове и да намалите влагането на страници със сложна структура.
Какво трябва да се съдържа в Sitemap файла
Има няколко задължителни и незадължителни маркери за Sitemap. Всички те са сдвоени, т.е. изискват затварящ маркер в края. Задължителни са:
<urlset> – обозначава стандарта на използвания протокол, използва се предимно Sitemap 0.90. Маркерът се поставя в началото на документа.
<url> е родителският маркер за всяка страница, който изброява всички елементи, които са свързани с определена страница. Трябва да съдържа само един URL адрес.
<loc> – тук посочваме пълния път до страницата на сайта в абсолютна форма (с протокола и името на домейна).
Незадължителни елементи (тагове) са:
<lastmod> – необходими за посочване на дата и час на последната промяна на страницата.
<changefreq> – колко често страницата може да бъде актуализирана. Възможни варианти: винаги, почасово, ежедневно, седмично, месечно, годишно, никога.
<priority> – указва приоритета на индексирането на страниците. Максималната стойност е 1,0. При липса на този маркер на всички страници е присвоен приоритет = 0,5. Не се поддържа от Google.
Търсачката на Google поддържа по-широк списък от тагове в XML карти. В допълнение към списъка със страници можете да създадете карта на сайта за снимки, видеоклипове и новини за по-правилна обработка и индексиране.
Sitemap за снимки
Използването на карта на сайта за снимково съдържание ще позволи на бота за търсене да открие съдържание, което е недостъпно по време на нормално обхождане, например показване на снимки в резултат на обработка на JavaScript.
Задължителни етикети
image:image | подобно на url, е родителски елемент, който съдържа тагове за обработка на изображения |
image:loc | тук е директна връзка към файла с изображението в абсолютна форма |
Допълнителен набор от маркери: | |
image:caption | надпис на изображение |
image:title | заглавно изображение. Обикновено взето от едноименния атрибут img tag |
image:geo_location | GEO-локация, снимаща снимки. Държава, град, улица и т.н. |
image:license | връзка за използване на изображението |
Sitemap за видео
Собствениците на уникално видео съдържание се насърчават да мислят за създаването на отделна карта на сайта за видеото. С него можете да контролирате показването на вашите видеоклипове в резултатите от търсенето на видеоклипове, както и да помагате на робота за търсене да обработва видеоклиповете по висококачествен начин.
Задължителни тагове :
loc | Tara Stiles | URL адрес на страницата за видео в абсолютна форма |
video:title | заглавие на видеоклипа, максимум 100 знака | |
video:player_loc | връзка към самия видео плейър за възпроизвеждане на видео | |
video:content_loc | пълен път към видео файл | |
video:thumbnail_loc | изображение за видео, визуализация. Размер на изображението най-малко 120X90 px | |
video:video | подобно на url, е родителски елемент, който съдържа тагове за обработка на видео | |
video:description | описание на видео текст, до 2000 знака |
Незадължителни тагове:
video:duration | указва продължителността на видеоклипа в секунди. 1 до 28800 сек (8 часа) |
video:category | обозначава категорията, към която принадлежи видеоклипът, до 256 знака |
video:uploader | указва името на потребителя, който е качил видеото в сайта, максималният размер е 255 знака. Не повече от един потребител |
video:requires_subscription | дали е необходим абонамент (платен или безплатен) за достъп за гледане на видео файла. Стойности на етикета: да / не |
video:publication_date | Датата, на която видеото е публикувано във формат W3C. Валидни стойности са пълната дата (ГГГГ-ММ-DD) и пълната дата с часове, минути, секунди и часова зона (ГГГГ-ММ-DDThh: mm: ss + TZD). |
video:family_friendly | достъп до видеоклипове с активирана опция за защитено търсене. Да / не опции |
video:restriction | разделени с интервал, изброява държавите във формат ISO 3166, за които видео е разрешено или не е позволено в резултатите от търсенето с Google. Възможните параметри позволяват (разрешено) или отказ (забранено) |
video:gallery_loc | Понастоящем URL на страницата на галерията не се поддържа от Google |
video:expiration_date | дата и час на границата на наличността на видеоклипа. Валидни стойности са пълната дата (ГГГГ-ММ-DD) и пълната дата с часове, минути, секунди и часова зона (ГГГГ-ММ-DDThh: mm: ss + TZD). |
video:price | цената за достъп до видео файл във формат ISO 4217 |
video:tag | видео маркери за идентифициране на видеоклипа. Максимум 32 маркера за един видеоклип |
video:view_count | брой гледания на това видео |
video:rating | видео рейтинг. Наличен диапазон от 0,0 до 5,0 |
video:platform | списък на платформи / устройства, на които възпроизвеждането на видео е разрешено / забранено. Възможните стойности са уеб, мобилни, телевизия. Изброени с интервал |
video:live | указва дали видеото е на живо. Налични стойности: да, не. |
Карта на сайта за Google News
Силно препоръчително за новинарски сайтове, които са регистрирани в Google News. Наличието на отделна Sitemap не гарантира високи позиции, но ще позволи допълнителна информация за всеки новинар да бъде изпратена до робота за търсене.
Ограничения:
1. Не повече от 1000 URL адреса за първата карта на сайта
2. Картата на новинарския сайт трябва да съдържа връзки към новини за последните 2 дни. Останалото се препоръчва да бъде отстранено своевременно.
Задължителни етикети
news:publication | обозначава публикацията, в която е публикувана статията, изисква попълването на две задължителни имена на етикети и език |
news:name | публикуване на детски маркери, името на издателя на новини |
news:language | публикуване на детски етикет, определя езика на новините, параметър във формат ISO 639 |
news:publication_date | пълна дата във формат W3C |
news:title | заглавие на новини |
Допълнителни маркери
news:genres | новини за имоти. Налични опции: PressRelease, Сатира, Блог, OpEd, Мнение, Генерирано от потребители |
news:keywords | новини за ключови думи |
news:stock_tickers | списък на символите за размяна (финансови). До 5 елемента, разделени със запетаи. |
Технически изисквания и ограничения
- Създаденият файл sitemap.xml трябва да бъде поставен в основната директория на вашия сайт, подобно на файла robots.txt.
- Файлът на Sitemap трябва да има същото име на домейн и протокол като URL адресите, изброени в него.
- Разрешено е да се създаде отделна Sitemap за секцията на сайта. В този случай самият файл трябва да бъде физически разположен в главната папка на раздела.
- Всеки поддомейн трябва да има свой файл sitemap.xml.
- Използвайте само абсолютни URL адреси на страници.
- Специалните символи трябва да бъдат преобразувани във формат HTML:
Символ Екранна последователност
знакът ‘&’ | & | & amp |
Единични цитати | “ | & apos |
Двойни цитати | „ | & quot |
Повече от | > | & gt |
По-малко от | < | < |
пространство | & nbsp |
- Кодът на отговора на сървъра за изброените URL адреси трябва да върне 200 ОК.
- Максималният размер на файла е 10 MB за Yandex и 50 MB за Google.
- Максималният брой знаци за URL във файл е 1024 за Yandex и 2048 за Google.
- Максималният брой URL адреси е 50k.
- Изключете дублиращи се URL адреси в картата на сайта
- Можете да използвате кирилица за Yandex. За Google URL адресите трябва да бъдат преобразувани в Punycode.
- Списъкът на страниците на сайта трябва да е отворен за индексиране от роботи за търсене (не е затворен във файла robots.txt или чрез съответния <meta name = „robots“ />).
- Разрешено е да се използва компресиране на gzip файл, но това не премахва ограничението за максималния размер на файла в непакетната форма.
- Възможно е да се използват формати RSS, mRSS и Atom 1.0 за PS на Google; Yandex не поддържа тези емисии.
Използване на кирилица
Търсачките Google и Yandex позволяват присъствието и еднакво обработват кириличните адреси в XML-картата на сайта. Протоколът за Sitemap обаче позволява само ASCII символи в адресите на страниците. Затова за правилно индексиране от други търсачки се препоръчва да преобразувате кирилица в Punycode и да използвате маскирането на URL адреси на кирилица. Лесна и удобна услуга за преобразуване във формат Punycode.
Как да използвате няколко карти на сайта?
Има редица случаи, когато трябва да използвате няколко Sitemap:
- Броят на URL адресите надхвърля 50 хиляди.
- Използване на няколко CMS в един сайт.
- Създадени са отделни карти на сайтове за различни секции.
- Характеристика на инсталирания плъгин.
- Удобство за проследяване на грешки по категория / раздел.
В този случай всички отделни Sitemap се комбинират в един индекс със следните тагове:
- <sitemapindex> – като <urlset>, указва стандарта на използвания протокол.
- <sitemap> – подобно на <url>, родителския маркер за всяка отделна карта на сайта.
- <loc> е абсолютният път до местоположението на секцията на Sitemap.
- <lastmod> е датата и часа на последната промяна в Sitemap.
Начини за създаване на карта на сайта
Има няколко начина за създаване на файл sitemap.xml, който трябва да се използва в зависимост от характеристиките на сайта. Всеки от тях има своите положителни и отрицателни страни. Експертите на Google са подготвили обширен списък от методи и решения за генериране на правилната XML карта за различни поводи. Ще се спрем на някои по-подробно.
Услуги за генериране на онлайн карти на сайта
Генераторът на XML Sitemap обикновено покрива напълно нуждите на потребителя. Той има ограничение от 2000 URL адреса за безплатната версия.
XML-Sitemaps.com е друг популярен онлайн генератор на Sitemap. Можете да генерирате до 500 адреса безплатно. Идеален за малки сайтове.
Проверката на домейни няма ограничения и е напълно безплатна, но по-скоро нестабилна при обработка на голям брой страници.
Desktop версии на SiteMap Generation
Краулерът Screaming Frog SEO Spider след обхождане на сайта, ви позволява да получите готова карта с няколко кликвания (безплатната версия дава до 500 url само).
Netpeak Spider е аналог на Screaming Frog. Също така, след събиране на всички URL адреси, като ви позволява да изтеглите sitemap.xml файл готов за качване на сайта в рамките на няколко кликвания.
Плъгини за WordPress
WordPress е най-разпространената CMS в света, затова много плъгини за генериране на Sitemap са създадени с тази цел. Особено внимание трябва да се обърне на следните плъгини:
Yoast SEO
Google XML Sitemap
WP Sitemap Page
Карта на сайта за многоезични и мултирегионални сайтове
PS на Google предвижда прехвърляне на маркировка на hreflang директно в Sitemap. За да направите това, трябва да посочите специалния <xhtml: link> таг, вътре в който са поставени атрибутите:
- rel = „заместник“;
- hreflang = „XX“, където е посочена локализацията на страниците;
- href = „XX“ връзка към локализираната версия на страницата.
В случай на двуезична версия на сайта (RUS / UKR), Sitemap ще изглежда така:
Преход към HTTPS протокол
Когато преминавате към сигурен проткол с SSL сертификат, трябва да конфигурирате отново sitemap.xml:
- уверете се, че новият файл е достъпен чрез HTTPS протокола
- конфигурирайте 301 пренасочвания от HTTP към HTTPS версията на картата на сайта
- уверете се, че страниците с HTTPS протокола влизат в новия файл и всички те връщат код за отговор 200 OK
- променете протокола на сайта във файла robots.txt
- Заменете връзки за Sitemap в уеб администраторите
Как да добавите карта на сайта към Google Search Console?
За да добавите връзка към Sitemap в Google Search Console:
1. В раздела Индекс отидете на секцията Sitemap.
2. Посочете относителния път към файла в полето Добавяне на Sitemap и щракнете върху бутона Изпращане.
Заключение
Карта на сайта е важен и необходим инструмент за сайтове със сложна структура. Той улеснява навигацията за потребителите и индексирането към търсачките, което влияе благоприятно на промоцията на сайта на търсачките. Можете да създадете Sitemap ръчно, както и да използвате онлайн услуги и различни програми. С Netpeak Spider можете да генерирате Sitemap и да проверите XML Sitemap за грешки за кратко време.
Четете още за: SEO съвети за по-добро класиране на вашия уебсайт