Файл sitemap xml. Создание Sitemap

Приветствую вас, друзья!

Продолжаем готовить наши сайты к продвижению. На прошлом уроке мы создали файл , а сегодня наша цель — создать файл sitemap, по-другому «карта сайта».

Sitemap.xml — это файл, где указываются страницы подлежащие индексированию с определенным приоритетом для .

С одной точки зрения sitemap.xml вообще не нужен: робот и сам прекрасно справляется со своей работой. Но если посмотреть с другой стороны, то карта сайта действительно нужна. Все дело в том, что одни страницы имеют гораздо большее значение, нежели другие. И в первую очередь робот должен проиндексировать важные страницы, а потом другие.

Файл Sitemap.xml позволяет указать роботу, какие страницы нужно индексировать первыми, а какие последующими. С этой точки зрения карта сайта нужна. Поэтому и выходит этот урок.

Ну что? Погнали!

Как проходит индексирование сайта?

Чтобы полностью понять зачем нужна карта, давайте поговорим об . Если говорить в простой и понятной для всех форме, то процес выглядит так:

Представьте такую ситуацию: вам нужно что-то найти в книге по физике и вы пошли в библиотеку, чтобы найти там ту самую книгу. Пришли и нашли, открыли ее. После этого, начинаете искать нужную вам информацию без какого-либо ориентирования. Таким образом, листая книгу, вы начали воспринимать всю информацию, какая там только есть, то есть индексировать.

Примерно так выглядит процесс индексации. Вы, как робот, начали просматривать все, что только есть в книге и запоминать, хотя большая часть из содержания имеет второстепенное значение. Чтобы быстро ориентироваться по книге, предусмотрено содержание: страница с названиями глав и номерами страниц (ссылки). Файл Sitemap.xml, как раз-таки, является неким содержанием, но только для поискового робота.

Как создать файл sitemap.xml?

Создать карту сайта можно, используя специальные онлайн-генераторы, которых пруд пруди в Интернете. А для тех, чьи сайты работают на CMS, можно использовать плагины (блог работает на WordPress, я использую плагин Yoast SEO).

Есть и те, кто хочет написать сам Sitemap.xml, следующая часть урока именно для вас. Но сначала я хочу, чтобы вы скачали редактор Notepad ++, в этом редакторе можно сохранить файл в формате.xml:

Теперь подробнее остановимся на значениях в теге :

  • — Обязательный тег, в котором указывается ссылка на страницу;
  • — Дата обновления страницы;
  • — Указывается частота обновления страницы, имеет следующие значения:

    • hourly — ежечасно;
    • daily — ежедневно;
    • weekly — еженедельно;
    • mouthly — ежемесячно;
    • yearly — ежегодно;
    • never — никогда.
  • — приоритет индексирования страницы. Имеет значения от 0.1 — 1;

Остановимся на приоритете подробнее. Не нужно указывать высокий приоритет для каждой страницы в sitemap.xml. Он указывается исключительно относительно страниц, указанных в файле. То есть, если в карте сайте страница site.ru/1.html имеет приоритет 1 (высокий), а страница site.ru/2.html имеет приоритет 0.5, то site.ru/1.html будет проиндексирована первой, а вторая страница, соответственно, второй. Таким образом, тег — это некий порядок индексирования.

Вывод : для продвигаемых страниц ставьте приоритет 1, для других, менее важных, значения ниже.

Залить sitemap.xml нужно в корень папки сайта!

Карта сайта должна быть доступна по адресу: http://site.ru/sitemap.xml

Если по этому адресу карта не доступна, то вы залили ее не туда!

Ограничения для sitemap.xml

С тем, как создать файл sitemap.xml мы разобрались, теперь поговорим об ограничениях в файле:

  1. Ссылки должны вести на один и тот же сайт;
  2. Длина ссылка не должна превышать 2048 символов;
  3. Максимальное количество ссылок 50 000;
  4. Размер файла не больше 10 Мб.

Иногда случается так, что в один файл не вмещается вся информация, в этом случае поможет индексный файл.

Индексный файл — это тот же sitemap.xml, в котором указываются ссылки на карты сайта, которые мы создавали чуть выше.

Карта сайта sitemap.xml стала очень важной деталью, необходимой для успешного продвижения сайта в поисковых системах. Также, как и , «сайтмеп.хмл» используется для правильной и быстрой индексации web-ресурса поисковиками, но эти два документа имеют и некоторые различия.

Создать карту Sitemap для своего сайта можно несколькими способами: используя плагины и онлайн-генераторы, а также составляя ее вручную. О том, как это сделать, какой генератор карты (sitemap generator) использовать и как добавить карту в поисковые системы Яндекс и Гугл, вы узнаете из этой статьи.

Прежде всего, давайте разберемся, что такое карта сайта sitemap.xml, для чего она нужна и какие виды карт бывают.

Карта Sitemap – это одна из страниц сайта, содержащая ссылки на все остальные страницы или же на самые главные разделы этого веб-ресурса. Фактически это «содержание» интернет-сайта, которое выполняет функции навигатора (для посетителей) и способствует более быстрой и лучшей индексации (в случае с поисковыми системами).

Карта Sitemap, как правило, составляется отдельно для поисковых систем и отдельно для пользователей. В первом случае карта имеет расширение «.xml» (файл Sitemap.xml), а во втором – «.html» (страница Sitemap.html). Разные форматы карты позволяют представлять информацию в удобном виде как для поисковых систем, так и для посетителей.

1.1 Карта сайта Sitemap.html (для людей)

Создается специально для посетителей и представляет собой отдельную страницу сайта. Используется для нескольких целей, основной из которых является улучшение навигации .

Карта сайта для посетителей (Sitemap.html) – карта вашего сайта, представляющая собой отдельную страницу веб-ресурса, доступную посетителям и поисковым системам. Основное назначение такого документа – улучшение навигации сайта.

Sitemap» и расширение «. html», она может быть названа как угодно. Главное, чтобы такая карта являлась страницей сайта.

При создании карты сайта для посетителей (sitemap.html)следует обратить внимание на ряд важных моментов.

Таким образом, основное назначение карты сайта для людей (sitemap.html) – улучшать навигацию, структуру сайта, помогая посетителям находить нужные материалы.

1.2 Карта сайта Sitemap.xml (для поисковиков)

Поисковые системы также воспринимают карту сайта для посетителей (Sitemap.html), однако лучше для них создавать отдельный документ – файл Sitemap.xml.

1.2.1 Что такое Sitemap.xml

Карта сайта Sitemap.xml – это карта вашего сайта, созданная специально для поисковых систем в особенном формате, недоступная посетителям. Она представляет собой отдельный документ, который не стоит считать страницей сайта (в индекс такая карта сайта не попадает). Основное назначение документа – улучшение индексации страниц веб-ресурса.

Карта сайта не обязательно имеет имя « Sitemap», доступно любое имя по желанию владельца сайта. Но расширение должно быть именно «. xml». Такая карта размещается, как правило, в корневом каталоге сайта (чаще всего это папка носит имя «public_html» у вашего хостинг-провайдера).

1.2.2 Ограничения и особенности

Поисковые системы благоприятно относятся к сайтам, имеющим карту Sitemap.xml. Дело в том, что при ее наличии роботы поисковиков индексируют страницы сайта быстрее и лучше (уменьшается вероятность, что какая-та страница будет случайно пропущена). Очевидно, что карта сайта способствует более быстрому . Однако при этом поисковые системы накладывают на карту сайта Sitemap. xml определенные ограничения :

  • файл Sitemap должен содержать не более 50 тыс. ссылок и иметь размер не более 10 Мбайт (допускается использование архивации для уменьшения размера файла).

Что же делать, если ваш сайт настолько большой, что карта сайта превышает вышеуказанные значения. В этом случае можно поступать следующим образом:

  • размещать в карте сайта ссылки не на все страницы сайта, а только на категории, подкатегории и теги (ключевые слова), что позволит значительно уменьшить количество ссылок;
  • создавать несколько карт сайта (например, основную, содержащую ссылки на все другие карты, и еще несколько второстепенных).

И даже если данные требования будут выполнены, нет гарантии, что поисковые системы будут придерживаться файла Sitemap. xml при индексации. Дело в том, что карта сайта – это лишь рекомендация поисковым системам, как следует индексировать сайт, но отнюдь не правило!

Сжатая карта сайта будет иметь расширение не «.xml», а другое, в зависимости от типа архиватора.

  • Если архиватор «zip», то формат файла «имя_карты.xml.zip».
  • Если архиватор «gzip», то формат файла «имя_карты.xml.gz».
  • Если архиватор «7-zip», то формат файла «имя_карты.xml.7z».
  • Если архиватор «rar», то формат файла «имя_карты.xml.rar».

1.2.3 Формат файла Sitemap.xml

Для лучшего понимания работы карты сайта данного типа необходимо ознакомиться с ее форматом. Т.к. Sitemap.xml можно считать отдельным html-файлом, предназначенным для поисковиков, то и функции у него будут направлены на улучшение индексации. Структура имеет определенный вид.

1. Заголовок файла ( ).
2. Группа повторяющихся блоков ( ):
2.1 адрес страницы ( );
2.2 дата и время последнего обновления страницы (…( );
2.3 «примерная» частота обновления страницы (…( );
2.4 приоритет страницы ( ).

Учитывая это, вы можете создать простейший вариант карты сайта вручную, используя для этих целей текстовый документ с расширением «.txt» (файл блокнота). Теги и их содержимое прописываются вручную в этот файл, а затем его расширение меняется с «.txt» на «.xml».

Теперь подробнее о каждом параметре.

Заголовок стандартный, его нужно просто скопировать и вставить в самый верх файла.

< url> < loc> http: //сайт/ < lastmod> 2013 - 02 - 26T18: 07 : 54 + 00 : 00 < changefreq> daily < priority> 1.0

http://сайт/ 2013-02-26T18:07:54+00:00 daily 1.0

Каждый блок начинается тегом , а заканчивается – .

Url-адрес страницы записывается внутри и .

Дата и время последнего обновления заключаются между и . Нужны, чтобы указать поисковой системе, следует ли переиндексировать страницу (т.е. появились ли какие-то изменения в контенте страницы, или ничего не изменилось, и индексация не требуется). Параметр состоит из даты и времени, разделенными через символ «T».

Примерная частота обновления заключается в теги и . Еще один ориентир для поисковой системы, как часто индексировать страницу. Доступны значения always (постоянно), hourly (каждый час), daily (ежедневно), weekly (еженедельно), monthly (ежемесячно), yearly (ежегодно), never (никогда).

Приоритет страницы располагается между И . Он показывает поисковику, насколько важна страница по отношению к другим страницам сайта. Если приоритет очень высокий, то робот-индексатор отдаст предпочтение данной странице, нежели другим. Доступны значения от «0,0» до «1,0» с шагом «0,1».

2. Плагины для создания карты сайта

Карта сайта для посетителей создается одним плагином, а для поисковиков – другим.

При использовании данного способа создания карты сайта нет необходимости перестраивать Sitemap при добавлении новых страниц, плагины позаботятся об этом самостоятельно. Кроме того, плагины отличаются более гибкими настройками при создании карты, нежели онлайн-генераторы. Однако каждый новый плагин нагружает сервер, что отражается на скорости загрузки страниц. Несмотря на это, нагрузка не настолько сильная, чтобы следовало избегать использования плагинов для построения Sitemap.

Поэтому способ генерации карты сайта с помощью плагинов считается наиболее простым и удобным.

2.1 Карта для посетителей (плагин DDSG )

Плагин, генерирующий карту сайта Sitemap.html, носит название Dagon Design Sitemap Generator (DDSG). Скачать его можно на . Следует отметить, что это самый популярный плагин для создания навигационной карты сайта.

Настройки плагина позволяют выбирать дизайн и отображение ссылок, входящих в карту.

Для того чтобы карта сайта начала функционировать, необходимо создать отдельную страницу, куда потребуется добавить небольшой кусочек html-кода (использовать html-редактор, а не визуальный! ).

Этот тег выведет карту сайта для посетителей, созданную плагином Dagon Design Sitemap Generator.


2.2 Карта для поисковых систем (Google XML Sitemaps)

Плагин « » генерирует карту сайта для поисковых систем, т.е. в формате Sitemap.xml (и в сжатых форматах).

Плагин позволяет выбирать, какой тип страниц включать в карту сайта (главную, статические страницы, посты и записи, метки, архивы, рубрики и т.д.), а также настраивать ряд других важных параметров (например, частоту обновления страниц и приоритет).

После того, как плагин будет настроен, его можно активировать. Карта сайта построится автоматически. Файл Sitemap.xml будет также создан автоматически, ничего устанавливать не нужно.

3. Онлайн-генераторы карты сайта Sitemap

Онлайн-генераторы (generator Sitemap) позволяют формировать карту сайта в виде отдельного файла. При этом нет необходимости добавлять на сайт какие-либо плагины, что позволяет защитить сайт от нагрузки лишних скриптов. Но не стоит забывать, что в этом случае при добавлении новых страниц (или при удалении старых) придется опять формировать карту сайта с помощью генератора и снова добавлять ее на свой сайт. Поэтому использование ресурсов вида «generator sitemap» считается не самым удачным решением.

3.1 Генератор Xml-Sitemaps

Очень простой и удобный генератор карты сайта, имеющий несколько серьезных недостатков:

  • количество ссылок в карте может быть не более 500;
  • нет возможности настраивать приоритет для отдельных групп страниц (посты, страницы, категории, метки и т.д.);
  • нет возможности указывать частоту обновления для отдельных групп страниц;
  • генератор просматривает «мусорные» ссылки, которые не должны находиться в карте сайта (ссылки на комментарии, ссылки-отклики, ссылки «печать» и т.д.).

Перейти на сайт генератора можно . Перед вами появится форма, которую нужно заполнить.

В первое окно необходимо ввести адрес главной страницы сайта .

Вторая опция – выбор «примерной» частоты обновления сайта.

Третье окно – настройка даты обновления страниц сайта (None – не использовать; Use server’s response – определить автоматически; Use this date/time – использовать текущие дату и время).

Четвертое окно – настройка приоритета страниц для поисковых систем (None – не использовать; Automatically Calculated Priority – вычислять автоматически).

Кнопка «Start» — запуск генератора .

Спустя некоторое время карта будет сформирована. Появится страница, где по ссылке вы сможете скачать карту Sitemap.xml и добавить ее в корневой каталог сайта (как правило, это папка – «public_html»).

Путь к карте можно будет прописать в файле robots.txt с помощью следующего оператора:

Sitemap: http://сайт/sitemap.xml

Sitemap: http://сайт/sitemap.xml

http:// blog- craft. ru/ sitemap. xml – путь к карте сайта (если выбрано нестандартное имя карты, то вводить нужно выбранное имя, а не «sitemap»).

3.2 Генератор SiteMapGenerator

Перейти на сайт данного generator sitemap можно по . Этот генератор позволяет создавать до 2500 ссылок в карте сайта бесплатно, но для этого нужна регистрация. Можно генерировать карту и без регистрации, но тогда вам не будут доступны настройки создания карты.

Зарегистрировавшись, вам нужно добавить сайт, для которого создается файл Sitemap, а затем нажать на ссылку «начать обработку». После этого перед вами появится окно с настройками генерации карты Sitemap.

Здесь все аналогично предыдущему онлайн-генератору, поэтому проблем с настройкой у вас не возникнет.

После нажатия на кнопку «старт» сайт добавится в очередь заданий онлайн-генератора, и спустя некоторое время карта сайта будет создана.

Данный generator sitemap создает как карту для поисковых систем, так и карту для людей.

3.3 Генератор MySiteMapGenerator

Перейти на сайт генератора можно . В отличие от предыдущих двух сервисов данный генератор имеет больше опций (в частности – появляется возможность благодаря фильтру добавлять приоритет и частоту обновления для каждой категории страниц; при формировании карты учитываются ). Однако ограничение для бесплатного создания карты – 500 ссылок.

Заполнив несколько полей, вы сможете сгенерировать карту для своего сайта (как Sitemap.xml, так и Sitemap.html).

Когда сайт будет полностью просканирован, вы получите ссылку на сформированную Sitemap. Останется добавить ее в корневой каталог сайта (как и в случае с первым генератором).

4. Как добавить карту сайта в поисковые системы

Помимо того, что адрес карты сайта можно указать в файле Robots.txt, неплохо было бы еще добавить Sitemap.xml непосредственно в ведущие поисковые системы – Яндекс и Гугл.

Сделать это можно, перейдя в панель управления сайтами.

4.1 Добавление Sitemap.xml в Яндекс.Вебмастер

Перейти в панель управления сайтами можно по . Если вы не зарегистрированы, то сначала вам придется пройти данную процедуру, затем добавить сайт (для которого и создавалась карта сайта) и подтвердить права владения им. После этого можно будет переходить в настройки сайта.

Сначала выберите раздел «Настройка индексирования», а затем подраздел «Файлы Sitemap». Вы увидите окно с формой добавления карт вашего сайта.

В это окно нужно добавить вашу карту сайта sitemap.xml (если она всего одна) или несколько карт сайта. Спустя некоторое время Яндекс проверит Sitemap и затем покажет результат проверки в окошке «Статус». Если все нормально с файлом, то там появится зеленая галочка с надписью «Ok».

4.2 Добавление Sitemap.xml в Google

Аналогичным образом можно добавлять файл Sitemap в Гугл. Для этого вам нужно перейти по и, если вы не зарегистрированы, проделать те же процедуры, что и в случае с Яндекс.Вебмастер.

Чтобы добавить файл карты, перейдите в раздел «Оптимизация», а затем выберите подраздел «Файлы Sitemap». Аналогичным образом необходимо добавить все ваши карты сайта в панель управления сайтами в Гугле.

Спустя некоторое время вы узнаете, каков результат. Если все будет нормально, то в графе «Проблемы» будет стоять прочерк.

Карта сайта способствует ускорению индексации сайта поисковыми системами, что положительно сказывается на посещаемости веб-ресурса. Если вы хотите, чтобы ваш сайт развивался и приносил прибыль, то обязательно сформируйте карту вашего web-сайта.

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подписаться

Карта сайта Sitemap XML

Карта сайта (Sitemap) – это специальный файл в формате.xml, хранящийся в корневой директории сервера. Владельцы сайтов нередко интересуются – зачем нужен Sitemap и влияет ли наличие/отсутствие этого документа на поисковое продвижение? Чтобы ответить на эти вопросы, рассмотрим назначение и структуру карты сайта.

Итак, зачем нужен xml Sitemap, что он собой представляет? Карта сайта – это своеобразный каталог, состоящий из перечня ссылок, ведущих на все разделы и страницы сайта. Файл Sitemap помогает поисковым системам более быстро и качественно индексировать интернет проект. Это особенно важно в том случае, если объем web-ресурса исчисляется тысячами или десятками тысяч страниц.

[yt=R09Qywy5DXI]

Больше видео на нашем канале - изучайте интернет-маркетинг с SEMANTICA

Это важно! В карту сайта следует включать только те страницы, которые должны быть в поисковом индексе. Документы с запрещенной к индексированию или служебной информацией не следует вносить в Sitemap. В карту сайта также не включают страницы с тегами и динамические URL-адреса.

Влияет ли Sitemap на продвижение?

Поисковики не будут пессимизировать интернет проект за отсутствие этого файла. Теоретически, робот должен самостоятельно просканировать все страницы сайта и включить их в поиск. Однако нужно учитывать, что система может дать сбой и не найти некоторые web-документы. Обычно «проблемными местами» становятся разделы, в которые можно попасть только по длинной цепочке ссылок, и динамически создаваемые URLы.

С точки зрения SEO, Sitemap имеет определенное влияние, поскольку карта сайта значительно ускоряет индексацию. К тому же повышается вероятность, что web-страницы попадут в индекс до того, как недобросовестные конкуренты успеют скопировать и опубликовать контент. Поисковые системы отдают предпочтение первоисточнику, тогда как копипаст подвергается пессимизации.

Как создать сайт мап

Проще всего воспользоваться одним из специализированных сервисов. К примеру, online-генератор http://www.mysitemapgenerator.com/ позволяет бесплатно сделать карту сайта, размером до 500 страниц. Предусмотрена возможность платной генерации Sitemap без каких либо ограничений. Вебмастеру потребуется всего лишь указать адрес своего сайта, а затем поместить полученный файл в корневой папке сервера.

Можно воспользоваться программой SiteMap Generator. В поле http:// следует завести адрес стартовой страницы сайта, кликнуть по клавише «start» и подождать, пока будет сформирована карта сайта. Затем нужно перейти на вкладку «Google Sitemap/XML», скопировать полученный код и вставить его в файл формата.xml.

Файл sitemap xml – доступные директивы

  • Параметр Lastmod указывает роботу, когда документ последний раз обновлялся.
  • Тег priory указывает на приоритет документа, по отношению к другим страницам сайта.
  • Параметром loc обозначают URL адрес страницы.
  • Тег changefreq используется для обозначения динамичности страниц (документы с параметром «0» робот будет посещать очень редко).

Как сообщить поисковику о карте сайта

Чтобы оповестить Яндекс, можно добавить директиву sitemap в файл robots.txt. Код будет выглядеть следующим образом:

Sitemap: http://yoursite.ru/sitemap.xml

Кроме того, можно передать карту сайта через интерфейс Яндекс.Вебмастер. Для этого нужно перейти на вкладку «Настройка индексирования» >> «файлы Sitemap», а затем указать системе адрес карты сайта.

Аналогичным образом можно оповестить Google. В панели инструментов для вебмастеров нужно перейти на вкладку «Сканирование» >> «файлы Sitemap».

Рассказать о статье:

Получите профессиональный взгляд со стороны на свой проект

Специалисты студии SEMANTICA проведут комплексный анализ сайта по следующему плану:

– Технический аудит.
– Оптимизация.
– Коммерческие факторы.
– Внешние факторы.

Мы не просто говорим, в чем проблемы. Мы помогаем их решить

09.06.2016 19983

Наличие xml карты сайта (sitemap xml) на сервере - стратегически важно для оптимизации. Карта хранит в себе структуру актуальных страниц вашего ресурса и служит для того, чтобы поисковые роботы быстрее ориентировались по сайту, а ваши страницы быстрее индексировались. Иными словами: карта сайта указывает поисковым роботам кратчайший путь к страницам. Вот такая карусель. Что конкретно находится в карте сайта? Файл sitemap. xml содержит не только url страниц,…

При знакомстве с проектом специалист по оптимизации обязательно вводит в адресную строку после имени сайта фразу «sitemap.xml». Анализ карты сайта позволяет выяснить, почему не индексируется тот или иной контент. Как создать и внедрить грамотную sitemap.xml, я расскажу в очередном выпуске .

Что такое XML-карта

XML-карта сайта — файл с информацией для поисковых систем о страницах, которые необходимо проиндексировать. Другими словами, карта сайта — список всех страниц в формате XML, доступных для сканирования поисковым роботом. При этом стоит отличать XML-карту от обычной карты сайта, которая находится по адресу http://site.com/sitemap/ .

С помощью XML-карт определяется:

  • местонахождение страниц сайта;
  • время последнего обновления каждой из страниц;
  • частота (периодичность) обновления и важность относительно других страниц сайта;
  • важность (приоритетность) страниц в структуре.

Из каких элементов состоит XML-карта

В первой строке документа указывается версия xml и кодировка — UTF-8.

Также используются особенные теги XML:

  • sitemapindex — родительский тег в начале и конце файла;
  • sitemap — родительский тег для каждого файла sitemap, указанного в файле. При этом данный тег — дочерний относительно sitemapindex;
  • url — блок, который содержит значение самого URL и прочие элементы;
  • loc — непосредственно URL страницы;
  • changefreq — как часто данная страница может изменяться. Возможные значения: always, hourly, daily, weekly, monthly, yearly, never;
  • priority — приоритет структурных элементов, помогает определить, какие страницы более приоритетные для краулинга. Ему присваивается значение до единицы, например: 0,5.
  • lastmod — время последнего обновления контента страницы, не обязательный параметр. Для сайтов со статическим контентом достаточно использовать changfreq.

Пример структуры файла c XML-картой сайта:

http://example.com/ 2017-02-05 monthly 0.8

Для больших сайтов лучше сформировать несколько XML-карт. Например, в этот индекс в формате XML входят два файла sitemap:

http://www.example.com/sitemap1.xml http://www.example.com/sitemap2.xml.

XML sitemap для изображений

Отдельные XML-карты часто создаются для индексации изображений. Они актуальны только для Google, Яндекс не распознаёт теги image:

Данные XML-карты могут помочь поисковым системам найти контент, который иначе нельзя было бы обнаружить (например, если он загружается с помощью JavaScript), и указать изображения, которые необходимо сканировать и индексировать.

Для карт изображений используются теги:

Кроме того, можно использовать необязательные теги:

Пример XML-карты для изображений:

http://example.com/page.html http://example.com/pic1.jpg http://example.com/pic1.jpg

Если на сайте представлен уникальный видеоконтент, для него также можно сделать отдельную XML-карту.

Интересно, что в данной карте URL видеозаписей можно открыть для поиска в разделе Google Видео. В результатах будет отображаться значок видео, который, кстати, можно сделать индивидуальным, а также другая указанная в карте информация. Например, название.

Результат:

Какие сведения о видео можно отправлять в Google с помощью sitemap:

  • название;
  • описание,
  • продолжительность;
  • миниатюру и так далее.

Обязательные теги:

  • — страница, где находится видео;
  • — название видео, до 100 символов;
  • — место размещения плеера для видео;
  • — место размещения конкретного видео;
  • — превью (миниатюра) видео, не менее чем 120х90 px;
  • — контейнер для описания видео;
  • — описание видео, до 2000 символов.

Кроме этого, можно использовать другие теги — не обязательные и носящие рекомендательный характер:

  • — длительность видео, до 8 часов, пишется в секундах;
  • — категория видео, например, техника;
  • — имя человека (компании), добавившего видео. Допускается указание одного имени для файла;
  • — указывается, требуется ли для просмотра видео подписка. Как платная, так и бесплатная, с доступными значениями: yes, no;
  • — дата публикации, в формате YYYY-MM-DD или YYYY-MM-DDThh:mm:ss+TZD;
  • — здесь указывается, может ли видео быть доступным для безопасного поиска или нет;
  • — список стран, в которых видео может воспроизводиться или не воспроизводиться. Допустимые значения — коды стран в формате ISO 3166. Для каждого видео может отображаться только один тег . Если тег отсутствует, предполагается, что видео можно воспроизводить на всех территориях;
  • — ссылка на галерею;
  • — дата и время, когда видео становится неактуальным;
  • — стоимость с указанием валюты в формате ISO 4217;
  • — теги видео;
  • — количество просмотров видео;
  • — рейтинг видео (от 0 до 5);
  • — список площадок, где видео может воспроизводиться и не воспроизводиться. Доступные значения: web, mobile, tv. При отсутствии тега предполагается, что видео может воспроизводиться на всех платформах;
  • — указывает на то, является ли видео прямой трансляцией (live). Доступные значения: yes, no.

http://www.example.com/videos/video_1.html http://www.example.com/thumbs/video_1.jpg Обзор смартфона Xiaomi Redmi 3 Note Pro Подробный обзор внешнего вида и функций смартфона Xiaomi Redmi 3 Note Pro от интернет-магазина Example. http://www.example.com/video123.flv http://www.example.com/videoplayer.swf?video=123 600 4.3 1223 2017-01-05T19:20:30+03:00 yes no

Google «поддерживает» следующие форматы:

  • .mpg, .mpeg, .mp4, .m4v;
  • .wmv;
  • .asf, .avi;
  • .ra, .ram, .rm;
  • .mov;
  • .flv.

XML-карта для Google Новостей

Для сайтов-новостников можно создать отдельную sitemap с динамической генерацией и ежедневным обновлением. Данные файлы будут работать только для ресурсов, включенных в списки Google Новостей. Если сайт не находится в списке, можно отправить запрос на его добавление.

Файл sitemap должен содержать только URL статей, опубликованных за последние два дня. Статьи, опубликованные более двух дней назад, можно удалить из файла, при этом они останутся в индексе Google Новостей в течение 30 дней.

Эта карта сайта может содержать не более 1000 URL. Если на сайте за два дня появляется больше контента, можно создать файл индекса sitemap для нескольких карт.

Обязательные теги:

  • — общий тег, в котором указывается издание. У него есть два обязательных дочерних тега:
    • — название издания;
    • — язык в формате ISO 639;
    — дата публикации в формате W3C с указанием полной даты. Поисковой робот Google понимает даты вплоть до долей секунд, например:
ГГГГ-ММ-ДДTчч:мм:cc.с±чч:мм (2017-05-10T19:20:30.45+01:00)
  • — название статьи, аналогичное названию на сайте.

Кроме этого, существуют необязательные теги:

  • — свойства статьи. Допустимые значения:
    • PressRelease — официальный пресс-релиз;
    • Satire — статья, которая выставляет предмет обсуждения в комической форме.
    • Blog — любая статья, которая опубликована в блоге или в формате блога.
    • OpEd — любая статья, выражающая личное мнение и размещенная в колонке редактора.
    • Opinion — любая статья, выражающая личное мнение и не включенная в колонку редактора. Сюда относятся как рецензии колумнистов, так и интервью.
    • UserGenerated — материал, созданный пользователем и прошедший официальную редакторскую правку.
  • — ключевые слова по теме статьи;
  • — список биржевых/финансовых символов (не более пяти, через запятую). Подходит для статей о бизнесе. Перед каждым символом должно указываться название соответствующей биржи, совпадающее с записью в Google Финансах, например NASDAQ:AMAT или BOM:500325.

Пример sitemap для Google Новостей:

http://example.ua/news/wow55.html Новости ru Blog 2017-05-10 Рацион питания среднестатистического студента студенты, еда, мивина, пельмени, revo

Как построить XML-карту для мультиязычных сайтов

Файлы sitemap можно использовать, чтобы передать Google атрибут rel="alternate" hreflang="x" . Благодаря этому пользователям показываются страницы на нужном языке и с URL-адресами с правильной региональностью.

Пространство имен XHTML должно быть указано так:

Xmlns:xhtml="http://www.w3.org/1999/xhtml"

Также необходимо создать отдельный элемент URL для каждого адреса. В свою очередь каждый элемент должен включать:

  1. Тег loc, который указывает на URL-адреса;
  2. Подэлемент xhtml:link rel="alternate" hreflang="XX" для каждой альтернативной версии страницы, обязательно включая текущую версию.

Например, на сайте есть раздел на русском языке, предназначенный для пользователей со всего мира. Кроме того, существуют две версии этой страницы: на украинском и на английском.

Полный набор URL выглядит так:

  • example.com/ua/
  • example.com/ru/
  • example.com/en/

Файл sitemap, который приведен на примере ниже, сообщает Google о том, что у страницы example.com/ru/ существует соответствующая версия на украинском и английском языках:

http://example.com/ru/ http://www.example.com/deutsch/ http://www.example.com/en/

Яндекс поддерживает два формата файлов sitemap:

  • XML (рекомендуется);
  • текстовый файл.

Требования для карт Яндекс:

  • размер в несжатом виде не должен превышать 10 Мб;
  • Яндекс распознает Punycode (пуникод) как в закодированном виде, так и в оригинале.

Принципиально:

  • до 50 000 ссылок на файлы sitemap;
  • общий размер до 50 Мб (в несжатом виде).

Форматы, которые поддерживает Google в качестве sitemap:

  • XML — стандартный файл;
  • RSS, media RSS и Atom 1.0 — подходит для блогов с фидом RSS или Atom;
  • Сайты Google. Если сайт создан и подтвержден с помощью сервиса «Google Сайты», файл sitemap создается автоматически. Его нельзя изменить, но можно отправить в Google, чтобы получать сведения для отчетов. Если в одном подкаталоге содержится более 1000 страниц, файл sitemap может отображаться некорректно.
  • Текстовый файл.txt.

Основные требования к текстовым файлам:

  • кодировка UTF-8;
  • файл не должен содержать ничего, кроме списка URL;
  • текстовому файлу можно дать любое имя, но только с расширением.txt (например, sitemap.txt).

Как внедрить XML-карту

  1. Файл с XML sitemap следует поместить в корневую директиву сайта: http://<адрес сайта>/sitemap.xml .
  2. Если карт сайта несколько, необходимо создать индекс карт, где должны быть перечислены ссылки на все XML-файлы. рекомендуемых генераторов.

    Как найти ошибки в XML-картах

    Как анализировать карту сайта в Яндекс.Вебмастере

    В Яндекс.Вебмастере для работы с XML-картами следует перейти по пути «Индексирование» — «Файлы sitemap».

    Отдельно в разделе Инструменты, представлен «Анализатор файлов sitemap», где на проверку можно отправить текст, URL или прикрепить сам файл. При проверке он показывает тип и размер файла, количество ссылок и ошибки.

    В панели вебмастеров Google в разделе «Сканирование» есть пункт «Файлы sitemap».

    Здесь можно:

    • добавить или проверить файлы sitemap;
    • отследить количество отправленных и проиндексированных страниц различных типов;
    • увидеть ошибки и проблемы в картах сайта;
    • отправить карты XML заново или удалить их.

    Выводы

    XML-карта сайта нужна поисковым роботам для обнаружения всех ваших страниц. Она содержит URL-адреса страниц сайта, а также относящиеся к ним данные, такие как время их последнего обновления, частоту их обновления и важность относительно других страниц сайта. Отдельные карты можно создавать для изображений, видео, XML можно размечать и для Google Новостей.

    Создавать карту вручную не стоит — используйте бесплатные генераторы или специализированные программы. Проверить ошибки в картах можно в панелях вебмастеров Яндекс и Google.

    Появились вопросы? С удовольствием отвечу в комментариях.

Карта сайта представляет собой страницу sitemap.html (для посетителей, помогает упростить навигацию и найти любую страницу на большом сайте) или файл sitemap.xml (для поисковых систем), содержащие подробный список всех страниц веб-сайта.

Сайтмап позволяет сократить количество переходов при поиске нужной страницы на любом, даже самом большом сайте. Грамотно настроенная карта сайта способна повысить индексацию страниц веб-сайта.

Какие возможности дает карта сайта?

Поисковики способны просканировать все адреса сайта самостоятельно, но создание карты сайта поможет им узнать, как это лучше сделать.

Сайтмап позволяет:

  • найти новые страницы на ресурсе и проиндексировать их;
  • расставить приоритетность страниц;
  • отследить свежие изменения на индексируемых страницах;
  • запомнить частоту обновления индексируемых страниц.

Какие бывают карты сайта?

В общем случае существует два варианта сайтмапа - это веб-страница sitemap.html и файл sitemap.xml. Рассмотрим их поподробнее.

Что такое Sitemap.html?

Это статическая HTML страница, где перечислены ссылки на все основные страницы сайта. Такой формат сайтмапа ориентирован на посетителей сайта и позволяет в 1 клик перейти на любую из страниц.

Sitemap.html имеет структуру дерева с развернутыми разделами.


У сайтов с очень сложной структурой HTML карта сайта может состоять из страниц с дополнительным уровнем вложенности.
Пример - карта сайта TripAdvisor .

Что такое sitemap.xml?

Это файл, лежащий в корневой директории сайта, который читается всеми существующими поисковиками. Его роль - показать поисковым системам все адреса страниц, которые нужно проиндексировать; когда они появились или обновились; с какой регулярностью перепроверять страницы на обновление.

Один файл sitemap.xml может включать в себя до 50 000 ссылок. При большем количестве ссылок таких файлов будет несколько . Дополнительные преимущества - возможность указать частоту обновления страниц и приоритет индексации. Правильная кодировка файла sitemap.xml должна быть UTF-8, а его размер ограничен 10 Мб.
Приведем пример карты сайта в формате.xml:



http://mysite.ru/
2017-09-18T18:54:13+04:00
always
1.0


http://mysite.ru/category/
2017-09-18T18:57:09+04:00
hourly
0.8


http://mysite.ru/page/
2017-09-18T18:59:37+04:00
daily
0.6

Как создать карту сайта?

Существует ряд методов создать sitemap для вашего ресурса:

  • Статически вручную. Этот способ подойдет продвинутым пользователям, которые имеют навык работы с основными тегами, а веб-сайт состоит из небольшого количества страниц.
  • Через генератор карты сайта. Если вы не хотите выполнять кропотливую и нудную работу по генерации карты сайта вручную, к вашим услугам - программа для создания карты сайта. Есть платные и бесплатные варианты: , и множество других.
  • Плагин для CMS или средствами движка. Еще один хороший способ сгенерировать sitemap. Масса преимуществ в виде гибкой настройки под нужные параметры и максимума возможных адресов, а также серьезная экономия времени. Кроме того, при внесении изменений на страницу или создании новых страниц карта сайта будет обновляться автоматически, в отличие от сайтмапа, созданного другим способом. Для каждой системы существует свой плагин:
    • для CMS WordPress разработаны seo-плагины с функцией создания сайтмапа;
    • для Joomla существует Xmap ;
    • DLE - имеется встроенный модуль .

Полезный нюанс!

Если исключить из карты сайта страницы, которые не несут коммерческой или информационной пользы (например, какие-нибудь страницы, не являющиеся посадочными, какие-то вспомогательные, транзитные), то поисковой робот будет тратить меньше своих ресурсов на переобход сайта.

А так как ресурс ограничен, становится больше вероятность, что робот обойдет нужные нам страницы. Создавая sitemap через плагин, можно сразу исключить оттуда определенные типы страниц. Их потом можно добавить, если понадобится. Актуально для больших сайтов.

Как часто должна обновляться карта сайта?

Единого норматива по количеству обновлений нет. Все зависит от частоты создания новых страниц ресурса, изменения адресов или контента и связей уже существующих страниц.

При этом стоит помнить, что данные, указанные в карте сайта, поисковый робот воспринимает как рекомендательные: если установить частоту обновлений, к примеру, раз в год, робот будет приходить чаще, а если раз в час - робот не станет индексировать страницу так часто.

Как правильно указать ссылку на sitemap.xml в robots.txt

Для начала, xml карта сайта должна быть создана и загружена на сервер, и потом можно добавить указание о наличии файла.

Чтобы это сделать, пропишите в robots.txt следующую строку:

Sitemap: {url-файла-sitemap},
где {url-файла-sitemap} - это полный URL вашего сайтмапа.

В итоге, robots.txt приобретет такой вид:

User-Agent: *
Sitemap: httр://mysite.com/sitemap.xml.

Частые ошибки в карте сайта

Самые распространенные ошибки:

  • битые ссылки;
  • редиректы;
  • некорректные даты публикации или обновления контента.

Ошибки не будут иметь критического влияния на отношение поисковых систем к вашему сайту. Однако их устранение позволит направить высвободившиеся ресурсы поискового робота на переобход важных страниц.

Как проверить корректность карты сайта

Чтобы проверить корректность карты сайта, разработаны многочисленные онлайн-сервисы, которые сделают это за вас автоматически и укажут на все допущенные ошибки: валидности файла, указание на url с другого домена, превышение размера файла, проведут онлайн-диагностику индексации. Такие программы бесплатны и работают со всеми крупными поисковиками (Google, Yandex, Yahoo).

Для проверки корректности необходимо открыть страницу сервиса, загрузить xml-файл или ввести в поле соответствующий URL и нажать на кнопку проверки. Если программа обнаружит ошибки, она подскажет, какие адреса дают некорректный ответ.

Протестируйте sitemap.xml в Яндекс * - https://webmaster.yandex.ru/tools/sitemap/
Протестируйте с помощью сервиса Pixel Plus - https://webmaster.yandex.ru/tools/sitemap/
Англоязычный сервис - https://sitemapkoala.com/

* - для теста в Яндекс, необходимо .

Итого

Карта сайта - удобный инструмент, призванный упростить передачу структуры основных страниц как посетителю так и поисковой системе.

Без нее можно обойтись. Поисковик и так рано или поздно доберется до большинства веб-страниц, но с сайтмапом переобход или индесация новых страниц будут более эффективными.