`SiteMap генератор` ›› Общие сведения
Проект закрыт.
Приложение (инструмент) SiteMap генератор применяется для построения карты сайта по данным всех страниц, имеющихся на сайте. Программа выполняет полный обход сайта по всем возможным ссылкам на сайте (внутренним или по указанным параметрам обхода) и составляет общую структуру сайта в виде базы данных. После полного сканирования сайта из собранной базы ссылок может быть сгенерирована карта сайта (.xml или указанный формат файла или файлов) по любому критерию (будь то стандартная .xml карта сайта, или карта сайта с включением изображений и т.д). Сам файл карты сайта впоследствии может быть передан поисковикам для более быстрой индексации сайта.
Инструмент способен генерировать одновременно неограниченное кол-во вариантов карты сайта (любой из форматов файлов настраивается по критерию условий данных и пользовательской настройки формата файла)
Общий вид главного окна приложения выглядит следующим образом:
Что такое SiteMap?
SiteMap (карта сайта) - представляет из себя файл .XML формата, содержащий все ссылки сайта. Используется для индексации сайта поисковыми роботами.
Боле подробную информацию вы можете получить на сайте: www.sitemaps.org:
Что такое Sitemaps?:
"С помощью файла Sitemap веб-мастеры могут сообщать поисковым системам о веб-страницах, которые доступны для сканирования. Файл Sitemap представляет собой XML-файл, в котором перечислены URL-адреса веб-сайта в сочетании с метаданными, связанными с каждым URL-адресом (дата его последнего изменения; частота изменений; его приоритетность на уровне сайта), чтобы поисковые системы могли более грамотно сканировать этот сайт.
Сканеры обычно находят страницы по ссылкам, указанным на сканируемом сайте и на других сайтах. Эта информация, дополненная данными из файлов Sitemap, позволяет сканерам, поддерживающим протокол Sitemap, найти все URL в файле Sitemap и собрать информацию об этих URL с помощью связанных метаданных. Использование протокола Sitemap не является гарантией того, что веб-страницы будут проиндексированы поисковыми системами, это всего лишь дополнительная подсказка для сканеров, которые смогут выполнить более тщательное сканирование Вашего сайта."
Файл SiteMap не должен превышать 10Mb и не должен содержать в себе больше 50000 ссылок. Для использования большего количества ссылок или размера файлов используется файл индекса SiteMap.
.XML формат файла SiteMap [вверх]
Файл содержит набор xml тэгов с информацией о страницах. Файл должен быть в кодировке UTF-8.
Для всех значений тэгов файла SiteMap должно применяться "маскирование символов". Открывает файл SiteMap тэг <urlset>, закрывает </urlset>. Пример файла SiteMap с одним элементов страницы:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.site.zone/</loc> <lastmod>2009-01-01</lastmod> <changefreq>daily</changefreq> <priority>0.5</priority> </url> </urlset> Открывает элемент сайта тэг: <url>, закрывает </url>. Файл SiteMap может быть архивирован в архив .gz. Пример:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> ......(элементы сайтов).... </urlset> Пример:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> ........(параметры сайта).......... </url> ............. </urlset> Пример:
<url> <loc>http://site.zone/</loc> </url> Длина этого значения не должна превышать 2048 символов. Пример:
<url> <loc>http://site.zone/</loc> <lastmod>2009-02-01</lastmod> </url> Дата должна быть в формате W3C Datetime Пример:
<url> <loc>http://site.zone/</loc> <lastmod>2009-02-01</lastmod> <changefreq>daily</changefreq> </url> Значение этого поля может быть одним из: always - Постоянно hourly - Каждый час daily - Каждый день weekly - Каждую неделю monthly - Каждый месяц yearly - Каждый год never - Никогда Пример:
<url> <loc>http://site.zone/</loc> <lastmod>2009-02-01</lastmod> <changefreq>daily</changefreq> <priority>0.5</priority> </url> Значение этого поля может быть в диапазоне от 0.1 до 1.0. Значение по умолчанию - 0.5 Маскирование символов [вверх]
В XML файлах для всех значений данных (включая URL-адреса) должно использоваться маскирование символов.
Таблица маскирования символов:
Пример файла sitemap.xml [вверх]
Пример файла sitemap.xml из 10 URL:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://forwebm.net</loc> <lastmod>2009-09-18</lastmod> <changefreq>weekly</changefreq> <priority>0.5</priority> </url> <url> <loc>http://forwebm.net/index.php</loc> <lastmod>2009-09-18</lastmod> </url> <url> <loc>http://forwebm.net/fldir.php</loc> </url> <url> <loc>http://forwebm.net/search.php</loc> <lastmod>2009-09-18</lastmod> <priority>0.5</priority> </url> <url> <loc>http://forwebm.net/gost.php</loc> <lastmod>2009-09-18</lastmod> <changefreq>weekly</changefreq> </url> <url> <loc>http://forwebm.net/links.php</loc> <lastmod>2009-09-18</lastmod> <changefreq>weekly</changefreq> <priority>0.5</priority> </url> <url> <loc>http://forwebm.net/messus.php</loc> <changefreq>weekly</changefreq> <priority>0.5</priority> </url> <url> <loc>http://forwebm.net/tools.php?rp=3</loc> <changefreq>weekly</changefreq> <priority>0.5</priority> </url> <url> <loc>http://forwebm.net/info.php?rp=my</loc> <lastmod>2009-09-18</lastmod> <changefreq>weekly</changefreq> <priority>0.5</priority> </url> <url> <loc>http://forwebm.net/user.php?mk=register</loc> <lastmod>2009-09-18</lastmod> <changefreq>weekly</changefreq> <priority>0.5</priority> </url> <url> <loc>http://forwebm.net/sengines.php</loc> <lastmod>2009-09-18</lastmod> <changefreq>weekly</changefreq> <priority>0.5</priority> </url> </urlset> Индексный файл SiteMap [вверх]
Файл индекса SiteMap используется в том случае, если нужно указать несколько файлов SiteMap.
Размер такого файла также, как и файла SiteMap не должен превышать 10Mb, и не должен включать в себя больше 50000 ссылок на SiteMap файлы. Сам индексный файл, также как и SiteMap файлы тоже может быть сжат в архив .gz. Файл индекса SiteMap должен находиться на том же сайте, что и файлы SiteMap. Формат файла индекса SiteMap следующий: XML файл открывает тэг <sitemapindex>, закрывает </sitemapindex>. Каждый из файлов SiteMap описывается в блоке <sitemap>. Пример файла индекса SiteMap: <?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://forwebm.net/sitemap1.xml</loc> <lastmod>2009-09-20</lastmod> </sitemap> <sitemap> <loc>http://forwebm.net/sitemap2.xml</loc> </sitemap> <sitemap> <loc>http://forwebm.net/sitemap3.xml</loc> <lastmod>2009-09-20</lastmod> </sitemap> </sitemapindex> Тэги файла индекса SiteMap схожи с тэгами самого файла SiteMap, за исключением того, что используется только 2 тэга: <loc> - Обязательный тэг, ссылка на файл SiteMap <lastmod> - НЕ обязательный тэг, дата последнего изменения файла |