搜索引擎利用網站地圖的建立蜘蛛在互聯網上爬行

2022-06-12發(fā)布者:ylm大?。?/span> 下載:0

文件大小:

軟件介紹

網站地圖簡介

網站地圖是一個XML文件,它包含一個網址URL表和相關的屬性,詳細說明應索引某個特定網站的哪些內容。網站地圖必須為UTF-8編碼。下面是網站地圖文件需要的XML元素:

<urlset> -- 網站地圖文件以這個標簽起始和結束,起始標簽必須包括命名空間(xmlns)屬性。

<url> -- 文件中的每一個網頁包含在這個元素之中。

<loc> -- 文件中指定的網頁的實際地址。它是<url>元素的一個子元素。

文件中還有下列可選元素:

<lastmod> -- <url>元素的一個子元素。它指定最近一次更新網頁的時間。

<changefreq> -- <url>元素的一個子元素。它指定網頁更新的頻率(經常、每小時、每天、每周、每月、每年及從未更新)。

<priority> -- <url>元素的一個子元素。它指定網站內網頁相對于其它網頁的重要性,有效值為0.0-1.0,默認值為0.5。

下面的網站地圖樣本說明如何在一個樣本網頁中應用這些元素。它為一個假定的網站指定主頁,以及它的更新頻率,上次更新的時間和網站中的優(yōu)先權。

<?xml version="1.0" encoding="UTF-8"?>
<urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.test.com/</loc>
<lastmod>2006-11-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.3</priority>
</url>
</urlset>

網站地圖文件的位置由你自己決定,但它的位置決定了可能包含中文件中的URL集。例如,如果上面的樣本網站地圖文件位于http://www.test.com/sitemap.xml,那么網站地圖文件中可能包含任何以http://www.test.com/開頭的URL。因此,我們建議將網站地圖文件存放在網站的根目錄下。網站地圖文件的大小不得超過10MB。如果一個文件超出這個限制,就需要使用gzip進行壓縮。

建立一個網站地圖

既然網站地圖以XML為基礎,就可以方便的使用任何文本編輯器建立并編輯它們,不過也可以應用專門的工具。下面的列表提供了一些當前的工具:

Node Map:一個生成并確認網站地圖XML文件的工具。

Gsitemap:一個應用.NET Framework建立的網站地圖生成工具。

GSiteCrawler:一個生成網站地圖文件的Windows工具。

phpSitemapNG:一個用PHP編寫的免費網站地圖生成器。

Google Sitemap Generator:一個可以用于生成網站地圖文件的Python腳本。

通告搜索引擎

建立一個網站地圖文件后,應該將它提交給一個搜索引擎。每個搜索都擁有自己的網站地圖提交界面。Google的Webmaster工具集中包含了一個網站地圖提交頁面。在使用之前你必須注冊一個賬戶。雅虎也有一個免費的網站地圖提交頁面,但在使用之前同樣必須注冊一個賬戶。其它搜索引擎也會仿效Google、雅虎和MSN,提供相似的功能。

其它工具

搜索引擎收錄網頁的爬行過程緩慢而且需要大量資源。網站地圖為網站指定應收錄哪些內容而進行搜索提供了一種方法。它們建立像XML一樣的簡單文本格式文件,但有許多工具可以幫助你建立網站地圖文件。現在,它們只是對當前的處理過程進行補充。

發(fā)表評論(共0條評論)
請自覺遵守互聯網相關政策法規(guī),評論內容只代表網友觀點,發(fā)表審核后顯示!

版權聲明:

1 本站所有資源(含游戲)均是軟件作者、開發(fā)商投稿,任何涉及商業(yè)盈利目的均不得使用,否則產生的一切后果將由您自己承擔!

2 本站將不對任何資源負法律責任,所有資源請在下載后24小時內刪除。

3 若有關在線投稿、無法下載等問題,請與本站客服人員聯系。

4 如侵犯了您的版權、商標等,請立刻聯系我們并具體說明情況后,本站將盡快處理刪除,聯系QQ:2499894784

返回頂部