網(wǎng)站地圖-(Sitemap) |
發(fā)布時(shí)間: 2012/9/15 14:45:32 |
什么是 Sitemap
Sitemap 可方便管理員通知搜索引擎他們網(wǎng)站上有哪些可供抓取的網(wǎng)頁(yè)。最簡(jiǎn)單的 Sitepmap 形式,就是 XML 文件,在其中列出網(wǎng)站中的網(wǎng)址以及關(guān)于每個(gè)網(wǎng)址的其他元數(shù)據(jù)(上次更新的時(shí)間、更改的頻率以及相對(duì)于網(wǎng)站上其他網(wǎng)址的重要程度為何等),以便搜索引擎可以更加智能地抓取網(wǎng)站。
Sitemap協(xié)議講解
Google SiteMap Protocol 是Google自己推出的一種站點(diǎn)地圖協(xié)議,此協(xié)議文件基于早期的robots.txt文件協(xié)議,并有所升級(jí)。在Google官方指南中指出加入了Google SiteMap文件的網(wǎng)站將更有利于Google網(wǎng)頁(yè)爬行機(jī)器人的爬行索引,這樣將提高索引網(wǎng)站內(nèi)容的效率和準(zhǔn)確度。文件協(xié)議應(yīng)用了簡(jiǎn)單的XML格式,一共用到6個(gè)標(biāo)簽,其中關(guān)鍵標(biāo)簽包括鏈接地址、更新時(shí)間、更新頻率和索引優(yōu)先權(quán)。
Google SiteMap文件生成后格式如下:
<urlset xmlns=http://www.google.com/schemas/sitemap/0.9>
<url>
<loc>http://www.SemCmd.com</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
</urlset>
SiteMap XML標(biāo)簽的解析:
changefreq:頁(yè)面內(nèi)容更新頻率,
lastmod:頁(yè)面最后修改時(shí)間
loc:頁(yè)面永久鏈接地址
priority:相對(duì)于其他頁(yè)面的優(yōu)先權(quán)
url:相對(duì)于前4個(gè)標(biāo)簽的父標(biāo)簽
urlset:相對(duì)于前5個(gè)標(biāo)簽的父標(biāo)簽
注意:XML文件必須為UTF-8編碼格式,不管你是手動(dòng)生成還是通過(guò)代碼生成,建議最好檢查一下xml文件是否是utf-8編碼,最簡(jiǎn)單的方法就是用記事本打開(kāi)xml然后另存為時(shí)選擇編碼(或轉(zhuǎn)換器)為UTF-8。
怎么樣制作SiteMap XML工具
請(qǐng)查看SiteMap XML 地圖生成工具詳細(xì)講解與制作
如何提交SiteMap XML 地圖
登錄Google 管理員工具 (https://www.google.com/webmasters/tools/)
注 意:
1、一個(gè)站點(diǎn)地圖可以包含一個(gè)網(wǎng)址列表或站點(diǎn)地圖列表。
2、如果您的站點(diǎn)地圖包含另一組站點(diǎn)地圖,您應(yīng)將自己的站點(diǎn)地圖另存為站點(diǎn)地圖索引文件,并使用該文件類型專用的 XML 格式。每個(gè)站點(diǎn)地圖索引文件最多可以列出 50,000 個(gè)站點(diǎn)地圖。
3、一個(gè)站點(diǎn)地圖文件包含的網(wǎng)址不得超過(guò) 50,000 個(gè),且未壓縮時(shí)不得大于 10MB。如果您的站點(diǎn)地圖超過(guò)了這些限值,請(qǐng)將其拆分為幾個(gè)小的站點(diǎn)地圖。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會(huì)因向 Google 提供大文件而超載。
4、使用相同的語(yǔ)法指定所有網(wǎng)址。例如,如果您指定網(wǎng)站的位置為 http://www.semcmd.com/,則網(wǎng)址列表中不應(yīng)包含以 http://semcmd.com 開(kāi)頭的網(wǎng)址。如果您指定網(wǎng)站的位置為 http://semcmd.com/,則網(wǎng)址列表中不應(yīng)包含以 http://www.semcmd.com// 開(kāi)頭的網(wǎng)址。
5、請(qǐng)不要在網(wǎng)址中包含會(huì)話 ID。
6、請(qǐng)不要在站點(diǎn)地圖中包含直接圖片網(wǎng)址。Google 不會(huì)將圖片直接編入索引中,而是將顯示圖片的網(wǎng)頁(yè)編入索引。站點(diǎn)地圖中包含的直接圖片網(wǎng)址不會(huì)編入索引。
7、站點(diǎn)地圖網(wǎng)址必須進(jìn)行編碼,以便于所在的網(wǎng)絡(luò)服務(wù)器進(jìn)行讀取。另外,它只可以包含 ASCII 字符,不能包含大寫(xiě) ASCII 字符、某些控制碼或特殊字符(如 * 和 {} 等)。如果您的站點(diǎn)地圖網(wǎng)址包含這些字符,在您試圖添加該網(wǎng)址時(shí)就會(huì)顯示錯(cuò)誤消息。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |