百度快照、Baiduspider、Googlebot |
發(fā)布時間: 2012/9/22 15:14:50 |
百度快照,百科上給予的解釋是,每一個被百度收錄的網(wǎng)頁,都會在百度服務器上面存一個備份,這里
要說明一下的是這個備份是純文本備份,不包含圖片、flash以及視頻文件之類的。所以說,如果你在搜
索結果頁面點擊百度快照后能夠看到的一些圖片等等的非文本類的東西,這證明你的網(wǎng)站是處于正常狀
態(tài)下的。如果你的網(wǎng)站已經(jīng)關閉,這時候快照中是不會顯示網(wǎng)頁里面的圖片的。也就是說,快照里面的
圖片類信息是調用原網(wǎng)頁的。
對于一個網(wǎng)站的百度快照更新時間來說,具體的講就是這個網(wǎng)站在搜索結果里出現(xiàn)的時間。一般說
來,大部分搜索引擎良好的網(wǎng)站的快照時間都是前一天的,就比如說今天4月25日,快照的時間就是4月
24日。除了這個情況,百度快照的更新時間也有三天之內的,一星期內的,甚至一個月乃至多年的都有
。這個百度快照的更新時間為什么會出現(xiàn)這樣的情況呢,這就要引出baiduspider這個概念了。
Baiduspider,即百度蜘蛛。它是百度搜索引擎的一個自動程序。它是百度搜索引擎的一個自動程
序。它的作用是訪問互聯(lián)網(wǎng)上的被允許的網(wǎng)頁、圖片、視頻等內容然后再在百度服務器上面建立索引數(shù)
據(jù)庫,使用戶能在百度搜索引擎中搜索到這些網(wǎng)頁、圖片、視頻等內容。
而百度快照在搜索引擎中出現(xiàn)的時間問題,與baiduspider的抓取有著很大的關系,進一步說更與
我們網(wǎng)站自身有著絕對的關聯(lián)的。其實這樣說也不太準確,畢竟一個網(wǎng)站所牽扯到的東西太多,很多很
多都不是獨立存在的。關于百度蜘蛛,或許會有人說,如果我的網(wǎng)站不想被蜘蛛抓取怎么辦?這個問題
的話,要解決也十分的簡單,需要建立“robots.txt”文件,然后寫上禁止搜索引擎抓取的代碼即可。
而講到了百度搜索引擎的baiduspider,自然我們大家也會想到谷歌搜索引擎Googlebot。
Googlebot,也叫谷歌機器人,是Google 的web 抓取漫游器。它從web上收集文檔,為Google搜索引
擎建立可供用戶搜索的索引。其實到這里,大家可以想到,googlebot與baiduspider從物理意義上面講
是一個意思,都是來抓取網(wǎng)站的機器。所以,對于googlebot就不再多講了。
本文出自:億恩科技【mszdt.com】 |