Google刪除網(wǎng)站索引淺析 |
發(fā)布時間: 2012/9/16 9:00:28 |
在公司維護一些英文網(wǎng)站,主要是日常一些SEO方面的工作,如增加鏈接,做一些關鍵詞等,但自從2009年3月份以后,網(wǎng)站經(jīng)常被掛滿了隱藏鏈接,這是典型的黑客侵入了網(wǎng)站系統(tǒng),可能已經(jīng)加了后門,從那以后,首頁經(jīng)常被加入隱藏鏈接,雖然一直被覆蓋,但一兩天以后,首頁又被重新加上了隱藏鏈接。但對于這件事,我也只是敷衍了事,檢查日志文件看不出什么眉目,也就沒當回事,想就只是加幾個鏈接而已,也沒有什么大不了的。 六月十九日,早晨檢查網(wǎng)站,看到網(wǎng)站訪問量大減,心中覺得奇怪,看一下訪問者都是從Yahoo! 和 Bing 進來的,就是沒有從Google 進來的,看一下 Google 管理員工具看到 Google 早在十七日就已經(jīng)發(fā)郵件過來通知我,網(wǎng)站因為添加隱藏文本而被刪除,嚇了一跳,于是下載了整個網(wǎng)站,找到了黑客后門,刪除掉,修改頁面,重新提交審核,兩天以后,也就是二十一號早晨發(fā)現(xiàn)網(wǎng)站已經(jīng)被重新收錄,而且排名位置基礎沒變。 從中,有幾個問題比較值得注意,從十七日Google 發(fā)郵件通知刪除索引,但那一天還是有從 Google來的流量,到十九日就完全沒有從Google來的流量了,導致訪問量變化非常明顯,那就是說即使 Google 搜索質量小組發(fā)郵件來說已經(jīng)刪除索引了,但實際上索引并未完全刪除,還是有流量從Google 過來的,而且兩天后,Google 重新收錄網(wǎng)站,排名基礎都沒變,索引頁面數(shù)也和以前比沒有變化多少,但尤其值得注意的一點是,居然發(fā)現(xiàn)首頁的 Google 快照是 六月十八日, 這一發(fā)現(xiàn)確實是挺讓人震撼的,那也就是說,Google spider 在刪除索引以后,還是來抓取頁面的。 在十九日刪除索引后,整個網(wǎng)站在Google是搜索不到的,后來重新收錄,看到大部分的頁面的快照還是在十七日之前的,認真分析一下的話,會想說,索引真的是完全被 Google 從索引數(shù)據(jù)庫中抹除了嗎,恐怕未必,否則快照日期不會是在刪除之前的日期,而應該是審核通過重新抓取的日期。 在此,大膽提出一個猜想,Google 搜索引擎的算法沒人知道,但有一些痕跡是可以猜想的,我想:Google 是不是采取這樣的一種策略,專門有服務器存放被懲罰的或者是被刪除的網(wǎng)站,就像google sandbox 一樣,甚至被刪除索引的網(wǎng)頁的處理方法就是 google sandbox 的另一種表現(xiàn),當一個網(wǎng)站被刪除索引時,索引全部移動到這樣的一個服務器中,在正常排名的索引中再也不會有這些網(wǎng)站存在了,但蜘蛛還是會訪問這些被屏蔽的網(wǎng)站的,可以通過快照日期能夠看出來,不然的話,通過服務器的日志文件也能看出來,一旦網(wǎng)站被重新審核通過,從這樣的一個服務器中移動到正常索引中,時間會很短,這也是為什么一旦審核通過,收錄頁面數(shù)量會從0回來以前的水平,如果是重新收錄的話,不應該會有這么快的收錄速度。
本文出自:億恩科技【mszdt.com】 |