SEO利器-Google GSA虛擬機版本 |
發(fā)布時間: 2012/9/14 15:15:01 |
在所有的SEO工具中,能夠被稱為利器的工具不多,但Google GSA虛擬機版本絕對算是一個。去年我介紹了《利用Google Search Appliance 服務器做SEO 》,不過這個正式版實在太昂貴而且根據美國的某條法律不銷售給中國,所以很多人都沒辦法用來做SEO應用。 而Google GSA虛擬機版本就很好的解決了這個問題。
先講講這個Google GSA虛擬機版本怎么應用到SEO上面吧。
如我以前所說:
其實何止爬蟲抓取機制,連絕大部分排序的算法都是一樣的。雖然這個GSA內置了更多給離線文檔(如 pdf\word\)排序的算法,但是在給網頁排序這塊的算法和google.com如今正在用的算法是非常接近的。因為這個GSA的本意是給某些需要搜索的企業(yè)用戶來索引他們自己的信息,是希望用google的技術能力來幫他們索引最相關的信息,不然就沒有必要非得用google的產品了。 開發(fā)過小規(guī)模搜索引擎的人都知道,對于小型搜索引擎,其他東西大家都能基本做到,GSA值錢的地方就是這個排序算法,這是大家選擇GSA的首要原因。 另外,這個方法是一個有著11年SEO經驗并且在美國google做過2年產品經理的人強烈推薦使用的方法,他自己就買了2臺正式版。 不過排序算法總還是有差別的,根據我使用了2年多GSA的經驗,對于網頁的排序算法90%以上是一樣。 GSA在SEO方面至少有以下幾個應用。 第一個應用就是檢查搜索引擎爬蟲在你網站上可能遇到的問題。 因為這是一個真正的搜索引擎,而且對于google來說,GSA和google.com的爬蟲是一模一樣的,所以檢查到的問題都是真正的搜索引擎爬蟲會遇到的問題。 操作方法為: 點擊“抓取并編制索引” —> “抓取網址”,按如下格式輸入你要檢查的網址,按后點擊“保存要抓取的網址”。 在“狀態(tài)和報告”—>“ 抓取狀態(tài)”里,點擊“恢復抓取”。 等一段時間以后,如果一切正常,在GSA的前臺就可以開始搜索到網站的內容。 在“狀態(tài)和報告”—>“抓取狀態(tài)”里,就可以看到爬蟲遇到的一些問題。如: 點擊出錯的部分,會列出哪些URL因為什么原因出錯。 這個虛擬機版本已經內置了一些數據。每次測試前,都需要把數據清空。 在 “管理”—>“重置索引”里, 點擊“立即重置索引”可以清空所有已經抓取的數據。 看著這些似曾相識的界面,應該能明白我以前寫那篇《google 的良苦用心:網站管理員工具》的依據了。 第二個應用就是可以探測到google大部分基本的排序規(guī)則。 以前很多人在做SEO過程中對很多排名因素都是不能確定的。 如:到底 h1 放多少個好、有沒有必要加導出鏈接等等。 有了GSA,就可以做大量的 A/B測試,就能把很多因素都測試出來。 如:測試<h2> 和 <strong> 這兩個標簽哪個對排名的影響更大一點。 那就可以設計A和B兩個網頁,其他部分都一模一樣,只是某個特定的關鍵詞,A網頁是用 <h2> 加粗的,B網頁是用 <strong> 加粗的。 用GSA只收錄這兩個網頁,并且只對這兩個網頁進行排名。在前臺搜索這個關鍵詞,看哪個網頁排在前面,這樣就可以知道哪個因素對排名的影響大一些了。 有點需要注意一下的是,那些被測試的網頁,如果上面有鏈接而你又沒做限制的話,爬蟲會順著這些鏈接把很多網頁都收錄進來,那會對測試結果造成干擾。 類似的測試方法還有很多,只要你想得到都可以去測試。 這樣能把google宣稱的200多項排序規(guī)則中的一大半規(guī)則都可以測試出來。 不過要明白一點的是:即使能把所有的規(guī)則測試出來,也不一定能做好SEO,在《怎樣形成一套非?茖W系統(tǒng)的SEO方法》中我說過:做搜索引擎是一回事,在搜索引擎上拉流量又是另一回事。 等大家把很多排序規(guī)則都測試出來了再來做SEO就明白了。 只是知道了這些規(guī)則,那就不需要聽那些毫無來由的SEO規(guī)則了,很多事情你自己完全能確定是怎么回事。還有就是就算要向你老板交代你的SEO做法的時候也可以理直氣壯一點。 另外,由于百度也在不停的“學習”google的算法,所以這里的很多規(guī)則對百度也適用。(其實大部分搜索引擎的很多做法,甚至開發(fā)語言都是一模一樣的。 順便廣告一下: 杭州光年已經能開發(fā)搜索引擎及其很多應用。如小型搜索引擎、網站站內搜索、基于搜索的輿情監(jiān)控系統(tǒng)、公司內部文檔搜索等等。不是用開源程序開發(fā)。) 第三個應用就是可以查看內部鏈接的結構,看哪些網頁被內部鏈接推薦得多一點。 在《內部鏈接還是外部鏈接?》一文中,講述了內部鏈接的重要性。 但是極少有網站知道自己的每個網頁內部鏈接的分布情況,有了GSA,這個就很容易辦到了。 在“狀態(tài)和報告”—>“ 抓取狀態(tài)”里,輸入剛才GSA收錄的網址,“網址狀態(tài)”選 “已抓取”,就可以查詢到已經被收錄的網頁的PR在站內有多高。 這是在沒有任何外部鏈接的情況下,網站純依靠自身的內部鏈接造就的網站內部的PR值分布情況。 點擊具體的URL,還可以查看詳細的信息如: 當然還有其他一些應用,如:只收錄自己的網頁和競爭對手的網頁并進行排序,如果你自己的網頁排在后面,就不停的改進直到超過對手的網頁。其他更多的應用還是靠大家慢慢發(fā)掘吧,都寫出來就沒什么意思了。 用它確實是可以做出一個完美的SEO網頁。 這個虛擬機版本是運行在Vmware上的,Vmware7.1.3 的下載地址是:http://download.pchome.net/system/sysenhance/redirectsrv-4673-1.html 初次使用虛擬機的同學最好裝個Vmware7.1.3的漢化補丁。 GSA虛擬機版本的下載地址放在光年論壇上: (需要論壇會員才能看到下載地址) http://www.gnbase.com/thread-13-1.html Vmware的安裝過程略過,不過注意一下Vmware在安裝過程中會安裝幾個虛擬網卡,如果電腦上的防火墻提示你的時候,一定要允許共享或通過。 要使用GSA,google官方建議的電腦配置為:
不過我在雙核 1.8G 、2GB內存的筆記本上運行也不是太慢。之所以建議用40GB的硬盤空間是因為這個虛擬機版解壓縮以后的大小是近35GB。 Vmware安裝好以后,直接導入解壓縮以后的那個vgsa.vmx ,然后打開虛擬機電源,接下來就是一段漫長的等待。 等出現配置界面的時候,就開始配置。 大部分情況下,都需要手動配置GSA的設置,不然在后臺抓取網頁的時候會出現“DNS錯誤”。 先用 ipconfig 命令查看你本機的IP ,再來配置GSA。 按 Ctrl + G 進入虛擬機,再按 F2 ,按鍵盤上的 -> 選擇 Manual , IP 地址要填和你的電腦在同一個網段的其他IP地址。 其他和你本機的一樣。 DNS就填和 Gateway 一樣的地址,DNS Suffix 可以隨便填。 即使配置好了,可能還不能馬上使用,需要等待一會。 我記得GSA正式版從啟動到能使用是需要等20分鐘的,虛擬機版本也需要稍等一會。 GSA的后臺訪問地址是: http://{剛才配置的IP}:8000 , 前臺訪問地址是:http://{剛才配置的IP}。后臺的登錄密碼壓縮包里有。 軟件的使用細節(jié)還有很多,GSA的使用交流可以到光年論壇。 因為現在大家都可以用它來探測google的排序算法,我相信會有很多的成果能發(fā)布在論壇上的。 自從去年我發(fā)布那篇介紹GSA的博客2個月后,因為有google的朋友也看這個博客,我猜google可能意識到了某些問題,所以google中止了GSA虛擬機版的更新,我這個版本是最新的一個版本。 我放這個版本出來是希望SEO行業(yè)從此不要道聽途說或人云亦云,SEO是可以做得很科學的,SEO要長久發(fā)展下去就必須走規(guī)范化和標準化的道路。 本文出自:億恩科技【mszdt.com】 |