蜘蛛抓取工具分析_Lynx 在線版以及瀏覽器插件 |
發(fā)布時(shí)間: 2012/9/15 14:19:13 |
Lynx 在線版以及瀏覽器插件
最近還是太忙,所以關(guān)于內(nèi)外部鏈接的文章還沒開始寫,F(xiàn)在給大家一個(gè)Lynx 在線版以及相關(guān)的瀏覽器插件。
我在《Lynx瀏覽器在SEO上的應(yīng)用》一文中介紹過這個(gè)工具。不過有些人說在linux下沒有安裝好或者有亂碼的出現(xiàn)。后來有人給我看了國外的一個(gè)Lynx在線版,但是那個(gè)在線版也存在著一些問題。我的這個(gè)Lynx 在線版把那些問題都解決了,使用起來還不錯(cuò)。
如果正在仔細(xì)閱讀《google網(wǎng)站質(zhì)量指南》的朋友應(yīng)該能注意到,在這個(gè)《google網(wǎng)站質(zhì)量指南》里,至少十幾篇文章中都出現(xiàn)了要你去用Lynx檢測網(wǎng)站的提示。而且是一到具體的做法的時(shí)候,都說:請用Lynx去檢測你的網(wǎng)站,因?yàn)樗团老x看到的內(nèi)容幾乎一樣。這個(gè)工具在05年就有一些一線的SEOer在用了。
使用方法非常簡單,你只要填入你要查看的URL,點(diǎn)擊“查看”就可以了。網(wǎng)址要以http://開頭。
URL:
如,我輸入http://www.baidu.com/ ,查看到的界面如下:
以lynx查看百度
輸出的結(jié)果分為兩部分:
第一部分,就是搜索引擎爬蟲看到的內(nèi)容,這個(gè)內(nèi)容和別的查看方式都不一樣。不僅顯示了文字信息,還顯示了網(wǎng)頁的結(jié)構(gòu)信息。去了解搜索引擎的原理就會知道,這種結(jié)構(gòu)信息也是搜索引擎會儲存下來的。 并且在分析你的網(wǎng)站講了什么信息的時(shí)候,這些結(jié)構(gòu)信息就是判斷的依據(jù)。每個(gè)錨文本旁邊還標(biāo)上了這個(gè)鏈接的序號。
第二部分就是網(wǎng)站中所有爬蟲能夠識別的鏈接。有些網(wǎng)頁這里會顯示隱藏的鏈接。經(jīng)常有人問我這個(gè)隱藏鏈接要不要緊,我這里統(tǒng)一回答一下:其實(shí)不是太重要,當(dāng)你網(wǎng)站的SEO優(yōu)化是正規(guī)的方法的話,可以忽視掉這個(gè);但是當(dāng)你用了很多黑帽的方法,這個(gè)隱藏鏈接就是讓你“罪加一等”的地方。所以在alibaba的首頁雖然也檢測出幾個(gè)隱藏鏈接,但是都沒改過來。
這個(gè)工具支持絕大部分編碼,日文、韓文、俄文等等都沒問題的。
還有兩個(gè)瀏覽器插件,一個(gè)是給 Firefox的,一個(gè)是給IE 的。
1,下載Lynx 在線版 for IE IE卸載文件
2,下載Lynx 在線版 for Firefox
裝上了插件后,在你瀏覽一個(gè)網(wǎng)頁的時(shí)候,在網(wǎng)頁上點(diǎn)擊右鍵的彈出菜單里,會有“以Lynx方式查看”的選項(xiàng)。這樣非常方便平常大家查看網(wǎng)頁。
瀏覽器右鍵菜單
由于這個(gè)工具放在國外的虛擬主機(jī)上,可能速度有點(diǎn)慢的。我還不知道有多少人會用這個(gè)工具,到時(shí)候可能有短暫的時(shí)間會使用不了。
不過大家可以先慢慢用著,以后還有講述如何更好的應(yīng)用這個(gè)工具的文章。
為了更好的推廣這個(gè)工具,大家可以在自己的網(wǎng)站上,加上這個(gè)工具。
代碼為:
<form action=”http://lynx.semyj.com/lynxview.php” enctype=”application/x-www-form-urlencoded” method=”get” target=”_blank”>
URL:
<input id=”url” style=”width: 300px;” name=”url” type=”text” value=”http://” /> <input type=”submit” value=”查看” />
</form> 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |