百度站長門診開放日Lee問答整理 |
發(fā)布時間: 2012/9/10 10:47:46 |
Lee是一條牛仔褲牌子,但在百度中,Lee是一個神秘帳號,起初在站長俱樂部中Lee是創(chuàng)建人,在此貼吧位高權(quán)重,Lee的各種回答一直被站長視為百度官方回復(fù)。隨著貼吧的關(guān)閉,Lee這個帳號就消失了。
隨著百度站長論壇的建立,Lee帳號再次復(fù)活,并在8月10日的“站長門診開放日”活動中為站長們答疑。不過這次終于知道Lee這個帳號是來自哪個部門了——百度網(wǎng)頁搜索產(chǎn)品市場部。
百度網(wǎng)頁搜索產(chǎn)品市場部對外界而言,這個團(tuán)隊就是個傳說,在百度內(nèi)部,這個團(tuán)隊也同樣帶著極其濃郁的神秘色彩,也因神秘,外界對他們充滿了好奇和猜測,甚至還有一些誤解。
下面為百度站長門診開放日問答整理:
keywords(關(guān)鍵詞)還有用嗎?
meta keywords早就進(jìn)歷史的垃圾堆了,我們會直接忽略。
網(wǎng)站快照一直停留不動是什么原因?
關(guān)于快照的更新時間,尤其是首頁的更新時間,我一直建議不要參考,這個時間跟網(wǎng)站的價值沒有任何的關(guān)系。
在百度眼中什么是高質(zhì)量的站點(diǎn)?
關(guān)于這個問題,請大家換位思考一下,作用一個搜索引擎,所追求的最終目標(biāo)是為用戶提供最有價值的信息,我們希望大家有一個最低限度的判斷,那就是將自己作為一個普通的用戶,通過搜索引擎搜索到自己的網(wǎng)站時,自己相不相信自己網(wǎng)站上的信息,自己覺不覺得這是互聯(lián)網(wǎng)上最好的信息。
我們通過反饋渠道收集到聲稱自己網(wǎng)站是原創(chuàng)、高質(zhì)量網(wǎng)站的反饋,其中80%多都是無效的,甚至大量聲稱老中醫(yī)3-5天治愈絕癥的網(wǎng)站,通篇內(nèi)容讀不通,聲稱自己是高質(zhì)量的網(wǎng)站。
如果互聯(lián)網(wǎng)非常純潔,那我們也不會花費(fèi)大量人力去識別網(wǎng)站的質(zhì)量,也就不會有誤傷。
但互聯(lián)網(wǎng)越來越不保險,我們的策略也越來越復(fù)雜,只要對技術(shù)有一定了解的人,都應(yīng)該知道誤傷是無法避免的,我們也盡最大的努力將誤傷降到最低限度。
搜索引擎對網(wǎng)頁價值的判斷,不是從字?jǐn)?shù)出發(fā)的,而是從其資源質(zhì)量出發(fā)的,只要是對用戶有價值的內(nèi)容,不論長短,我們都會給一個合理的評價,如果這個網(wǎng)站上提供的內(nèi)容或者服務(wù)非常有價值,無可替代,那對搜索引擎來講,就是一個高質(zhì)量的網(wǎng)站。
link標(biāo)簽 rel=canonical 屬性百度支持嗎? 這個問題很關(guān)鍵,我們有大量同質(zhì)的內(nèi)容。
canonical 目前不支持,不過已計劃要支持了。(注:canonical 標(biāo)簽可以為搜索引擎指明當(dāng)前頁面權(quán)重的側(cè)重點(diǎn)在于哪個鏈接,從而有助于 SEO。)
我有一個商城類網(wǎng)站,因為會經(jīng)常產(chǎn)生大量下架商品,產(chǎn)生下架商品后,程序會返回一個只有模板的空頁面,沒有任何具體商品信息。以前我把這些下架商品所在的頁面設(shè)置為404,在日志里看到大量的404狀態(tài)碼,請問這樣會不會影響我網(wǎng)站的質(zhì)量,長期下去造成收錄和排名下降?
我們鼓勵站長為死鏈返回規(guī)范的404代碼,不歡迎給死鏈返回200代碼。只要是正確的返回404,對網(wǎng)站沒有任何影響,還可以減少baiduspider抓取給服務(wù)器造成的負(fù)擔(dān)。如果死鏈數(shù)量較多,建議通過站長平臺提交死鏈列表,更高效一些。
雖然百度的官方不承認(rèn)有降權(quán)蜘蛛的說法,但是例如:123.125.*段的蜘蛛出現(xiàn),網(wǎng)站在排名、收錄上快照、都會存在異常,是否可以理解為這段IP的蜘蛛雖然不是降權(quán)蜘蛛,但可以認(rèn)為是自身網(wǎng)站出現(xiàn)了問題,百度對于網(wǎng)站的考察和警示呢?是百度對網(wǎng)站所提出的警告呢?
Baiduspider只有一種,不存在什么降權(quán)蜘蛛。不過你所提到的對網(wǎng)站的警示,我們會在站長平臺中考慮。(終于知道可能有降權(quán)蜘蛛的存在。)
一個專題專欄,里面大都是一些靜態(tài)頁面,但是百度一直不收錄,是什么原因?
根據(jù)你提供的query,我找出這個欄目隨便看了幾個網(wǎng)頁,都收錄了,貴站犯了一個非常常見的錯誤,同一個網(wǎng)頁,有兩種以上的url形式,我們收錄的,是不帶index.aspx的那種。建議參考《百度搜索引擎優(yōu)化指南》中關(guān)于url規(guī)范的部分。
為什么帶www的網(wǎng)站不穩(wěn)定,有時候被收錄,有時候又找不到了。
看不到實例的話,誰也說不準(zhǔn)到底是什么原因,建議你到http://tousu.baidu.com/webmaster/suggest 給一下具體的實例,應(yīng)該是一種異常現(xiàn)象
百度對于一篇原創(chuàng)文章的判斷到底是怎樣的標(biāo)準(zhǔn)?現(xiàn)在憑借發(fā)布時間來判斷兩篇相同文章哪篇是原創(chuàng)還無法實現(xiàn),這一點(diǎn)百度說明過,但是現(xiàn)在的情況是很多新站,權(quán)重低的網(wǎng)站站長自己辛辛苦苦一點(diǎn)點(diǎn)碼字寫出來 的原創(chuàng)文章,被高權(quán)重網(wǎng)站轉(zhuǎn)載,雖然注明了出處,但是對于百度來說,如果僅僅因為轉(zhuǎn)載網(wǎng)站權(quán)重高就判斷為原創(chuàng)文章,那就意味著低權(quán)重網(wǎng)站被誤判為抄襲或轉(zhuǎn) 載,這樣顯然很不公平,請問對于判斷文章原創(chuàng)問題,百度搜索團(tuán)隊是否有解決方案,或者直接回答我們“百度是否能判斷出哪篇文章才是原創(chuàng)的”。
我們正在計劃在原創(chuàng)方面做一些改進(jìn)。原創(chuàng)識別是一個很有技術(shù)含量的話題,不是簡單的幾種規(guī)則就能做好的,互聯(lián)網(wǎng)很復(fù)雜,人心更復(fù)雜,不過我們有信心逐步的去解決這個問題,其中也需要站長朋友多提供相關(guān)的問題和建議。
被誤傷的網(wǎng)站有沒有恢復(fù)的期限,是半年,還是一年?或者更長?
我們的策略都會定期的review/改進(jìn),不同的策略有不同的周期,天級到月級不等,我們會持續(xù)的改進(jìn)策略,以減少誤傷。
百度對于網(wǎng)站分隔符、網(wǎng)站結(jié)構(gòu)是否有自己的標(biāo)準(zhǔn)?
網(wǎng)站的結(jié)構(gòu)在保證用戶體驗的前提下,適當(dāng)?shù)淖鲆恍⿲pider的優(yōu)化會有助于收錄,我們推薦扁平的樹型結(jié)構(gòu)!栋俣人阉饕鎯(yōu)化指南》中有詳細(xì)的說明。
目前醫(yī)療網(wǎng)站內(nèi)容同質(zhì)化嚴(yán)重,請問百度是如何來判定。
關(guān)于同質(zhì)內(nèi)容,先透露一下,我們正在設(shè)計一套較完善的原創(chuàng)識別算法,不久之后也會邀請站長朋友給我們一些建議及抄襲的實例用做算法調(diào)整之用。
一個網(wǎng)頁多大合適,有的頁面大小過200k,我一般都注意在110k以內(nèi),這個有數(shù)字標(biāo)準(zhǔn)嗎?
網(wǎng)頁大小建議以用戶能接受的程度為準(zhǔn),對百度來講,我們能接受的網(wǎng)頁大小肯定已經(jīng)超出普通網(wǎng)頁平均大小的數(shù)十倍,完全不用擔(dān)心。
寫在最后:
本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |