百度站長門診開放日Lee問答整理 |
發(fā)布時間: 2012/9/19 9:46:34 |
Lee是一條牛仔褲牌子,但在百度中,Lee是一個神秘帳號,起初在站長俱樂部中Lee是創(chuàng)建人,在此貼吧位高權(quán)重,Lee的各種回答一直被站長視為百度官方回復(fù)。隨著貼吧的關(guān)閉,Lee這個帳號就消失了。
隨著百度站長論壇的建立,Lee帳號再次復(fù)活,并在8月10日的“站長門診開放日”活動中為站長們答疑。不過這次終于知道Lee這個帳號是來自哪個部門了——百度網(wǎng)頁搜索產(chǎn)品市場部。
百度網(wǎng)頁搜索產(chǎn)品市場部對外界而言,這個團(tuán)隊就是個傳說,在百度內(nèi)部,這個團(tuán)隊也同樣帶著極其濃郁的神秘色彩,也因神秘,外界對他們充滿了好奇和猜測,甚至還有一些誤解。
下面為百度站長門診開放日問答整理:
keywords(關(guān)鍵詞)還有用嗎?
metakeywords早就進(jìn)歷史的垃圾堆了,我們會直接忽略。
網(wǎng)站快照一直停留不動是什么原因?
關(guān)于快照的更新時間,尤其是首頁的更新時間,我一直建議不要參考,這個時間跟網(wǎng)站的價值沒有任何的關(guān)系。
在百度眼中什么是高質(zhì)量的站點(diǎn)?
關(guān)于這個問題,請大家換位思考一下,作用一個搜索引擎,所追求的最終目標(biāo)是為用戶提供最有價值的信息,我們希望大家有一個最低限度的判斷,那就是將自己作為一個普通的用戶,通過搜索引擎搜索到自己的網(wǎng)站時,自己相不相信自己網(wǎng)站上的信息,自己覺不覺得這是互聯(lián)網(wǎng)上最好的信息。
我們通過反饋渠道收集到聲稱自己網(wǎng)站是原創(chuàng)、高質(zhì)量網(wǎng)站的反饋,其中80%多都是無效的,甚至大量聲稱老中醫(yī)3-5天治愈絕癥的網(wǎng)站,通篇內(nèi)容讀不通,聲稱自己是高質(zhì)量的網(wǎng)站。
如果互聯(lián)網(wǎng)非常純潔,那我們也不會花費(fèi)大量人力去識別網(wǎng)站的質(zhì)量,也就不會有誤傷。
但互聯(lián)網(wǎng)越來越不保險,我們的策略也越來越復(fù)雜,只要對技術(shù)有一定了解的人,都應(yīng)該知道誤傷是無法避免的,我們也盡最大的努力將誤傷降到最低限度。
搜索引擎對網(wǎng)頁價值的判斷,不是從字?jǐn)?shù)出發(fā)的,而是從其資源質(zhì)量出發(fā)的,只要是對用戶有價值的內(nèi)容,不論長短,我們都會給一個合理的評價,如果這個網(wǎng)站上提供的內(nèi)容或者服務(wù)非常有價值,無可替代,那對搜索引擎來講,就是一個高質(zhì)量的網(wǎng)站。
link標(biāo)簽rel=canonical屬性百度支持嗎?這個問題很關(guān)鍵,我們有大量同質(zhì)的內(nèi)容。
canonical目前不支持,不過已計劃要支持了。(注:canonical標(biāo)簽可以為搜索引擎指明當(dāng)前頁面權(quán)重的側(cè)重點(diǎn)在于哪個鏈接,從而有助于SEO。)
我有一個商城類網(wǎng)站,因?yàn)闀?jīng)常產(chǎn)生大量下架商品,產(chǎn)生下架商品后,程序會返回一個只有模板的空頁面,沒有任何具體商品信息。以前我把這些下架商品所在的頁面設(shè)置為404,在日志里看到大量的404狀態(tài)碼,請問這樣會不會影響我網(wǎng)站的質(zhì)量,長期下去造成收錄和排名下降?
我們鼓勵站長為死鏈返回規(guī)范的404代碼,不歡迎給死鏈返回200代碼。只要是正確的返回404,對網(wǎng)站沒有任何影響,還可以減少baiduspider抓取給服務(wù)器造成的負(fù)擔(dān)。如果死鏈數(shù)量較多,建議通過站長平臺提交死鏈列表,更高效一些。
雖然百度的官方不承認(rèn)有降權(quán)蜘蛛的說法,但是例如:123.125.*段的蜘蛛出現(xiàn),網(wǎng)站在排名、收錄上快照、都會存在異常,是否可以理解為這段IP的蜘蛛雖然不是降權(quán)蜘蛛,但可以認(rèn)為是自身網(wǎng)站出現(xiàn)了問題,百度對于網(wǎng)站的考察和警示呢?是百度對網(wǎng)站所提出的警告呢?
Baiduspider只有一種,不存在什么降權(quán)蜘蛛。不過你所提到的對網(wǎng)站的警示,我們會在站長平臺中考慮。(終于知道可能有降權(quán)蜘蛛的存在。)
一個專題專欄,里面大都是一些靜態(tài)頁面,但是百度一直不收錄,是什么原因?
根據(jù)你提供的query,我找出這個欄目隨便看了幾個網(wǎng)頁,都收錄了,貴站犯了一個非常常見的錯誤,同一個網(wǎng)頁,有兩種以上的url形式,我們收錄的,是不帶index.aspx的那種。建議參考《百度搜索引擎優(yōu)化指南》中關(guān)于url規(guī)范的部分。
為什么帶www的網(wǎng)站不穩(wěn)定,有時候被收錄,有時候又找不到了。
看不到實(shí)例的話,誰也說不準(zhǔn)到底是什么原因,建議你到http://tousu.baidu.com/webmaster/suggest給一下具體的實(shí)例,應(yīng)該是一種異常現(xiàn)象
百度對于一篇原創(chuàng)文章的判斷到底是怎樣的標(biāo)準(zhǔn)?現(xiàn)在憑借發(fā)布時間來判斷兩篇相同文章哪篇是原創(chuàng)還無法實(shí)現(xiàn),這一點(diǎn)百度說明過,但是現(xiàn)在的情況是很多新站,權(quán)重低的網(wǎng)站站長自己辛辛苦苦一點(diǎn)點(diǎn)碼字寫出來的原創(chuàng)文章,被高權(quán)重網(wǎng)站轉(zhuǎn)載,雖然注明了出處,但是對于百度來說,如果僅僅因?yàn)檗D(zhuǎn)載網(wǎng)站權(quán)重高就判斷為原創(chuàng)文章,那就意味著低權(quán)重網(wǎng)站被誤判為抄襲或轉(zhuǎn)載,這樣顯然很不公平,請問對于判斷文章原創(chuàng)問題,百度搜索團(tuán)隊是否有解決方案,或者直接回答我們“百度是否能判斷出哪篇文章才是原創(chuàng)的”。
我們正在計劃在原創(chuàng)方面做一些改進(jìn)。原創(chuàng)識別是一個很有技術(shù)含量的話題,不是簡單的幾種規(guī)則就能做好的,互聯(lián)網(wǎng)很復(fù)雜,人心更復(fù)雜,不過我們有信心逐步的去解決這個問題,其中也需要站長朋友多提供相關(guān)的問題和建議。
被誤傷的網(wǎng)站有沒有恢復(fù)的期限,是半年,還是一年?或者更長?
我們的策略都會定期的review/改進(jìn),不同的策略有不同的周期,天級到月級不等,我們會持續(xù)的改進(jìn)策略,以減少誤傷。
百度對于網(wǎng)站分隔符、網(wǎng)站結(jié)構(gòu)是否有自己的標(biāo)準(zhǔn)?
網(wǎng)站的結(jié)構(gòu)在保證用戶體驗(yàn)的前提下,適當(dāng)?shù)淖鲆恍⿲pider的優(yōu)化會有助于收錄,我們推薦扁平的樹型結(jié)構(gòu)!栋俣人阉饕鎯(yōu)化指南》中有詳細(xì)的說明。
目前醫(yī)療網(wǎng)站內(nèi)容同質(zhì)化嚴(yán)重,請問百度是如何來判定。
關(guān)于同質(zhì)內(nèi)容,先透露一下,我們正在設(shè)計一套較完善的原創(chuàng)識別算法,不久之后也會邀請站長朋友給我們一些建議及抄襲的實(shí)例用做算法調(diào)整之用。
一個網(wǎng)頁多大合適,有的頁面大小過200k,我一般都注意在110k以內(nèi),這個有數(shù)字標(biāo)準(zhǔn)嗎?
網(wǎng)頁大小建議以用戶能接受的程度為準(zhǔn),對百度來講,我們能接受的網(wǎng)頁大小肯定已經(jīng)超出普通網(wǎng)頁平均大小的數(shù)十倍,完全不用擔(dān)心。
寫在最后:
還是引用Lee的一句話作為結(jié)束語:“我每天為了迎合你不惜犧牲自己的休息時間手工外鏈到凌晨三點(diǎn)”,這不是百度倡導(dǎo)的運(yùn)營行為,我們倡導(dǎo)優(yōu)質(zhì)內(nèi)容,大量發(fā)外鏈很可能被判為超鏈作弊,請好好運(yùn)營優(yōu)質(zhì)原創(chuàng)內(nèi)容,謝謝!
本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |