无码视频在线观看,99人妻,国产午夜视频,久久久久国产一级毛片高清版新婚

  • 始創(chuàng)于2000年 股票代碼:831685
    咨詢熱線:0371-60135900 注冊有禮 登錄
    • 掛牌上市企業(yè)
    • 60秒人工響應
    • 99.99%連通率
    • 7*24h人工
    • 故障100倍補償
    全部產(chǎn)品
    您的位置: 網(wǎng)站首頁 > 幫助中心>文章內(nèi)容

    什么是關(guān)鍵詞堆砌

    發(fā)布時間:  2012/9/18 11:45:23
       關(guān)鍵字堆砌(keyword stuffing)的常見形式有哪些?
      
        眾多關(guān)鍵字充斥于網(wǎng)頁信息中就會形成關(guān)鍵字堆砌(Keyword stuffing)。這類網(wǎng)頁看起來更像是一連串的關(guān)鍵字,而不像是別的什么東西。關(guān)鍵字堆砌的另一形式就是將關(guān)鍵字或關(guān)鍵詞盡可能多次的填入頁面的 title標簽中。搜索引擎通常會降低這類網(wǎng)頁的搜索排名,或者完全忽略這些關(guān)鍵字。這兩種結(jié)果對網(wǎng)站都沒有什么好處。關(guān)鍵字堆砌的橋頁(doorway pages)或隱形頁面(cloaked pages)不僅是過度使用關(guān)鍵字的例子,而且還是因自身原因而受到懲罰的因素。在所有導入鏈接(inbound links)中頻繁使用相同的鏈接錨文本,也會被看作是關(guān)鍵字堆砌的一種形式。
      
        一個網(wǎng)站是否會因為關(guān)鍵字堆砌而受到懲罰?
      
        一個網(wǎng)站會因為關(guān)鍵字堆砌(keyword stuffing)而受到搜索引擎的懲罰。Google似乎對于頁面上過度使用關(guān)鍵字非常敏感,因為關(guān)鍵字堆砌會觸發(fā)過濾器(filter)。搜索引擎巨人可能對網(wǎng)站采取的懲罰措施包括,降低其在搜索結(jié)果中的排名、降低其在Google的PR值以及禁止該網(wǎng)站。如同所有搜索引擎優(yōu)化(SEO)的努力一樣,常識和考慮什么事情有益于你的網(wǎng)站瀏覽者,是任何一個站長最好的行為。 
      
        搜索引擎對關(guān)鍵字堆砌的識別
      
        搜索引擎和搜索引擎優(yōu)化(SEO)一直是一對矛盾,合理的優(yōu)化有助于搜索引擎對網(wǎng)站內(nèi)容的識別,有助于網(wǎng)站的推廣。然而有正面,就有反面,一些SEOers通過各種欺騙手段來欺騙搜蘇引擎,以期達到增加頁面收錄數(shù)和頁面排名的目的。 
      
        早期的關(guān)鍵字堆砌SPAM作弊方式之一,是將中文詞庫中的單詞直接用軟件拼湊成文章,這樣的文章沒有實際的意義,只能給搜索引擎看。那么對于這樣的文章,搜索引擎是通過什么方式來識別的呢?
      
        我們知道,每個搜索引擎都有網(wǎng)頁質(zhì)量監(jiān)控部門,對于百度等摻雜人工處理的搜索引擎而言,用戶發(fā)現(xiàn)這樣的網(wǎng)站,投訴到百度,百度直接封了這個網(wǎng)站了事。但對于Google這樣的封站也是自動處理的搜索引擎而言,對關(guān)鍵字堆砌作弊的識別就顯得更為重要了。
      
        對于關(guān)鍵字堆砌作弊方式的識別,搜索引擎一般采用統(tǒng)計分析的方法進行。
      
        搜索引擎首先將網(wǎng)頁進行分詞,分詞完成后可以得到詞的數(shù)量N和文章長度L,從大量文章的統(tǒng)計中發(fā)現(xiàn)文章的長度L和詞的數(shù)量N兩個數(shù)字之間存在一定的分布關(guān)系,一般而言L/N界于4至8之間,均值大約在5-6之間。也就是說一篇長度為1000字節(jié)的文章中,應該有125-250個分詞,由于中文和英文的詞的組成不一致,因此在英文和中文中這個比值的范圍會有所不同。如果搜索引擎發(fā)現(xiàn)L/N特別大,那么這篇文章就存在就存在關(guān)鍵字堆砌現(xiàn)象了,如果L/N特別小,則可能是這篇文章是由一些詞所組成的沒有意義的文章。
      
        進一步,通過大量正常文章統(tǒng)計發(fā)現(xiàn),文章中密度最高的幾個關(guān)鍵字出現(xiàn)的次數(shù)之和與N/L存在一定的分布關(guān)系,搜索引擎就可以通過網(wǎng)頁中的分布與統(tǒng)計結(jié)果的分布圖進行比較得出文章是否存在關(guān)鍵字堆砌的現(xiàn)象。
      
        此外,搜索引擎還將從停止字的比例來判定文章是否為自然文章。停止字就是如“的”“我”“是”等在文章中普遍使用的字或詞,如果文章中停止字的比例在正常的比例范圍之外,這個網(wǎng)頁應提交到網(wǎng)頁質(zhì)量監(jiān)控部門審核。
      
        當然,還有更多的算法可以對網(wǎng)頁與自然語言的文章進行比較分析,以判別文章是否為自然文章。
      
        所謂魔高一尺、道高一丈,有些作弊者已經(jīng)放棄了單詞的組成文章的作弊方式,而改用句子組成文章的作弊方式,作弊者通過爬蟲或其它方式獲得網(wǎng)上文章的句子,并用軟件將數(shù)十篇文章的某幾句拼湊成一篇文章。這就需要搜索引擎做語義的分析來判斷是否作弊了,然而目前關(guān)于語義分析的研究還處于研究階段,這也是下一代智能搜索引擎的方向。
      
        然而我們?nèi)匀徊荒軐⒆詣游恼律梢还髯哟蛩溃谌斯ぶ悄艿奈恼律扇匀皇侨祟愌芯孔陨碚Z言以及自身智能的一個重要方向。作弊與反作弊,將能促使人類對人工智能的研究。
      
        如果到最后,軟件能生成人類能夠理解的文章,這是SPAM還是精華?你能肯定地說目前存在的智能化程度還不夠高的RSS聚合文章一定是SPAM嗎?然而,如果這樣的文章海量的出現(xiàn),我們又該如何去面對這個現(xiàn)象?

    本文出自:億恩科技【mszdt.com】

    服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經(jīng)營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關(guān)注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權(quán)所有  地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網(wǎng)安備41019702002023號
      1
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線