无码视频在线观看,99人妻,国产午夜视频,久久久久国产一级毛片高清版新婚

  • 始創(chuàng)于2000年 股票代碼:831685
    咨詢熱線:0371-60135900 注冊有禮 登錄
    • 掛牌上市企業(yè)
    • 60秒人工響應
    • 99.99%連通率
    • 7*24h人工
    • 故障100倍補償
    您的位置: 網站首頁 > 幫助中心>文章內容

    Bing核心搜索研發(fā)部:搜索質量的見解

    發(fā)布時間:  2012/9/10 11:37:32
     題記:這是一篇來自Bing核心搜索研發(fā)部經理的一篇文章,本文講訴了Bing的一系列功能改進,這只是一篇普通的搜索功能改進介紹,但通讀本文,我們會發(fā)現,搜索引擎會把大量精力放在研究人們在搜索時犯的錯、如何正確理解用戶的意圖、以及利用詞庫提供更精準的內容上面。所以盧松松相信,無論是bing、Google還是百度,都會這么做。
     
    在Bing,我們承諾提供最好的搜索結果,雖然研究小組數據挖掘專家,在不斷提供我們的核心拼寫和排名算法,可現實是總有某些歷史上的遺留下的缺陷,這部分是因為人們過于依賴搜索所犯的錯誤,在這篇文章中,我的同事Bill Ramsey(Bing的研發(fā)部經理),將從三個方面介紹缺陷的發(fā)生率和嚴重性:網址查詢、追蹤鏈接和相關搜索。
     
    網址查詢常見的錯誤
     
    這是搜索缺陷的主要來源之一,涉及到我們所說的網址查詢,例如“facebook.com”或“雅虎網站/郵箱”的查詢,乍一看,你可能會認為這是一個簡單的問題。畢竟搜索引擎(Bing)包含數十億網址,找到一個匹配的網站沒多少難度。但在現實中,這種類型的查詢實際上相當復雜。因為我們所有人會用無數的拼寫與變體。
     
    例如,“facebook.com”就有上千個不同的變體,如“facebookc.om”,“facbook.com”,和“ww.faceboo.omc”,除了這類拼寫錯誤外,人們并不總是知道正確的URL。例如西南航空公司是southwest.com,但有些人試圖搜“swair.com”達到該公司的網頁。同時,我們通?吹降木W址,如“雅虎網站/郵箱”時,正確是URL是“mail.yahoo.com”的排列。
     
    即使我們找出了你真正的搜索意圖,但惡意網址或垃圾郵件發(fā)送者提出了另一個挑戰(zhàn)。它們獵取頂級域名對象如coolmathgames.com(人實際上是為coolmath-games.com)的URL。
     
    這是我們的缺陷,我們主要通過三個領域來解決這類錯誤的查詢方法:
     
    第一, 正確識別URL,我們可以就遮擋,通過確定的網址,我們避免如包括像searscardcom.com垃圾結果的問題。
     
    第二, 進行模擬用戶錯誤測試,通過數十億的原模型,我們能夠解決常見的拼寫錯誤的網址。
     
    第三, 我們會分析,尋找像“swair.com”網站,使用戶最終將結束預定網站“southwest.com”。
     
     
     
    另一個例子,適用于機器學習模式,像“facebooklogin.com” 的查詢相當于 “facebooklogin.net”,這是很常見的域名后綴輸入錯誤。此外,像“bed bath and beyond.com” 輸入成 bedbathandbeyond.com。我們的模型已經適應了這些變化,會主動把搜索結果修改,下面的例子是facebook的用戶:
     
     
     
    刪除多余追蹤的相關鏈接
     
    搜索引擎的關鍵功能之一,是查詢執(zhí)行拼寫和查詢擴展的組件,拼寫會糾正數百個錯誤的查詢,而搜索出現的詞組(下面的查詢框,表明我們改變了用戶的查詢),我們把這種改建作為“追索”。例如,如果你輸入“關于成功英雄的事跡”,我們將顯示“包括引號的成功的英雄事跡”,但我們可能只顯示“關于成功的英雄和事跡”,我們會架設所有關于你的意圖。
     
     
     
    在過去,我們用同義詞作為我們追蹤鏈接的一部分,但會經常導致搜索結果偏離主題,導致同義詞追蹤成為多余的功能, 所有我們在不斷擴大“詞語”的定義,幫助其用戶更好的進行匹配。
     
     
     
    所以這項功能我們已經刪除,這個附加的價值不大,當Bing改變一些同義詞的話,追蹤鏈接可能不可能添加更多的有價值的信息,所以我們將搜索結果的顏色改為黑色。我們將繼續(xù)努力為用戶指定的搜索詞語提供更好的查詢。
     
    改進相關搜索
     
    相關搜索,這個大家很熟悉,在人們初始搜索時,我們會把相關的搜索防止搜索結果左側,現在調整到右側,例如搜索“布拉德·皮特”:
     
     
     
    (注:Bing中國版還沒有變,百度和Google在底部。)
     
    有時我們會查詢搜索結果的題外話。例如“AMD”會給用戶提供意想不到的搜索結果,通過改善我們的相關模型。
     
     
     
    同時,我們也取得了其他地方改進,超越有關相關搜索中的格式條款,即“KSN WeatherLab” 中的 “KSN Weather Lab”,(注:一些實驗性項目,處于測試階段),并避免在安全搜索中檢索到成人內容。
     
    結論:
     
    搜索引擎的有點在于它會始終依賴于人,而人們總會有不同缺陷的,我們做的是降低缺陷率和搜索率,希望人們可以做更少的搜索并做更多的事。

    本文出自:億恩科技【mszdt.com】

    服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網安備41019702002023號
      1
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線