百度秘密研發(fā)推薦引擎技術(shù) 建立百人團(tuán)隊 |
發(fā)布時間: 2012/9/5 11:28:14 |
6月19日消息,百度主任架構(gòu)師、推薦引擎負(fù)責(zé)人廖若雪今日接受媒體采訪時透露,百度從去年起抽調(diào)技術(shù)人員成立獨立研發(fā)團(tuán)隊,研發(fā)“推薦引擎”技術(shù),目前團(tuán)隊百余人。
百度推薦引擎是一項底層技術(shù),目前已經(jīng)在音樂隨身聽、百度知道、百度新首頁等項目中應(yīng)用。 什么是推薦引擎? 推薦引擎是主動發(fā)現(xiàn)用戶當(dāng)前或潛在需求,主動推送信息、應(yīng)用和服務(wù)給用戶的互聯(lián)網(wǎng)技術(shù)。跨領(lǐng)域推薦是在推薦引擎基礎(chǔ)上,強調(diào)利用通用的推薦技術(shù),進(jìn)行信息、應(yīng)用和服務(wù)的跨平臺推薦。 百度為什么涉足推薦引擎技術(shù)?廖若雪介紹,人們在互聯(lián)網(wǎng)上獲取信息的方式大致經(jīng)歷了三代,第一代以分類目錄為代表,那時的全網(wǎng)信息量僅數(shù)萬個網(wǎng)頁;第二代即今天使用的搜索引擎,網(wǎng)頁數(shù)高達(dá)數(shù)百億,同時集成了圖片、視頻、應(yīng)用等更多媒體內(nèi)容;下一階段網(wǎng)頁數(shù)將超過數(shù)百萬億,搜索結(jié)果中符合要求的內(nèi)容可能成百上千,用戶需要花費大量時間去尋找最適合自己的搜索結(jié)果,解決之道就是推薦引擎。 目前,百度、Google、有道、bing、搜索、Yahoo都是以搜索滿足用戶的主動表達(dá)需求。在國外,以推薦挖掘并滿足用戶潛在需求的如亞馬遜、Pandora、NETFLIX等。 “推薦依賴用戶個性化需求。那些用戶無法表達(dá),或表達(dá)出來非常復(fù)雜的需求,我們定義為潛在需求。”廖若雪說。 百度推薦引擎應(yīng)用于百度知道、百度新首頁 廖若雪介紹,百度推薦引擎有三個特點:一是跨領(lǐng)域,多語言、多媒體、全產(chǎn)品形態(tài)。亞馬遜進(jìn)行商品推薦,Pandora進(jìn)行音樂推薦,百度進(jìn)行跨領(lǐng)域推薦;二是平臺化、通用算法、歸一化數(shù)據(jù);三是智能化,智能需求感知,滿足用戶需求。 百度推薦引擎于2011年開始研發(fā),早期實踐于音樂隨身聽,自適應(yīng)用戶喜好變化、采用音樂專家系統(tǒng)技術(shù)。近期,推薦引擎實踐于百度新首頁、百度知道。 以百度知道為例,百度方面透露數(shù)據(jù),從一個用戶在百度知道上提出問題,到這個問題被合適的回答者看到,平均需要12個小時;而推薦技術(shù)應(yīng)用到百度知道后,時間縮短到最多不超過5分鐘,回答率提升了50%。 “當(dāng)用戶使用搜索引擎搜索時,瀏覽網(wǎng)頁時,在移動終端上提交他的位置時,都有大量的行為動作。 根據(jù)用戶的行為提交,再規(guī)避掉他們的隱私數(shù)據(jù),用一定的算法匹配,就能夠智能地感知用戶需求,并在短時間內(nèi)給予他們需要的內(nèi)容。”廖若雪說。 百度跨領(lǐng)域推薦引擎依托于百度原有的用戶數(shù)據(jù)庫。百度搜索引擎儲存了上千億的網(wǎng)頁,每天處理100PB級數(shù)據(jù)。目前,百度推薦引擎是一項基礎(chǔ)服務(wù),融入到搜索中,尚未開發(fā)獨立的產(chǎn)品。“當(dāng)傳統(tǒng)形態(tài)不適合時某項服務(wù)時,可能打造以推薦為核心的產(chǎn)品。” 廖若雪透露,如果百度推薦引擎發(fā)展成熟,不排除以開放平臺模式與國內(nèi)垂直網(wǎng)站合作,如京東商城等電子商務(wù)網(wǎng)站。 推薦引擎技術(shù)處于早期階段 廖若雪說,推薦引擎還處于發(fā)展早期。“百度走的早些,但大家都處于0起跑線沒跑幾步的狀態(tài)。豆瓣電臺、電子商務(wù)網(wǎng)站做了很多工作,但還沒有人做到及格,推薦引擎還是非常新的領(lǐng)域。” 廖若雪描述了未來推薦引擎的一幅畫面:如果你是韓劇愛好者,不用再繁瑣的查詢,就能即使獲得最新韓劇推薦;查詢“好看的電影”,就能獲得符合該用戶喜好的電影;搜索“怎么向女友求婚”,就能獲得一套針對你和女友量身定制的方案 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |