當(dāng)機器學(xué)習(xí)遇到場景識別 |
發(fā)布時間: 2012/8/15 11:55:32 |
機器學(xué)習(xí)軟件可通過Google街景圖像來篩選出城市中獨特的“視覺簽名”,如巴黎某建筑的鑄鐵陽臺和圓柱門廊以及倫敦的石頭陽臺和獨特路牌。 卡耐基梅隆大學(xué)的研究人員正在開發(fā)機器學(xué)習(xí)程序,已識別如圖中巴黎某建筑三樓的陽臺鐵欄桿、窗欄桿、路燈的形狀以及木門的造型。 卡耐基梅隆大學(xué)研究人員開發(fā)的機器學(xué)習(xí)程序分析了12個主要城市的40000幅Google街景圖像,并為每一張圖片挑選出獨一無二的“視覺簽名”。倫敦的建筑兩列通常有很多古典門廊,而巴黎的建筑往往有陽臺欄桿,欄桿通常是石頭做成的,而且往往是在二樓。 但當(dāng)機器學(xué)習(xí)程序放大舊金山和紐約的陽臺的照片時沒有發(fā)現(xiàn)像巴黎那樣的“視覺簽名”,機器學(xué)習(xí)程序試圖在公路隧道的標(biāo)記和街道上汽車做出區(qū)別。研究人員表示相對于其他城市美國城市的建筑大多保持統(tǒng)一性,缺乏建筑自身的獨特性。 從機器學(xué)習(xí)的角度來看,最大的難題是從大量的視覺數(shù)據(jù)中篩選出特有的位置,如數(shù)木、混凝土和天空。這就需要需找事物的不同點,例如兩個城市間陽臺的細(xì)微差別,想發(fā)現(xiàn)細(xì)微差別需要150個處理器運行一夜的時間來完成分析。 機器學(xué)習(xí)程序已經(jīng)提供的功能可正確識別照片顯示那一刻巴黎83%和布拉格92%的事物(如建筑,植物)。 此項目有卡耐基梅隆大學(xué)計算機科學(xué)教授Alexei Efros領(lǐng)導(dǎo),成員包含INRIA/Ecole Normale Supérieure。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |