云計(jì)算助推知識產(chǎn)權(quán)信息化服務(wù)水平 |
發(fā)布時間: 2012/8/15 18:32:16 |
湯森路透德溫特世界專利索引(Derwent World Patents Index)的報告稱,到2015年,來自中國的專利申請數(shù)量預(yù)計(jì)將達(dá)到近50萬件,緊隨其后的是美國和日本,分別將達(dá)到40萬件和大約30萬件。
湯森路透的數(shù)據(jù)顯示,2006年至2010年,來自中國專利辦公室的申請數(shù)量從17.1萬件增至近31.4萬件,平均每年增長16.7%。 在此期間,日本的國際專利申請量居世界第一,之后依次為美國、中國、韓國和歐洲。 在中國提交所有的專利申請中,國內(nèi)申請所占比例從2006年的不到52%升至2010年的近73%,說明中國企業(yè)在專利高潮中已超過了外國企業(yè)。 根據(jù)世界知識產(chǎn)權(quán)辦公室(WIPO)的數(shù)據(jù),中國企業(yè)提交的海外專利申請數(shù)量也在不斷增加。 2010年,中國第二大電信設(shè)備制造商中興通訊(ZTE)的國際專利申請量居世界第二,僅次于日本的松下公司。 美國芯片制造商高通公司(QCOM)排名第三,中國華為技術(shù)有限公司排名第四。 由此可見,專利信息數(shù)據(jù)量與日俱增,從幾千萬到幾個億,其中中文專利就有300多萬件,數(shù)據(jù)空間容量幾百GB;系統(tǒng)對檢索性能要求高,在數(shù)百并發(fā)請求的壓力下要求95%的檢索在1秒內(nèi)完成,98%的檢索請求在3秒內(nèi)完成響應(yīng);數(shù)據(jù)結(jié)構(gòu)復(fù)雜,包含著錄項(xiàng)、代碼化全文數(shù)據(jù)XML等,同時有些專利還附有圖形說明書,包括TIFF圖、PDF文件,物化視圖和虛擬庫勢力,包括和虛擬庫實(shí)例;排序結(jié)果智能處理要求高,要求查準(zhǔn)和接近100%查全、豐富的概覽和詳覽展示、檢索結(jié)果分類統(tǒng)計(jì)等。 長期以來,對于海量專利數(shù)據(jù)的處理一直為國外企業(yè)所壟斷,如美國湯姆森科技,韓國WIPS等跨國集團(tuán)。為了貫徹我國知識產(chǎn)權(quán)戰(zhàn)略,擺脫長期依賴國外專利技術(shù)系統(tǒng)的局面,實(shí)現(xiàn)專利檢索和分析系統(tǒng)的自主建設(shè)和自主發(fā)展,我國在知識產(chǎn)權(quán)保護(hù)和管理方面正在積極發(fā)展與探索著,但同時也面臨著十分嚴(yán)峻的挑戰(zhàn)。 我國在知識產(chǎn)權(quán)信息化服務(wù)中,對于專利數(shù)據(jù)的挖掘分析涉及到海量文本挖掘、信息檢索、信息可視化等技術(shù)的通常做法是:采用文本挖掘?qū)A繉@谋具M(jìn)行信息的抽取;采用語義檢索篩選專利;采用信息可視化技術(shù)對分析結(jié)果進(jìn)行輸出。這些環(huán)節(jié)需要大量的數(shù)學(xué)運(yùn)算,屬于典型的計(jì)算密集型業(yè)務(wù),只有通過高性能計(jì)算集群才能保證任務(wù)的完成周期。關(guān)鍵問題包括:如何利用現(xiàn)有的先進(jìn)技術(shù),組織和管理中國專利文獻(xiàn),如何為專利審查員和專利申請人提供高效、快捷的專利文獻(xiàn)全文檢索和分析機(jī)制。 專利信息量的迅速增長以及查詢的復(fù)雜化,使傳統(tǒng)的分析檢索系統(tǒng)已不能滿足對數(shù)據(jù)進(jìn)行深層次多維度分析的要求,因此需要建設(shè)能夠處理海量非結(jié)構(gòu)化信息的、高度智能化的專利分析解決方案,通過對專利信息進(jìn)行多維分析處理,從而將分析結(jié)果以多維視圖的方式展現(xiàn)給決策者。 云計(jì)算高速并行的計(jì)算能力為我國知識產(chǎn)權(quán)信息化服務(wù)機(jī)構(gòu)提供了新的契機(jī)。它將幫助這些服務(wù)機(jī)構(gòu)建立基于多種索引模式和知識詞典的全文檢索、提供自然語言檢索和相似性檢索、專利群族等全方位智能檢索,甚至可以提供更多更精確的分類檢索、表格檢索、表達(dá)式檢索、英文詞根檢索、跨語言的專利查詢、專利文獻(xiàn)的復(fù)雜單元(化學(xué)表達(dá)式和數(shù)學(xué)表達(dá)式)檢索,各項(xiàng)檢索都支持二次檢索、同義詞檢索等,并可以將檢索結(jié)果作為檢索歷史保留,等等。 云計(jì)算的第一要素是信息。信息技術(shù)的發(fā)展,是一個從信息匾乏到信息無處不在的過程,我們經(jīng)歷了以系統(tǒng)為中心的集中處理階段,以PC為中心的分布處理階段,以網(wǎng)絡(luò)為中心的信息分享階段,到現(xiàn)在能隨時隨地存取的云計(jì)算階段。面對云計(jì)算對信息收集、處理產(chǎn)生的巨大影響,知識產(chǎn)權(quán)信息服務(wù)機(jī)構(gòu)需要對云計(jì)算創(chuàng)新服務(wù)模式進(jìn)行嘗試,直到完全適應(yīng),并發(fā)揮更大效能。 1、基于云計(jì)算的數(shù)據(jù)組織、管理方式。 不斷增長的海量數(shù)據(jù),只有被充分組織、管理和利用才能發(fā)揮其真正的價值。在傳統(tǒng)的網(wǎng)絡(luò)環(huán)境下,信息資源的組織方式一般分為四種方式:即文件方式、數(shù)據(jù)庫方式、主題樹方式、超媒體方式。而文件方式本身可看作信息單元,需要作為對象來管理,所以很難在網(wǎng)絡(luò)信息載體中廣泛被使用,但運(yùn)用云計(jì)算,用戶數(shù)據(jù)都存儲于服務(wù)器中,軟硬件服務(wù)也都由云提供,這樣對于存儲于網(wǎng)絡(luò)中的用戶個人數(shù)據(jù),或部分用戶數(shù)據(jù),使用這種簡單方便的存儲非結(jié)構(gòu)化信息的天然單位的文件方式存儲數(shù)據(jù),是最優(yōu)的解決方案。這也會帶動目前普遍的數(shù)據(jù)庫方式改革以克服其不能提供數(shù)據(jù)信息之間的知識關(guān)聯(lián)和對用戶和數(shù)據(jù)庫服務(wù)端要求較高的缺點(diǎn)。 2、實(shí)現(xiàn)基于云計(jì)算的知識產(chǎn)權(quán)檢索、分析的系統(tǒng)布署。 由于用戶的信息需求千差萬別,并且隨時間的變化而動態(tài)變化,向用戶提供滿意的知識產(chǎn)權(quán)信息服務(wù)是很不容易的。為此,在信息服務(wù)活動中需要遵循針對性原則、及時性原則、易用性原則一、成本效益原則。對于云計(jì)算來說,深層次信息服務(wù)也是其最終目的。在云環(huán)境下,需要基于工程文獻(xiàn)基礎(chǔ)數(shù)據(jù),綜合云的特征,高效開展集成檢索、定題服務(wù)、情報分析、決策參考等深度服務(wù)。 著名的穆爾斯(Mooers )定律: 一個情報檢索系統(tǒng)如果對用戶來說,取得情報比不取得情報更傷腦筋和麻煩的話,用戶就會傾向于不使用該系統(tǒng)。Dialog 信息檢索服務(wù)的名譽(yù)主席Roger K. Summit 則以另一種方式對此進(jìn)行了表述:“穆爾斯定律告訴我們信息的使用與獲得信息的容易程度成正比。”信息用戶總是希望信息系統(tǒng)越便于使用越好,越是簡便易用的信息系統(tǒng),用戶使用的頻率也越高。反之,則很少有用戶去使用。云服務(wù)由于整合了大量的一手的用戶的數(shù)據(jù)和信息,使得用戶通過非正規(guī)渠道查找所需要的信息比以往更加便利。 檢索系統(tǒng)的好壞、使用是否方便,不僅要看系統(tǒng)本身能否實(shí)現(xiàn)用戶的預(yù)期目的,另一個關(guān)鍵在于系統(tǒng)的硬件部署是否可以滿足大數(shù)據(jù)量訪問的要求。 基于云計(jì)算的知識產(chǎn)權(quán)檢索、分析系統(tǒng),其優(yōu)越在于: (1)更低成本 傳統(tǒng)的存儲均采用SAN和NAS結(jié)構(gòu),尤其是SAN,硬件設(shè)備相對昂貴的多,而云存儲系統(tǒng)中不僅采用廉價的大容量存儲服務(wù)節(jié)點(diǎn)和網(wǎng)絡(luò)設(shè)備構(gòu)成存儲平臺,而且通過系統(tǒng)軟件實(shí)現(xiàn)統(tǒng)一管理和容錯機(jī)制,就可以提供高效、穩(wěn)定服務(wù),在同樣容量和性能的條件下,可以將系統(tǒng)構(gòu)建成本節(jié)省5-10倍以上,并且規(guī)模越大,價格優(yōu)勢越明顯。 (2)優(yōu)異性能 可以支持高并發(fā)、帶寬飽和利用,數(shù)據(jù)在多個節(jié)點(diǎn)上并行讀寫,服務(wù)器自動均衡負(fù)載,系統(tǒng)性能隨節(jié)點(diǎn)數(shù)增加而線性增長,性能與節(jié)點(diǎn)規(guī)模成正比,沒有性能瓶頸,可提供2GB/s以上的單點(diǎn)訪問性能。 (3)高度可靠 元數(shù)據(jù)服務(wù)器主備雙機(jī)鏡像熱備份,主元數(shù)據(jù)服務(wù)器宕機(jī)后,備元數(shù)據(jù)服務(wù)器能自動接替主元數(shù)據(jù)服務(wù)器工作,且不丟失數(shù)據(jù);操作日志本地持久化保存;塊位置副本信息分布在塊數(shù)據(jù)服務(wù)器上,啟動注冊時生成。元數(shù)據(jù)日志多機(jī)冷備份,防止主備元數(shù)據(jù)服務(wù)器同時損毀的情況;可根據(jù)元數(shù)據(jù)日志恢復(fù)元數(shù)據(jù)。 采用高可靠的冗余編解碼機(jī)制,支持多重數(shù)據(jù)保護(hù),根據(jù)數(shù)據(jù)需求可靈活設(shè)置備份方式(如8+2方式、4+2方式),自動屏蔽故障,提供24×30×365小時不間斷存儲服務(wù);任意節(jié)點(diǎn)出現(xiàn)故障,系統(tǒng)將會自動根據(jù)節(jié)點(diǎn)情況,依據(jù)編解碼方案恢復(fù)原數(shù)據(jù)。這樣,在節(jié)點(diǎn)發(fā)生故障的情況下,也可以實(shí)現(xiàn)數(shù)據(jù)的無間斷服務(wù)。 (4)無限容量 可支撐的容量接近無限,理論容量為1024×1024×1024 PB (1G個PB容量); (5)在線伸縮 在不停止服務(wù)的情況下,根據(jù)存儲容量的需求,動態(tài)加入新的存儲節(jié)點(diǎn),無需任何操作,即實(shí)現(xiàn)系統(tǒng)容量從TB級平滑擴(kuò)展到PB級,能夠根據(jù)客戶端的數(shù)目動態(tài)的提高存儲系統(tǒng)的訪問性能要求。 國內(nèi)已有企業(yè)研究出了完美實(shí)現(xiàn)以上所有性能的超低功耗PB云存儲系統(tǒng),不僅使系統(tǒng)超高密度和超低功耗得到優(yōu)化,而且采用了冗余備份機(jī)制,保障用戶數(shù)據(jù)的安全可靠性,更智能便捷的使用模式將極大程度的滿足用戶的數(shù)據(jù)訪問、存儲、處理要求,恰恰滿足知識產(chǎn)權(quán)信息利用的大數(shù)據(jù)處理要求。 云計(jì)算作為新興產(chǎn)業(yè)浪潮的重要驅(qū)動力,必將在發(fā)展進(jìn)程中對我國經(jīng)濟(jì)和社會產(chǎn)業(yè)廣泛深遠(yuǎn)的影響。通過高效處理海量數(shù)據(jù)的機(jī)制,推動中國信息化建設(shè)進(jìn)程,提高資源利用率,減少人力資源浪費(fèi)和能源功耗;谠朴(jì)算的知識產(chǎn)權(quán)信息服務(wù)的研究,將打破長期以來依賴國外專利技術(shù)系統(tǒng)的局面,為實(shí)現(xiàn)專利檢索和分析系統(tǒng)的自主建設(shè)和自主發(fā)展,提供更廣闊的思路和發(fā)展空間。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |