破譯垃圾郵件“變臉”密碼完美解決方案 |
發(fā)布時(shí)間: 2012/8/10 15:23:01 |
不道德的電子郵件發(fā)送者可以不費(fèi)多大成本或根本不費(fèi)成本地分發(fā)大量消息,而正常用戶卻被迫花費(fèi)一些時(shí)間和精力從他們的郵箱中清除這些欺詐性的或不需要的郵件。本文描述了幾種方法,這些方法可用計(jì)算機(jī)代碼消除不請自來的商業(yè)性電子郵件、病毒,包括特洛伊木馬、蠕蟲病毒、懷有惡意欺詐性的電子郵件,以及其它一些不希望收到的、令人煩惱的電子郵件。在某種意義上,消除垃圾郵件最好的終極解決方案是通過立法來制止。然而,在此期間,即在法律的進(jìn)步(如果有過的話)還未解決公眾不斷所受到的困擾之前,可以用代碼開發(fā)一些工具作為過渡性的解決方案來處理這類問題。 從技術(shù)角度考慮 — 但也是常識 — 我們所說的“垃圾郵件”的含義通常比“不請自來的商業(yè)性電子郵件”的范疇要廣;垃圾郵件包含了所有我們不需要的以及沒有明確表明要發(fā)送給我們的電子郵件。這樣的消息其本身并不總是具有商業(yè)性,而對于有些消息,很難說是我們所需要的。例如,我們不想感染上病毒(即使來自不謹(jǐn)慎的朋友);通常也不想收到連鎖電子郵件(chain letter),即使這些郵件不是來要錢的;既不想收到來自陌生人的誘勸性的消息;也不想收到完全是欺騙性的郵件。在任何一種情況中,都能很清楚地確定郵件是否為垃圾郵件,許許多多人都曾收到過這樣的郵件。垃圾郵件的問題是,它會將正常的電子郵件淹沒。 垃圾郵件“變臉術(shù)” 隨著垃圾郵件的日益泛濫成災(zāi)、市場上也出現(xiàn)很多基于關(guān)鍵字過濾的反垃圾郵件產(chǎn)品。而垃圾郵件的發(fā)送者為了提高垃圾郵件的到達(dá)率和回饋率(這是垃圾郵件制造者的最終目的),針對關(guān)鍵字過濾技術(shù),也不斷開發(fā)出新的垃圾郵件生成技術(shù)。 在目前絕大多數(shù)的垃圾郵件中,我們都可以看到使用HTML格式,使垃圾郵件中包含了很多顏色、字體、圖片以及網(wǎng)頁連接。通過使用HTML格式,垃圾郵件制造者能夠使用很多的HTML技術(shù),使得基于關(guān)鍵字的過濾技術(shù)無法成功地過濾垃圾郵件。一個(gè)很簡單的例子是“Free"這個(gè)英文單詞在HTML里就可以用下面三種表示方式: Free Fr ee Free 這樣,在Outlook,F(xiàn)oxmail等郵件客戶端上,顯示出來的還是“Free”這個(gè)詞。而對于單純基于關(guān)鍵字的過濾方法,則無法識別出“Free”這個(gè)關(guān)鍵字了。針對這樣的現(xiàn)象,一些基于關(guān)鍵字的過濾方法也作了相應(yīng)改進(jìn),如把注釋語句去掉(針對第一種情況)、做ASCII碼轉(zhuǎn)換(針對第二種情況)等等。在這種情況下,垃圾郵件制造者也進(jìn)一步把他們的技術(shù)升級,使用了更加狡猾的HTML隱藏手段。如果我們把使用單純的推銷詞匯稱為第一代垃圾郵件技術(shù),簡單的間隔(如F*R*E*E)稱為第二代垃圾郵件技術(shù),上面這些HTML方法稱為第三代垃圾郵件技術(shù),那么現(xiàn)在垃圾郵件制造者使用的一些方法就可以稱為第四代技術(shù)了。下面,我們介紹一些我們觀察和總結(jié)到的第三、四代垃圾郵件技術(shù)。 * 黑洞技術(shù) 黑洞技術(shù)就是在垃圾郵件關(guān)鍵字的中間加上空格或其他間隔性的字符。如果單純的空格,那相對應(yīng)的過濾技術(shù)就很簡單。因此,垃圾郵件制造者便開始使用HTML里的 ,代表空格。同時(shí),HTML還提供了另外一種工具,那就是使用來注釋 ,這樣在郵件客戶端里,就不會對間隔的詞造成任何影響。比如,Viagra這個(gè)詞就可以用下面方法來表示: V i a g r a 當(dāng)然,這樣的代價(jià)是原來一個(gè)6字節(jié)的詞變成了136字節(jié),垃圾郵件所發(fā)送的時(shí)間會更長。但是,因?yàn)槭褂昧诉@樣的技術(shù),使得原來很多用“Viagra"作為關(guān)鍵字過濾垃圾郵件的方法失效了。 * 數(shù)字游戲 數(shù)字游戲是指用數(shù)字來代替字母的垃圾郵件技術(shù)。因?yàn)镠TML設(shè)計(jì)時(shí)的全球化考慮,因此在HTML里可以用字母的數(shù)字編碼來代替字母,如字母“A"可以用A來表示。中文字也可以用相對應(yīng)的GB碼來表示。這樣,在HTML里,象“Viagra"就可以這樣表示: Vsagra 這樣一些簡單的垃圾郵件過濾工具無法過濾此類郵件,盡管智能一些的工具會進(jìn)行相關(guān)的處理,進(jìn)行編碼的解碼,而垃圾郵件制造者也會將“數(shù)字游戲”和“黑洞技術(shù)”相結(jié)合,使其推銷的關(guān)鍵字仍舊不會被發(fā)現(xiàn)。 * 隱形墨水 有的時(shí)候,垃圾郵件制造者為了隱藏其郵件的真正目的,會希望在其郵件里混雜一些與其推銷產(chǎn)品無關(guān)的內(nèi)容。因?yàn)閷τ诶]件過濾工具而言,非常需要注意的一點(diǎn)就是要盡量減少過濾掉非垃圾郵件的幾率。垃圾郵件制造者正是利用這一點(diǎn),在其垃圾郵件中加入看上去屬正規(guī)郵件的內(nèi)容,而同時(shí)卻不希望這些內(nèi)容被郵件的閱讀者看到。于是垃圾郵件制造者會使用“隱形墨水”技術(shù)。 最常用的“隱形墨水”技術(shù)是使用背景色來隱藏那些與產(chǎn)品無關(guān)的內(nèi)容。在HTML里,使用就可以將內(nèi)容變成白色。這樣郵件閱讀者就不會看到這些內(nèi)容,而垃圾郵件過濾工具就會碰到這些內(nèi)容了,例如下面這段: 激情電影 張經(jīng)理,你好!請發(fā)給我你們機(jī)床產(chǎn)品的報(bào)價(jià)單。 多謝!小李 而對于垃圾郵件制造者,他們會更進(jìn)一步把“隱形墨水”和上面兩項(xiàng)技術(shù)結(jié)合在一起,這樣就讓垃圾郵件過濾工具更加難以辨認(rèn)。 * “鍘刀錯(cuò)位"技術(shù) 使用HTML Table技術(shù),垃圾郵件制造者能夠?qū)⒁恍┰~變成豎立的單字組合,使過濾工具根本無法辨認(rèn)。比如一個(gè)垃圾郵件里需要下面這幾個(gè)英文單詞: Viagra Samples FREE 通過“鍘刀錯(cuò)位”技術(shù),可以把它們變成以下7個(gè)豎狀的單字組合。 在一個(gè)支持HTML的郵件客戶端軟件里,顯示出來是這樣的: 而一個(gè)智能的關(guān)鍵字過濾工具(能夠把HTML格式去掉)看到的則是VsF, iaR, amE, gpE, rl, ae, s這幾個(gè)字,那肯定無法將它過濾掉。 通過以上的分析我們可以看出,現(xiàn)在垃圾郵件制造技術(shù)已經(jīng)發(fā)展到很復(fù)雜的程度。在這種情況下,普通的依靠關(guān)鍵字過濾的技術(shù),或者單純的“智能學(xué)習(xí)”技術(shù)已經(jīng)無法有效地過濾這樣的垃圾郵件。 多種“破譯”過濾術(shù) 利用基本的默認(rèn)規(guī)則及過程,卓爾InfoGate通過不同的檢測方法對用戶收到的每一封電子郵件進(jìn)行檢查。 * “特征檢測”技術(shù) 任何事物都有兩面性,垃圾郵件制造者使用各種各樣的手段躲避過濾工具,但同時(shí)也把自己給暴露出來了,因?yàn)橐粋(gè)正常郵件是不會使用列舉一類的技巧的。根據(jù)這一判斷,卓爾InfoGate產(chǎn)品使用了特有的“特征檢測”技術(shù),以其人之道還制其人之身,根據(jù)垃圾郵件以上躲避過濾的技術(shù)來判斷其垃圾郵件的特性。 卓爾偉業(yè)公司和其在海外的研究機(jī)構(gòu)合作,收集大量在網(wǎng)上流行的垃圾郵件,根據(jù)垃圾郵件制造者不斷變化的技術(shù),總結(jié)出相關(guān)的特征庫,能夠?qū)Σ捎孟嚓P(guān)技術(shù)的垃圾郵件進(jìn)行高效率的過濾。 * “智能學(xué)習(xí)”技術(shù) 卓爾InfoGate反垃圾郵件技術(shù)采用貝葉斯信息分類理論對垃圾郵件以及非垃圾郵件進(jìn)行有效的分類。通過對垃圾郵件以及非垃圾郵件的預(yù)先分類學(xué)習(xí),卓爾InfoGate反垃圾郵件技術(shù)能夠?qū)]件的用詞以及非垃圾郵件的用詞形成一個(gè)概率分布。然后對于掃描的郵件根據(jù)其用詞的概率分布來判斷其是否為垃圾郵件。 * 完整性分析 卓爾InfoGate對每一封郵件的郵件頭、版面和組織進(jìn)行檢查,以識別垃圾郵件的一般特征。 在單次傳遞過程中,高級模式匹配引擎同時(shí)應(yīng)用數(shù)百個(gè)算法,然后確定其可能得分以判斷該郵件是否為垃圾郵件。 這種用于檢測垃圾郵件的方法非常準(zhǔn)確。 * 前瞻性檢測 前瞻性檢測通過一系列內(nèi)部測試來判斷某個(gè)郵件是垃圾郵件的可能性,每一個(gè)測試都有相應(yīng)的分值,以便降低錯(cuò)誤率。強(qiáng)大的前瞻性檢測功能確保卓爾InfoGate能夠前瞻性地工作,以保護(hù)您的環(huán)境免受垃圾郵件的威脅。 * 內(nèi)容過濾 該功能可以用來識別電子郵件中的關(guān)鍵字或關(guān)鍵短語,從而判斷其是否為垃圾郵件。 管理員可以輸入字或短語來創(chuàng)建被禁止內(nèi)容的列表。 * 黑名單和優(yōu)先名單支持 管理員定義的黑名單會攔截住管理員認(rèn)為是垃圾郵件發(fā)件人所發(fā)送的電子郵件,而管理員定義的優(yōu)先名單則允許管理員指定域中的電子郵件的通過。 通過以上專門針對第四代垃圾郵件“變臉”招術(shù)的“破譯”過濾辦法,卓爾InfoGate防垃圾郵件模塊為各類型企業(yè)的垃圾郵件防范與過濾提供了性能優(yōu)異的解決方案。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |