破譯垃圾郵件“變臉”密碼完美解決方案 |
發(fā)布時(shí)間: 2012/9/9 16:51:56 |
不道德的電子郵件發(fā)送者可以不費(fèi)多大成本或根本不費(fèi)成本地分發(fā)大量消息,而正常用戶(hù)卻被迫花費(fèi)一些時(shí)間和精力從他們的郵箱中清除這些欺詐性的或不需要的郵件。本文描述了幾種方法,這些方法可用計(jì)算機(jī)代碼消除不請(qǐng)自來(lái)的商業(yè)性電子郵件、病毒,包括特洛伊木馬、蠕蟲(chóng)病毒、懷有惡意欺詐性的電子郵件,以及其它一些不希望收到的、令人煩惱的電子郵件。在某種意義上,消除垃圾郵件最好的終極解決方案是通過(guò)立法來(lái)制止。然而,在此期間,即在法律的進(jìn)步(如果有過(guò)的話(huà))還未解決公眾不斷所受到的困擾之前,可以用代碼開(kāi)發(fā)一些工具作為過(guò)渡性的解決方案來(lái)處理這類(lèi)問(wèn)題。 從技術(shù)角度考慮 — 但也是常識(shí) — 我們所說(shuō)的“垃圾郵件”的含義通常比“不請(qǐng)自來(lái)的商業(yè)性電子郵件”的范疇要廣;垃圾郵件包含了所有我們不需要的以及沒(méi)有明確表明要發(fā)送給我們的電子郵件。這樣的消息其本身并不總是具有商業(yè)性,而對(duì)于有些消息,很難說(shuō)是我們所需要的。例如,我們不想感染上病毒(即使來(lái)自不謹(jǐn)慎的朋友);通常也不想收到連鎖電子郵件(chain letter),即使這些郵件不是來(lái)要錢(qián)的;既不想收到來(lái)自陌生人的誘勸性的消息;也不想收到完全是欺騙性的郵件。在任何一種情況中,都能很清楚地確定郵件是否為垃圾郵件,許許多多人都曾收到過(guò)這樣的郵件。垃圾郵件的問(wèn)題是,它會(huì)將正常的電子郵件淹沒(méi)。 垃圾郵件“變臉術(shù)” 隨著垃圾郵件的日益泛濫成災(zāi)、市場(chǎng)上也出現(xiàn)很多基于關(guān)鍵字過(guò)濾的反垃圾郵件產(chǎn)品。而垃圾郵件的發(fā)送者為了提高垃圾郵件的到達(dá)率和回饋率(這是垃圾郵件制造者的最終目的),針對(duì)關(guān)鍵字過(guò)濾技術(shù),也不斷開(kāi)發(fā)出新的垃圾郵件生成技術(shù)。 在目前絕大多數(shù)的垃圾郵件中,我們都可以看到使用HTML格式,使垃圾郵件中包含了很多顏色、字體、圖片以及網(wǎng)頁(yè)連接。通過(guò)使用HTML格式,垃圾郵件制造者能夠使用很多的HTML技術(shù),使得基于關(guān)鍵字的過(guò)濾技術(shù)無(wú)法成功地過(guò)濾垃圾郵件。一個(gè)很簡(jiǎn)單的例子是“Free"這個(gè)英文單詞在HTML里就可以用下面三種表示方式: Free Fr ee Free 這樣,在Outlook,F(xiàn)oxmail等郵件客戶(hù)端上,顯示出來(lái)的還是“Free”這個(gè)詞。而對(duì)于單純基于關(guān)鍵字的過(guò)濾方法,則無(wú)法識(shí)別出“Free”這個(gè)關(guān)鍵字了。針對(duì)這樣的現(xiàn)象,一些基于關(guān)鍵字的過(guò)濾方法也作了相應(yīng)改進(jìn),如把注釋語(yǔ)句去掉(針對(duì)第一種情況)、做ASCII碼轉(zhuǎn)換(針對(duì)第二種情況)等等。在這種情況下,垃圾郵件制造者也進(jìn)一步把他們的技術(shù)升級(jí),使用了更加狡猾的HTML隱藏手段。如果我們把使用單純的推銷(xiāo)詞匯稱(chēng)為第一代垃圾郵件技術(shù),簡(jiǎn)單的間隔(如F*R*E*E)稱(chēng)為第二代垃圾郵件技術(shù),上面這些HTML方法稱(chēng)為第三代垃圾郵件技術(shù),那么現(xiàn)在垃圾郵件制造者使用的一些方法就可以稱(chēng)為第四代技術(shù)了。下面,我們介紹一些我們觀察和總結(jié)到的第三、四代垃圾郵件技術(shù)。 * 黑洞技術(shù) 黑洞技術(shù)就是在垃圾郵件關(guān)鍵字的中間加上空格或其他間隔性的字符。如果單純的空格,那相對(duì)應(yīng)的過(guò)濾技術(shù)就很簡(jiǎn)單。因此,垃圾郵件制造者便開(kāi)始使用HTML里的 ,代表空格。同時(shí),HTML還提供了另外一種工具,那就是使用來(lái)注釋 ,這樣在郵件客戶(hù)端里,就不會(huì)對(duì)間隔的詞造成任何影響。比如,Viagra這個(gè)詞就可以用下面方法來(lái)表示: V i a g r a 當(dāng)然,這樣的代價(jià)是原來(lái)一個(gè)6字節(jié)的詞變成了136字節(jié),垃圾郵件所發(fā)送的時(shí)間會(huì)更長(zhǎng)。但是,因?yàn)槭褂昧诉@樣的技術(shù),使得原來(lái)很多用“Viagra"作為關(guān)鍵字過(guò)濾垃圾郵件的方法失效了。 * 數(shù)字游戲 數(shù)字游戲是指用數(shù)字來(lái)代替字母的垃圾郵件技術(shù)。因?yàn)镠TML設(shè)計(jì)時(shí)的全球化考慮,因此在HTML里可以用字母的數(shù)字編碼來(lái)代替字母,如字母“A"可以用A來(lái)表示。中文字也可以用相對(duì)應(yīng)的GB碼來(lái)表示。這樣,在HTML里,象“Viagra"就可以這樣表示: Vsagra 這樣一些簡(jiǎn)單的垃圾郵件過(guò)濾工具無(wú)法過(guò)濾此類(lèi)郵件,盡管智能一些的工具會(huì)進(jìn)行相關(guān)的處理,進(jìn)行編碼的解碼,而垃圾郵件制造者也會(huì)將“數(shù)字游戲”和“黑洞技術(shù)”相結(jié)合,使其推銷(xiāo)的關(guān)鍵字仍舊不會(huì)被發(fā)現(xiàn)。 * 隱形墨水 有的時(shí)候,垃圾郵件制造者為了隱藏其郵件的真正目的,會(huì)希望在其郵件里混雜一些與其推銷(xiāo)產(chǎn)品無(wú)關(guān)的內(nèi)容。因?yàn)閷?duì)于垃圾郵件過(guò)濾工具而言,非常需要注意的一點(diǎn)就是要盡量減少過(guò)濾掉非垃圾郵件的幾率。垃圾郵件制造者正是利用這一點(diǎn),在其垃圾郵件中加入看上去屬正規(guī)郵件的內(nèi)容,而同時(shí)卻不希望這些內(nèi)容被郵件的閱讀者看到。于是垃圾郵件制造者會(huì)使用“隱形墨水”技術(shù)。 最常用的“隱形墨水”技術(shù)是使用背景色來(lái)隱藏那些與產(chǎn)品無(wú)關(guān)的內(nèi)容。在HTML里,使用就可以將內(nèi)容變成白色。這樣郵件閱讀者就不會(huì)看到這些內(nèi)容,而垃圾郵件過(guò)濾工具就會(huì)碰到這些內(nèi)容了,例如下面這段: 激情電影 張經(jīng)理,你好!請(qǐng)發(fā)給我你們機(jī)床產(chǎn)品的報(bào)價(jià)單。 多謝!小李 而對(duì)于垃圾郵件制造者,他們會(huì)更進(jìn)一步把“隱形墨水”和上面兩項(xiàng)技術(shù)結(jié)合在一起,這樣就讓垃圾郵件過(guò)濾工具更加難以辨認(rèn)。 * “鍘刀錯(cuò)位"技術(shù) 使用HTML Table技術(shù),垃圾郵件制造者能夠?qū)⒁恍┰~變成豎立的單字組合,使過(guò)濾工具根本無(wú)法辨認(rèn)。比如一個(gè)垃圾郵件里需要下面這幾個(gè)英文單詞: Viagra Samples FREE 通過(guò)“鍘刀錯(cuò)位”技術(shù),可以把它們變成以下7個(gè)豎狀的單字組合。 在一個(gè)支持HTML的郵件客戶(hù)端軟件里,顯示出來(lái)是這樣的: 而一個(gè)智能的關(guān)鍵字過(guò)濾工具(能夠把HTML格式去掉)看到的則是VsF, iaR, amE, gpE, rl, ae, s這幾個(gè)字,那肯定無(wú)法將它過(guò)濾掉。 通過(guò)以上的分析我們可以看出,現(xiàn)在垃圾郵件制造技術(shù)已經(jīng)發(fā)展到很復(fù)雜的程度。在這種情況下,普通的依靠關(guān)鍵字過(guò)濾的技術(shù),或者單純的“智能學(xué)習(xí)”技術(shù)已經(jīng)無(wú)法有效地過(guò)濾這樣的垃圾郵件。 多種“破譯”過(guò)濾術(shù) 利用基本的默認(rèn)規(guī)則及過(guò)程,卓爾InfoGate通過(guò)不同的檢測(cè)方法對(duì)用戶(hù)收到的每一封電子郵件進(jìn)行檢查。 * “特征檢測(cè)”技術(shù) 任何事物都有兩面性,垃圾郵件制造者使用各種各樣的手段躲避過(guò)濾工具,但同時(shí)也把自己給暴露出來(lái)了,因?yàn)橐粋(gè)正常郵件是不會(huì)使用列舉一類(lèi)的技巧的。根據(jù)這一判斷,卓爾InfoGate產(chǎn)品使用了特有的“特征檢測(cè)”技術(shù),以其人之道還制其人之身,根據(jù)垃圾郵件以上躲避過(guò)濾的技術(shù)來(lái)判斷其垃圾郵件的特性。 卓爾偉業(yè)公司和其在海外的研究機(jī)構(gòu)合作,收集大量在網(wǎng)上流行的垃圾郵件,根據(jù)垃圾郵件制造者不斷變化的技術(shù),總結(jié)出相關(guān)的特征庫(kù),能夠?qū)Σ捎孟嚓P(guān)技術(shù)的垃圾郵件進(jìn)行高效率的過(guò)濾。 * “智能學(xué)習(xí)”技術(shù) 卓爾InfoGate反垃圾郵件技術(shù)采用貝葉斯信息分類(lèi)理論對(duì)垃圾郵件以及非垃圾郵件進(jìn)行有效的分類(lèi)。通過(guò)對(duì)垃圾郵件以及非垃圾郵件的預(yù)先分類(lèi)學(xué)習(xí),卓爾InfoGate反垃圾郵件技術(shù)能夠?qū)]件的用詞以及非垃圾郵件的用詞形成一個(gè)概率分布。然后對(duì)于掃描的郵件根據(jù)其用詞的概率分布來(lái)判斷其是否為垃圾郵件。 * 完整性分析 卓爾InfoGate對(duì)每一封郵件的郵件頭、版面和組織進(jìn)行檢查,以識(shí)別垃圾郵件的一般特征。 在單次傳遞過(guò)程中,高級(jí)模式匹配引擎同時(shí)應(yīng)用數(shù)百個(gè)算法,然后確定其可能得分以判斷該郵件是否為垃圾郵件。 這種用于檢測(cè)垃圾郵件的方法非常準(zhǔn)確。 * 前瞻性檢測(cè) 前瞻性檢測(cè)通過(guò)一系列內(nèi)部測(cè)試來(lái)判斷某個(gè)郵件是垃圾郵件的可能性,每一個(gè)測(cè)試都有相應(yīng)的分值,以便降低錯(cuò)誤率。強(qiáng)大的前瞻性檢測(cè)功能確保卓爾InfoGate能夠前瞻性地工作,以保護(hù)您的環(huán)境免受垃圾郵件的威脅。 * 內(nèi)容過(guò)濾 該功能可以用來(lái)識(shí)別電子郵件中的關(guān)鍵字或關(guān)鍵短語(yǔ),從而判斷其是否為垃圾郵件。 管理員可以輸入字或短語(yǔ)來(lái)創(chuàng)建被禁止內(nèi)容的列表。 * 黑名單和優(yōu)先名單支持 管理員定義的黑名單會(huì)攔截住管理員認(rèn)為是垃圾郵件發(fā)件人所發(fā)送的電子郵件,而管理員定義的優(yōu)先名單則允許管理員指定域中的電子郵件的通過(guò)。 通過(guò)以上專(zhuān)門(mén)針對(duì)第四代垃圾郵件“變臉”招術(shù)的“破譯”過(guò)濾辦法,卓爾InfoGate防垃圾郵件模塊為各類(lèi)型企業(yè)的垃圾郵件防范與過(guò)濾提供了性能優(yōu)異的解決方案。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |