7BIT壓縮編碼長(zhǎng)度計(jì)算方法(C編程實(shí)現(xiàn)) |
發(fā)布時(shí)間: 2012/8/8 17:28:40 |
大家都知道,ASCII(不包括擴(kuò)展ASCII)的最高位是0,所以,我們可以利用這一空位來(lái)存儲(chǔ)數(shù)據(jù),“7BIT壓縮編碼”就是這么做的。關(guān)于7BIT壓縮編碼的詳細(xì)算法,可以在網(wǎng)上找到(Simple)。這里,我說(shuō)一下自己的一種關(guān)于計(jì)算7BIT編碼長(zhǎng)度的C語(yǔ)言實(shí)現(xiàn)方法。(應(yīng)該有更好的方法啦~)
1。如果給出已經(jīng)7BIT編碼的字符串,在不解碼的情況下,計(jì)算出解碼后的長(zhǎng)度,也就是源碼(ASCII)的長(zhǎng)度。
pSrc -- 已經(jīng)編碼的字符串地址
nSrc -- 通過(guò)函數(shù)strlen(pSrc)計(jì)算出來(lái)的長(zhǎng)度 nLength -- 原編碼的長(zhǎng)度(就是我們想知道的結(jié)果) if (nSrc%7 == 0) { if (*(pSrc+nSrc-1) >> 1) nLength = (nSrc/7)*8; else nLength = (nSrc/7)*8 - 1; } else { if (*(pSrc+nSrc-1) >> (8-nSrc%7)) nLength = (nSrc/7)*8 + nSrc%7 + 1; else nLength = (nSrc/7)*8 + nSrc%7; } 解釋?zhuān)?br />
第一個(gè)判斷編碼后的長(zhǎng)度是不是7的倍數(shù),我們都知道,7BIT壓縮編碼可以將8字節(jié)ASCII壓縮成7字節(jié)。如果編碼后的長(zhǎng)度恰好是7的倍數(shù),那么就“很可能"源碼是8的倍數(shù)長(zhǎng)度。這里只能說(shuō)是“很可能”,因?yàn)?8*n-1 個(gè)ASCII編碼后也會(huì)占用 7*n 個(gè)字節(jié)(也有可能是 7*n-1 字節(jié))。也就是說(shuō),160個(gè)ASCII編碼后為140字節(jié),159個(gè)ASCII編碼后也為140字節(jié)(或者139字節(jié)),那么現(xiàn)在我們知道編碼后是140字節(jié),原編碼ASCII到底是160個(gè),還是159個(gè)呢?
if (*(pSrc+nSrc-1) >> 1) 做出了判斷,如果結(jié)果為真,那么就是 8*n 個(gè)原編碼,如果為假,那么就是 8*n-1 個(gè)原編碼。這里,相信大家稍微思考一下就明白了;)嘻嘻,有不明白的,email問(wèn)我啦~ 如果編碼后的長(zhǎng)度,不是7的倍數(shù),那么對(duì)最后一位的移位判斷稍微復(fù)雜一些,道理是和上面一樣的,只是移位的位數(shù)不一樣而已。計(jì)算長(zhǎng)度的時(shí)候,先取出8位ASCII的整數(shù)倍(nSrc/7)*8,然后再取余數(shù)nSrc%7,然后根據(jù)對(duì)最后一位的移位判斷結(jié)果,判斷到底是否還得加一位。(這是為什么呢?為什么不是和上面7的整數(shù)被時(shí)的減一位呢?哈哈~思考一下就知道了) 2。如果給出原ASCII字符串,在不編碼的情況下,計(jì)算出7BIT編碼后的長(zhǎng)度。
pSrc -- 源ASCII字符串地址
nSrc -- 通過(guò)函數(shù)strlen(pSrc)計(jì)算出來(lái)的長(zhǎng)度 nLength -- 7BIT編碼后的長(zhǎng)度(就是我們想知道的結(jié)果) if (nSrc%8 == 0)
{ nLength = (nSrc/8)*7; } else { if (*(pSrc+nSrc-1) >> nSrc%8-1) nLength = (nSrc/8)*7 + ((nSrc%8)*7)/8 + 1; else nLength = (nSrc/8)*7 + ((nSrc%8)*7)/8; } 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |