淺析NAS存儲(chǔ)中的字符編碼 |
發(fā)布時(shí)間: 2012/6/24 9:33:36 |
這要從字符編碼的概念開始說(shuō)起: 字符(character):顧名思義,字符是文字與符號(hào)的總稱。英文字母,漢字和數(shù)學(xué)符號(hào)等都是字符。 編碼(encoding):計(jì)算機(jī)只能先將字符用二進(jìn)制碼來(lái)表示,然后再進(jìn)行處理或者存儲(chǔ)。把字符和2進(jìn)制碼對(duì)應(yīng)起來(lái)就叫編碼。比如字母A的編碼就是1000001. 最早給字符編碼的是美國(guó)人,他們的編碼方案叫做ASCII.那時(shí)候計(jì)算機(jī)還是稀罕物,也沒(méi)人想到有一天它會(huì)在全球普及。所以ASCII編碼只包含了拉丁字母和符號(hào),加起來(lái)也就100多個(gè),用一個(gè)字節(jié)來(lái)編碼就足夠了(英文國(guó)家是不是文盲率很低?學(xué)好字母就差不多識(shí)字了)。 沒(méi)想到計(jì)算機(jī)普及得太快了。各國(guó)人民在學(xué)會(huì)說(shuō)英文之前,已經(jīng)先學(xué)會(huì)使用電腦。所以很多非英文國(guó)家為自己的文字制定了符合ANSI(美國(guó)國(guó)家標(biāo)準(zhǔn)協(xié)會(huì))標(biāo)準(zhǔn)的編碼,比如中國(guó)的GB2312和日本的JIT.ANSI標(biāo)準(zhǔn)保留了所有ASCII編碼,所以無(wú)論是GB2312,JIT還是其他國(guó)家的ANSI編碼都支持拉丁字母。中文字符比拉丁字母多太多了,一個(gè)字節(jié)表示不完,所以GB2312用兩個(gè)字節(jié)表示一個(gè)漢字。 本文出自:億恩科技【mszdt.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |