认识编码
身为炎黄子孙﹐自然少不了要使用中文吧。然而,电脑上最常使用的ASCII编码﹐却只适合于英文系统。如果要电脑能显示中文(或其它国的文字)﹐那么就要给电脑制度另一种编码才行。
在前面讲述怎么计算数据容量的时候﹐我们已经知道电脑数据的最小单位是bit﹐但一个bit只有两种变化(要么是0要么是1)﹐实在表达不出什么意思。然后我将8个bit组成一个byte(字节)﹐那么就有28 = 256种变化了﹐每个组合也就可以代表各自不同的意思了。
利用这个byte﹐ASCII码早在1960年代被开发的时候﹐就制定了128组文字和符号﹔而后IBM又再扩充到256组。其中分为四大类﹕
ASCII编号 | 定义 |
0 至 31 | 特殊的控制字元 |
32 至 127 | 文数字数据 |
128 至 159 | 其它欧洲的字元 |
160 至 256 | 绘图字元 |
然而﹐在中文环境中,日常使用的中文字约有2000多个﹐较完整的中文字库也有一万多字﹐256种变化肯定不够。所以中文字要使用两个byte(双字节)来表示一个字﹐那么就有216 = 65536种变化了。
这些变化归根结底都是以0和1的组合﹐那么我们用不同的组合就可以建立起不同的文字对应﹐这个数据就是字库了。透过字库找出来的字通常会以“点阵”的形式显示出来﹐即每一笔每一划都是用相连一起的点组成。要显示中文最少要有16x15点的排列空间﹐当然分辨率越高越好看啦。不过﹐如果将这些点阵字按既定比例放大的话﹐您会发现其边边都很难看﹐都是一些锯齿。所以漂亮的中文字都会使用“真实字体”(Ture Type Font)来表示﹐使用TTF的字体﹐无论如何放大或缩小﹐字形都会保持不变的﹐但所需要的储存空间也当然比点阵字要大。
如果您想有更多的中文字形选择﹐比如颜体、棣书、魏碑、等等﹐那么您就必须为系统安装字形才可以使用。
中文的内码
中文字体除了在字形的不同﹐很多人都知道还有繁体和简体之分吧﹐它们使用的内码也各有一套。现在最流行的中文内码有两种﹕一种是中国大陆使用的GB码﹐另一种是在台湾使用的BIG 5码。因此GB多为简体字所采用﹐而BIG5多为繁体字采用﹐但其实它们都有各自的繁体字和简体字的。然而﹐无论是使用繁体还是简体﹐只能使用有相同的内码才会被正确的显示出来﹐否则只会是一堆乱七八糟的文字组合。
有时候您接到海外朋友寄来的email﹐打开一看全是乱码﹐就很可能是编写者使用了一种内码﹐而阅读者使用了另一内码所至。尤其是那些外挂在英文系统上面的中文软件﹐常会造成这样那样的内码问题。不过﹐如果您有一套聪明的中文软件﹐大都有自动选码功能﹐这样您就无需为内码错误头痛了。或许有朋友用过南极星的NJStar Communicator(有试用版可以下载),它实在是个不错的中文软件﹐若您同时要看BG码和BIG5码的网页就最为合适了。它还有一个好处是:除了显示繁简体,还可以用来进行中文输入呢。
输入法
提到中文输入就是个头痛的问题﹐因为其输入不像英文输入那样简单。英文输入只要看着键盘找到相应的按键就可以输入了﹐但中文输入却非要再学习不可。而且输入法则也琳琅满目﹐各行一套。比较专业的中文输入员都懂得诸如仓颉输或五笔等输入法﹐不过都要经过比较长时间的学习才容易掌握。一般会注音或拼音的朋友﹐则会选择注音或拼音输入法﹐因为其拼字规则在学校里面已经学过了﹐不像仓颉等要重新学习过。现在还好像有什么大易﹑无虾米等输入法﹐不一而足…
然而哪种输入法比较适合自己也是因人而异啦﹐而且一旦学会了一种﹐除非是谋生所需﹐也比较难(懒)去改学别的输入法。而且不同的输入法在不同的场合里面也有不同的优点﹐比如注音(拼音)输入法比较适合“边想边输入”﹐如在聊天或写email等简单用途。但是如果要边看边写﹐比如抄写﹐或需要大量的文字输入﹐仓颉(五笔)输入法则很明显是最理解的﹐其错字率也比较低。无论采用哪种输入法﹐熟悉程度是影响输入速度的非常重要因素。
现在有一种手写板的玩意﹐对一些不会输入法的使用者来说﹐确实提供了一个方便之门。然而如果您学会了任何一种键盘输入法的话﹐您就会觉得手写输入其实是最慢的。^_^
2013-2024 LifeAdd生活方式 www.lifeadd.cn 版权所有 | 御融(北京)科技有限公司 All Rights
Reserved
增值电信业务经营许可证:京B2-20200664 | 京ICP备14004911号-7