(一)二至十进制BCD码
二至十进制BCD码是指每位十进制数用4位二进制数编码表示。选用0000~1001来表示0~9等10个字符。
人们最熟悉的是十进制数,这是一种基数为10的进制,逢10进1。除此之外,人们还用到的有二进制、八进制和十六进制等。在计算机的二进制、八进制、十进制和十六进制,为了区别不同的进位的进制,一般在数字后面加上数制,如:2代表二进制,16代表66十六进制等;也可以用字母表示数制,B(binary)代表二进制,O(Octal)代表八进制,D(Decimal)代表十进制,H(Hexadecimal)代表十六进制。
BCD码也称为二-十进制编码,有压缩和非压缩两种储存形式。压缩的BCD码是用半个字节存放1位十进制数,一个字节存放2位十进制数。例如,十进制58D的压缩BCD码为01011000 B。而非压缩的BCD码则以一个字节存放1位十进制数。例如,十进制6D的非压缩BCD码为00000110 B。BCD码在指令中是常用的一种编码(表2-1)。
表2-1 计算机中常用的几种进位制数的表示
(二)字符编码
字符是计算机中使用最多的信息形式之一,是人与计算机进行通信、交互的重要媒介。计算机要为每个字符指定一个确定的编码,作为识别与使用这些字符的依据。而这些编码的值,又是用一定位数的二进制码进行再编码给出的。使用最多、最普遍的是ASCⅡ字符编码。
(三)汉字编码
用计算机处理汉字时,必须先将汉字代码化,即对汉字进行编码。汉字种类繁多,而用在一个文字处理系统中,输入、内部处理、输出对汉字代码的要求也不尽相同,汉字信息处理系统在处理汉字和词语时,还要进行一系列的汉字代码转换,所以汉字编码要比拼音文字编码困难得多。