4.2.2 其他字符集

除了Unicode之外,还存在很多其他的编码字符集。如前面提到过的使用7位的包含128个字符的ASCII编码。ASCII编码主要是为英语环境而开发的。另外一个常见的字符集是ISO 8859-1,这个字符集中主要包含了绝大部分的西欧语言中的字符。ISO 8859其实是一个包含了16个部分的字符编码规范,其中以第一部分,即ISO 8859-1最为常用。字符集ISO 8859-1也是通过HTTP协议获取到的文本类型的文档的默认编码格式。在中文编码方面,最常见的是GB2312、GBK和GB18030这三种字符集,其中GB2312是最早的国家规范,而GBK在GB2312的基础上进行了扩展,GB18030则是最新的国家规范。