很多开源软件都有国际化和本地化的问题,其实国际化本没有那么复杂,只是总有些公司希望通过拒绝国际标准来提高市场占有率,所以也就渐渐导致了现在的情况。很多开源软件首要支持的便是UTF编码,然后才是其他编码。(by gashero)当然也有些不着调的软件首选的是ISO-8859-1编码,甚至是ASCII编码。好了,下面先讲讲编码,因为Tomcat也是一种不着调的软件。
(本文来源于图老师网站,更多请访问http://m.tulaoshi.com/webkaifa/)常见的中文编码有GB2312、GBK、GB18030等等,当然没有包括繁体中文,这些编码都是表示编码,而并非是显示编码。现在越来越多的软件,在其核心使用的显示编码或者说处理编码,是Unicode编码。Unicode编码使用2字节表示了世界上几乎所有的文字符号,作软件的内部国际化处理再适合不过了。
只是有些龌龊公司,为了商业目的,对内核的Unicode编码API全部屏蔽,对外只提供本地化编码。(by gashero)比如M$公司在中文软件上就主推GBK编码。
(本文来源于图老师网站,更多请访问http://m.tulaoshi.com/webkaifa/)还有一个问题就是用C/C++编写的很老的软件,字符串结束标志是'