在国内外大中型数据库管理系统中,把 ORACLE 作为数据库管理平台的用户比较多。
ORACLE 不论是数据库管理能力还是安全性都是无可非议的,但是,它在汉字信息的显示方面着实给中国用户带来不少麻烦,笔者多年从事 ORACLE 数据库管理,经常收到周围用户和外地用户反映有关 ORACLE 数据库汉字显示问题的求援信,主要现象是把汉字显示为不可识别的乱码,造成原来大量信息无法使用。本文将就这一问题产生的原因和解决办法进行一些探讨,供存在这方面问题的用户朋友参考。
1 、原因分析
通过对用户反映情况的分析,发现字符集的设置不当是影响 ORACLE 数据库汉字显示的关键问题。那么字符集是怎么一会事呢?字符集是 ORACLE 为适应不同语言文字显示而设定的。用于汉字显示的字符集主要有 ZHS16CGB231280 , US7ASCII , WE8ISO8859P1 等。字符集不仅需在服务器端存在,而且客户端也必须有字符集注册。服务器端,字符集是在安装 ORACLE 时指定的,字符集登记信息存储在 ORACLE 数据库字典的 V$NLS_PARAMETERS 表中;客户端,字符集分两种情况,一种情况是 sql*net 2.0 以下版本,字符集是在 windows 的系统目录下的 oracle.ini 文件中登记的;另一种情况是 sql*net 2.0 以上(即 32 位)版本,字符集是在 windows 的系统注册表中登记的。要在客户端正确显示 ORACLE 数据库汉字信息,首先必须使服务器端的字符集与客户端的字符集一致;其次是加载到 ORACLE 数据库的数据字符集必须与服务器指定字符集一致。因此,把用户存在的问题归纳分类,产生汉字显示异常的原因大致有以下几种:
1. 1 服务器指定字符集与客户字符集不同,而与加载数据字符集一致。
这种情况是最常见的,只要把客户端的字符集设置正确即可,解决办法见 2.1 。
1. 2 服务器指定字符集与客户字符集相同 , 与加载数据字符集不一致。
这类问题一般发生在 ORACLE 版本升级或重新安装系统时选择了与原来服务器端不同的字符集,而恢复加载的备份数据仍是按原字符集卸出的场合 , 以及加载从其它使用不同字符集的 ORACLE 数据库卸出的数据的情况。这两种情况中,不管服务器端和客户端字符集是否一致都无法显示汉字。解决办法见 2.2 。
(本文来源于图老师网站,更多请访问http://m.tulaoshi.com/bianchengyuyan/)1.3 服务器指定字符集与客户字符集不同 , 与输入数据字符集不一致。
这种情况是在客户端与服务器端字符集不一致时,从客户端输入了汉字信息。输入的这些信息即便是把客户端字符集更改正确,也无法显示汉字。解决办法见 2.3 。
2 .解决办法
下面将分别对上述三种情况给出解决办法。为了叙述方便,假设客户端使用 WINDOWS95/98 环境,并已成功地配置了 TCP/IP 协议,安装了 ORACLE 的 sql*net , sql*pluse 产品。
2.1 设置客户端字符集与服务器端字符集一致
假设当前服务器端使用 US7ASCII 字符集。
( 1 )查看服务器端字符集
通过客户端或服务器端的 sql*plus 登录 ORACLE 的一个合法用户,执行下列 SQL 语句:
SQL select * from V$NLS_PARAMETERS
parameter value
NLS_LANGUAGE AMERICAN
NLS_TERRITORY AMERICA
. .
NLS_CHARACTERSET US7ASCII
NLS_SORT BINARY
NLS_NCHAR_CHARACTERSET US7ASCII
从上述列表信息中可看出服务器端 ORACLE 数据库的字符集为 'US7ASCII' 。
( 2 )按照服务器端字符集对客户端进行配置
配置方法有两种:
安装 ORACLE 的客户端软件时指定
在安装 ORACLE 的客户端产品软件时,选择与 ORACLE 服务端一致的字符集(本例为 US7ASCII )即可。
修改注册信息的方法
根据 ORACLE 客户端所选 sql*net 的版本分为下列两种情况:
a. 客户端为 sql*net 2.0 以下版本
进入 Windows 的系统目录,编辑 oracle.ini 文件,用 US7ASCII 替换原字符集,重新启动计算机,设置生效。
b. 客户端为 sql*net 2.0 以上版本
在 WIN98 下 运 行 REGEDIT, 第一步选 HKEY_LOCAL_MACHINE, 第二步选择 SOFTWARE , 第三步选择 ORACLE , 第四步选择 NLS_LANG , 键 入 与服 务 器 端 相 同 的 字 符 集(本例为: AMERICAN_AMERICAN.US7ASCII )。
2.2 强制加载数据字符集与服务器端字符集一致
(本文来源于图老师网站,更多请访问http://m.tulaoshi.com/bianchengyuyan/)假设要加载数据从原 ORACLE 数据库卸出时的字符集为 US7ASCII ,当前 ORACLE 服务器字符集为 WE8ISO8859P1 。
下面提供三种解决方法:
( 1 ) 服务器端重新安装 ORACLE
在重新安装 ORACLE 时选择与原卸出数据一致的字符集(本例为 US7ASCII )。
加载原卸出的数据。
这种情况仅仅使用于空库和具有同一种字符集的数据。
( 2 )强行修改服务器端 ORACLE 当前字符集
在用 imp 命令加载数据前,先在客户端用 sql*plus 登录 system DBA 用户,执行下列 SQL 语句进行当前 ORACLE 数据库字符集修改:
SQL create database character set US7ASCII
* create database character set US7ASCII
ERROR at line 1:
ORA-01031: insufficient privileges
你会发现语句执行过程中,出现上述错误提示信息,此时不用理会,实际上 ORACLE 数据库的字符集已被强行修改为 US7ASCII ,接着用 imp 命令装载数据。等数据装载完成以后, shutdown 数据库,再 startup 数据库,用合法用户登录 ORACLE 数据库,在 sql 命令提示符下,运行 select * from V$NLS_PARAMETERS ,可以看到 ORACLE 数据库字符集已复原,这时再查看有汉字字符数据的表时,汉字已能被正确显示。
( 3 )利用数据格式转储,避开字符集限制
这种方法主要用于加载外来 ORACLE 数据库的不同字符集数据。其方法如下:
先将数据加载到具有相同字符集的服务器上,然后用转换工具卸出为 foxbase 格式或 access 格式数据库,再用转换工具转入到不同字符集的 ORACLE 数据库中,这样就避免了 ORACLE 字符集的困扰。目前数据库格式转换的工具很多 , 象 power builder5.0 以上版本提供的 pipeline , Microsoft Access 数据库提供的数据导入 / 导出功能等。转换方法参见有关资料说明。 .
2.3 匹配字符集替换汉字
对于 1.3 提到的情况,没有很好的办法,只能先把客户端与服务器端字符集匹配一致后,根据原输入汉字的特征码替换汉字字符部分。