Oracle 服务器端客户端字符集设置对应用程序的影响

晨曦之光 发布于 2012/04/25 16:17
阅读 658
收藏 0

在Oracle数据库中如果服务器端客户端字符集设置不当,就会造成保存到数据库的数据不会正常保存,或者数据库里的数据在客户端不能正常显示,出现烂码的现象。

尤其是以SQLPLUS操作的时候,由于SQLPLUS的"bug"(或者叫用户使用不当),会造成一些看起来不’正常‘的烂码现象,下面来解释一下:

1,查看数据库的字符集:

SQL> select * from database_properties where property_name='NLS_CHARACTERSET
PROPERTY_NAME                  PROPERTY_VALUE                 DESCRIPTION
------------------------------ ------------------------------ --------------
NLS_CHARACTERSET               UTF8                           Character set

2,客户端的操作系统环境为中文,在默认的设置下通过sqlplus插入一条数据后提交:

SQL> insert into yorker.test values('中文','SQLPLUS default');

这时候在插入的时候,客户端的字符,比如’中文 ‘是以操作系统的编码方式(比如ZHS16GBK)编码后发送到Oracle服务器端,Oracle在存入数据库的时候转换成

UTF8存储。

3,以默认的方式打开SQLPLUS查询

SQL> select value,nlstype,dump(value) dv from yorker.test;

VALUE                NLSTYPE              DV
-------------------- -------------------- ------------------------------------
中文                 SQLPLUS default      Typ=1 Len=6: 228,184,173,230,150,135

显示正常,Oracle服务器读取字段的二进制内容,根据客户端的编码,转换成’中文‘在客户端编码对应的编码内容发送到客户端。

dump(value)就是服务器端’中文‘的16进制编码的内容,utf8的内容形式。

4在客户端设置 nls_lang后进入SQLPLUS

C:\>set nls_lang=american_america.utf8

C:\>sqlplus sys/sys as sysdba

SQL> select value,nlstype,dump(value) dv from yorker.test;
VALUE                          NLSTYPE                        DV
------------------------------ ------------------------------ --------------------------------------
涓枃                           SQLPLUS default                Typ=1 Len=6: 228,184,173,230,150,135

查询到的结果如上出现烂码,原因是SQLPLUS在查询的时候,告诉了Oracle服务器客户端的编码为UTF8,这时候Oracle不做转换把以UTF8编码的内容’中文‘发送到

SQLPLUS,而SQLPLUS却以操作系统的编码(比如ZHS16GBK)去识别这个内容,结果就是不能识别的烂码。set nls_lang=american_america.utf8后不以utf8编码的形式来识别字符是烂码的原因,Oracle存储的内容实施正确的,是utf8的正确形式,在别的客户端仍然可以正确显示(如默认方式的SQLPLUS,JAVA应用程序等)

5,在客户端设置为utf8的sqlplus插入数据

C:\>set nls_lang=american_america.utf8

C:\>sqlplus sys/sys as sysdba

SQL> insert into yorker.test values('中文','SQLPLUS UTF8');

这时候发生了一个“错误”,’中文‘是以操作系统的ZHS16GBK的编码格式发送到Oracle服务器的,同时sqlplus又告诉了服务器发送的编码是utf8,所以Oracle服务器不做转换把ZHS16GBK编码格式的’中文‘保存到了服务器的磁盘上,但是Oracle认为这个编码是utf8,下次如果别的客户端,不是utf8的客户端在查询的时候,Oracle做转换,这时候会转换不正确,因为ZHS16GBK编码格式的’中文‘在utf8里可能找不到对应的字符或者是不同的字符。

5,在客户端设置为utf8的sqlplus查询数据

C:\>set nls_lang=american_america.utf8

C:\>sqlplus sys/sys as sysdba

SQL> select value,nlstype,dump(value) dv from yorker.test;
VALUE                          NLSTYPE                        DV
------------------------------ ------------------------------ ---------------------------------------
中文                            SQLPLUS UTF8                   Typ=1 Len=4: 214,208,206,196

刚才以utf8的编码显示正确,这是因为“错上加错”就对了:sqlplus告诉Oracle客户端是utf8,Oracle不做转换直接把数据库保存的二进制内容发到了客户端,由于和保存的时候的内容是一致的,所以仍然能够正确显示。

这时候如果客户端设置的nls_lang不是和服务器的utf8一样,服务器在发送到客户端之前做了一个’转换‘,显示就不对了,如下例:

??                 SQLPLUS UTF8         Typ=1 Len=4: 214,208,206,196

在一个JAVA的客户端应用程序中

private static void testEncoding() throws SQLException {
Connection conn = NONXADBUtil.getConnection("ORCL");
PreparedStatement sta = conn.prepareStatement("select value,nlstype,dump(value) dv from yorker.test");
ResultSet rset = sta.executeQuery();
while (rset.next()) {
System.out.println(rset.getString(1) + "   " + rset.getString(2) + "  "+ rset.getString(3) );
}
rset.close();
sta.close();
conn.close();
}

显示的内容如下:

中文   SQLPLUS default  Typ=1 Len=6: 228,184,173,230,150,135
��   SQLPLUS UTF8  Typ=1 Len=4: 214,208,206,196

发生烂码的原因是,Oracle将’中文‘(214,208,206,196)以utf8的编码格式识别,识别出错,转换成JAVA客服端想要的字符这一步更是’错烂‘的完成的。

*在导入导出的时候遵循的原则,

导出时:客户端设置nls_lang和数据源的数据库一致。

导入时:客户端设置为导出时设置的编码,如果导出是由别人完成,一定要知道导出时候设置的编码。导入时候要设置成和导出时候一致。

导出的文件第2,第3个字节记录的是该文件的编码,用ultraedir可以查看,是16进制。比方说为03 54,先转成10进制得到

select to_number('0354','xxxx') from dual 得到 852,在可以通过 select nls_charset_name(852) from dual 知道是ZHS16GBK





原文链接:http://blog.csdn.net/kkdelta/article/details/7200199
加载中
返回顶部
顶部