您的位置:首页技术文章
文章详情页

Oracle基本数据类型存储格式浅析:字符类型

【字号: 日期:2023-11-20 11:17:39浏览:4作者:猪猪
前一阵看完文档,对Oracle的基本数据类型的存储格式有了一些了解,最近有做了一些测试进行了验证。打算整理总结一下,这一篇主要说明字符类型的存储格式。主要包括char、varchar2和long等几种类型。SQL> create table test_char (char_col char(10), varchar_col varchar2(10), long_col long);表已创建。SQL> insert into test_char values ('abc', '123', ',fd');已创建 1 行。SQL> commit;提交完成。SQL> select rowid from test_char;ROWID------------------AAAB3LAAFAAAAAgAAA根据rowid的定义规则,第7~9位是表示的是数据文件,F表示5,而10~15位表示的是在这个数据文件中的第几个BLOCK,g表示32。(rowid编码相当于64进制。用A~Z a~z 0~9 + /共64个字符表示。A表示0,B表示1,……,a表示26,……,0表示52,……,+表示62,/表示63。)我们根据计算的结果去dump这个block。SQL> ALTER SYSTEM DUMP DATAFILE 5 BLOCK 32;系统已更改。打开产生的trace文件:data_block_dump,data header at 0x3421064===============tsiz: 0x1f98hsiz: 0x14pbl: 0x03421064bdba: 0x01400020 76543210flag=--------ntab=1nrow=1frre=-1fsbo=0x14fseo=0x1f82avsp=0x1f6etosp=0x1f6e0xe:pti[0] nrow=1 offs=00x12:pri[0] offs=0x1f82block_row_dump:tab 0, row 0, @0x1f82tl: 22 fb: --H-FL-- lb: 0x1; cc: 3col; 0: [10]; 61 62 63 20 20 20 20 20 20 20col; 1: [ 3]; 31 32 33col; 2: [ 3]; 2c 66 64end_of_block_dumpEnd dump data blocks tsn: 5 file#: 5 minblk 32 maxblk 32观察dump出来的结果,可以发现以下几点:1.对于每个字段,除了保存字段的值以外,还会保存当前字段中数据的长度。而且,oracle显然没有把字段的长度定义或类型定义保存在block中,这些信息保存在oracle的数据字典里面。2. 根据dump的结果,可以清楚的看到,字符类型在数据库中是以ascii格式存储的。SQL> select chr(to_number('61', 'xx')) from dual;CH--a3.char类型为定长格式,存储的时候会在字符串后面填补空格,而varchar2和long类型都是变长的。SQL> SELECT DUMP(CHAR_COL, 16) D_CHAR FROM TEST_CHAR;D_CHAR-------------------------------------------------------------Typ=96 Len=10: 61,62,63,20,20,20,20,20,20,20SQL> SELECT DUMP(VARCHAR_COL, 16) D_VARCHAR2 FROM TEST_CHAR;D_VARCHAR2-------------------------------------------------------------Typ=1 Len=3: 31,32,33SQL> SELECT DUMP(LONG_COL, 16) D_VARCHAR2 FROM TEST_CHAR;SELECT DUMP(LONG_COL, 16) D_VARCHAR2 FROM TEST_CHAR *ERROR 位于第 1 行:ORA-00997: 非法使用 LONG 数据类型由于DUMP不支持LONG类型,因此我们使用了alter system dump block的方式,通过比较两种方式得到的结果,发现DUMP()函数不但方便,结果清楚,而且指出了进行DUMP的数据类型,在以后的例子中,除非必要的情况,否则都会采用DUMP()函数的方式进行说明。下面看一下插入中文的情况,首先看一下数据库的字符集SQL> select name, value$ from sys.props$ where name like '%CHARACTERSET%';NAMEVALUE$ ------------------------------ ------------------------------NLS_CHARACTERSET;;;;ZHS16GBKNLS_NCHAR_CHARACTERSET AL16UTF16SQL> insert into test_char values ('定长', '变长', null);已创建 1 行。SQL> SELECT DUMP(CHAR_COL, 16) D_CHAR FROM TEST_CHAR;D_CHAR----------------------------------------------------------------Typ=96 Len=10: 61,62,63,20,20,20,20,20,20,20Typ=96 Len=10: b6,a8,b3,a4,20,20,20,20,20,20SQL> SELECT DUMP(VARCHAR_COL, 16) D_VARCHAR2 FROM TEST_CHAR;D_VARCHAR2----------------------------------------------------------------Typ=1 Len=3: 31,32,33Typ=1 Len=4: b1,e4,b3,a4根据dump结果,可以清楚的看出,普通英文字符和标点用一个字节表示,而中文字符或中文标点需要两个字节来表示。下面,对比一下nchar和nvarchar2与char、varchar2类型有什么不同。SQL> create table test_nchar (nchar_col nchar(10), nvarchar_col nvarchar2(10));表已创建。SQL> insert into test_nchar values ('nchar定长', 'nvarchar变长');已创建 1 行。从这里已经可以看出一些不同了,假如按照刚才中文的计算方法,'nvarchar变长'的长度是8+2*2=12已经超过了数据类型定义的大小,可是为什么插入成功了?还是dump一下看看结果吧。SQL> select dump(nchar_col, 16) from test_nchar;DUMP(NCHAR_COL,16)--------------------------------------------------------------Typ=96 Len=20: 0,6e,0,63,0,68,0,61,0,72,5b,9a,95,7f,0,20,0,20,0,20SQL> select dump(nvarchar_col, 16) from test_nchar;DUMP(NVARCHAR_COL,16)--------------------------------------------------------------Typ=1 Len=20: 0,6e,0,76,0,61,0,72,0,63,0,68,0,61,0,72,53,d8,95,7f这下就明白了,虽然仍然是采用ascii码存储,但是nchar使用的AL16UTF16字符集,编码长度变为2个字节。这样中文使用两个字节,对于可以用一个字节就表示的英文字符,采用了高位补0的方式凑足2位,这样,对于采用AL16UTF16字符集的nchar类型,无论中文还是英文都用2位字符表示。因此'nvarchar变长'的长度是10,并没有超过数据类型的限制。
标签: Oracle 数据库