本文共 454 字,大约阅读时间需要 1 分钟。
在中文应用管理系统里,utf8格式取代gb2312数据库存储越来越多的被设置成默认格式,这种国际化的编码格式在解决文本格式兼容性方面带来了很大的好处。 但是UTF8使用用3个字节表示1个汉字,在编码上没有考虑拼音排序,所以在使用UTF8的ORACLE数据库中直接使用order by进行排序是不行的;GB2312按汉字使用频率把汉字分为一级和二级. 内码的排列次序, 先一级(3755个)再二级(3008个), 一级是按照拼音, 二级按照笔划,所以对于一级汉字是可以直接使用“order by”进行编码的,而且一级汉字包含了最常用的3755个汉字,故而在数据库中选择直接的“order by”虽然不能对所有汉字实现正确的排序,但是还是非常有效的。解决思路:把UTF8编码转变成GB2312即可实现对高频词的排序。 select cpname from USER_INFORMATION order by convert(cpname,'ZHS16CGB231280','UTF8') desc
转载 来自: