博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
oracle中文(utf8)按拼音排序的简单解决方案
阅读量:4049 次
发布时间:2019-05-25

本文共 454 字,大约阅读时间需要 1 分钟。

在中文应用管理系统里,utf8格式取代gb2312数据库存储越来越多的被设置成默认格式,这种国际化的编码格式在解决文本格式兼容性方面带来了很大的好处。 但是UTF8使用用3个字节表示1个汉字,在编码上没有考虑拼音排序,所以在使用UTF8的ORACLE数据库中直接使用order by进行排序是不行的;GB2312按汉字使用频率把汉字分为一级和二级. 内码的排列次序, 先一级(3755个)再二级(3008个), 一级是按照拼音, 二级按照笔划,所以对于一级汉字是可以直接使用“order by”进行编码的,而且一级汉字包含了最常用的3755个汉字,故而在数据库中选择直接的“order by”虽然不能对所有汉字实现正确的排序,但是还是非常有效的。

解决思路:把UTF8编码转变成GB2312即可实现对高频词的排序。  select cpname from USER_INFORMATION order by convert(cpname,'ZHS16CGB231280','UTF8') desc

转载 来自:

你可能感兴趣的文章
关于phpcms中模块_tag.class.php中的pc_tag()方法的含义
查看>>
vsftp 配置具有匿名登录也有系统用户登录,系统用户有管理权限,匿名只有下载权限。
查看>>
linux安装usb wifi接收器
查看>>
多线程使用随机函数需要注意的一点
查看>>
getpeername,getsockname
查看>>
让我做你的下一行Code
查看>>
浅析:setsockopt()改善程序的健壮性
查看>>
关于对象赋值及返回临时对象过程中的构造与析构
查看>>
VS 2005 CRT函数的安全性增强版本
查看>>
Visual Studio 2010:C++0x新特性
查看>>
drwtsn32.exe和adplus.vbs进行dump文件抓取
查看>>
cppcheck c++静态代码检查
查看>>
在C++中使用Lua
查看>>
一些socket的编程经验
查看>>
socket编程中select的使用
查看>>
可以在线C++编译的工具站点
查看>>
关于无人驾驶的过去、现在以及未来,看这篇文章就够了!
查看>>
所谓的进步和提升,就是完成认知升级
查看>>
为什么读了很多书,却学不到什么东西?
查看>>
长文干货:如何轻松应对工作中最棘手的13种场景?
查看>>