Elasticsearch 用英文、数字搜索都特别快,中文搜索就耗时*10倍?
搜索其实就是比较数据是否存在一致的部分,而现代计算机的所有底层逻辑都是基于二进制,所以比较的也是这些二进制数据是否一致。 对于字符类型,英文和数字,每个字符都只占一个字节,而中文一个字符可能占多个字节,2个、3个、4个字节都有可能。从哪个字节到哪个字节算是一个中文字符,都是个麻烦事。所以解析处理中文会很耗时。