用非西方字符对字符串排序
问题内容:
我想打印所有可用语言的排序波兰语名称。
import java.util.*;
public class Tmp
{
public static void main(String... args)
{
Locale.setDefault(new Locale("pl","PL"));
Locale[] locales = Locale.getAvailableLocales();
ArrayList<String> langs = new ArrayList<String>();
for(Locale loc: locales) {
String lng = loc.getDisplayLanguage();
if(!lng.trim().equals("") && ! langs.contains(lng)){
langs.add(lng);
}
}
Collections.sort(langs);
for(String str: langs){
System.out.println(str);
}
}
}
不幸的是我对排序部分有疑问。输出为:
:
:
kataloński
koreański
litewski
macedoński
:
:
węgierski
włoski
łotewski
不幸的是,波兰语的ł
出现l
前后,m
因此输出应为:
:
:
kataloński
koreański
litewski
łotewski
macedoński
:
:
węgierski
włoski
我该怎么做?是否存在一种通用的非语言相关的方法(例如,我现在要显示此方法,并使用另一种排序规则以另一种语言进行排序)。
问题答案:
您应该将整理器传递给sort方法:
// sort according to default locale
Collections.sort(langs, Collator.getInstance());
默认的排序顺序是由字符串中的Unicode代码点定义的,并且在任何语言中都不是正确的字母顺序。