标题说明了一切。我的问题是关于不同的字符串等价方法的效率。我经常使用<代码>。equalsIgnoreCase(String str),因为我对它很有兴趣。但我开始怀疑这是否是寻找字符串之间等价性的最有效方法。在我看来,。equalsIgnoreCase(String str)
正在调用一种大小写转换方法toupercase
或toLowerCase
,然后在其定义中调用equals
,但我可能错了。那么,以下哪种方法在以下情况或任何情况下更有效?
int count = 0;//checks for face cards at indexes listed in selectedCards
// Selected cards is Integer ArrayList
for(; (count < selectedCards.size() && count < 3); count++)
{
if(cardAt(selectedCards.get(count)).rank().equalsIgnoreCase("Queen"))
count++;
else if(cardAt(selectedCards.get(count)).rank().equalsIgnoreCase("King"))
count++;
if(cardAt(selectedCards.get(count)).rank().equalsIgnoreCase("Jack"))
count++;
}
if(count == 3)
return true;
return false;
JMH使微基准测试变得容易:
更新:将输入字符串设置为参数以处理来自JMH上帝Alexey ShiPilev的评论。我将目标字符串保留为常量,因为OP的用例是将输入字符串与常量进行比较。
@State(Benchmark)
public class StrComp {
@Param({"Queen", "queen", "King"})
public String input;
@Benchmark
public boolean eqIgnoreCase() {
return input.equalsIgnoreCase("queen");
}
@Benchmark
public boolean eqToLower() {
return input.toLowerCase().equals("queen");
}
public static void main(String[] args) throws RunnerException {
Options opt = new OptionsBuilder()
.include(".*StrComp.*")
.mode(Mode.AverageTime)
.timeUnit(TimeUnit.NANOSECONDS)
.forks(5)
.warmupIterations(10)
.measurementIterations(10)
.build();
new Runner(opt).run();
}
}
和输出:
Benchmark Mode Cnt Score Error Units
StrComp.eqIgnoreCase avgt 50 18.581 ± 0.051 ns/op
StrComp.eqToLower avgt 50 54.796 ± 0.173 ns/op
使用参数更新输出:
Benchmark (input) Mode Cnt Score Error Units
StrComp.eqIgnoreCase Queen avgt 50 17.947 ± 0.205 ns/op
StrComp.eqIgnoreCase queen avgt 50 15.553 ± 0.159 ns/op
StrComp.eqIgnoreCase King avgt 50 2.968 ± 0.037 ns/op
StrComp.eqToLower Queen avgt 50 56.499 ± 0.180 ns/op
StrComp.eqToLower queen avgt 50 22.023 ± 0.040 ns/op
StrComp.eqToLower King avgt 50 49.174 ± 0.145 ns/op
因此,eqIgnoreCase速度更快,但除非每秒进行一百万次比较,否则不会注意到任何差异。
您可以四处玩玩,看看如果第一个字符串已经是小写或字符串的长度不同等,差异会如何影响。
无论如何,如果你想让你的代码更“高效”,更清晰,更安全,更不容易出现bug,那么就不要使用字符串。使用枚举。
卡片组非常适合使用enum实现,它经常用于说明enum的概念:http://docs.oracle.com/javase/8/docs/technotes/guides/language/enums.html#Card
令人惊讶的是,由于一些奇怪的Unicode原因,这些方法并不等价:
toUpperCase("ß")
返回"SS"
,即两个字母,而equalsIgnoreCase
按字符工作toUpperCase
和toLowerCase
都不够,您必须同时执行关于效率,我敢打赌,equalsIgnoreCase要快得多,因为它不会复制任何数据。它还从长度比较开始。
还要注意的是,toUpperCase和toLowerCase敏感,而equalsIgnoreCase不敏感。IIRC如果使用外来语言环境,性能会降低。
最好、最简单的优化方法是事先对套管进行规范化。没有理由在您的数据中有“Queen”、“Queen”和“Queen”——请尽快清理输入。
您还可以使用枚举来表示排名。
恐怕,你的循环坏了。在任何一张JQK之后,你跳过一张牌,这是有意的吗???
执行以下操作
不使用enum
s和早期规范化的代码如下所示:
int count = 0;
// Whatever Position is
for (Position p : selectedCards) {
String rank = cardAt(p).rank();
if (rank.equalsIgnoreCase("Jack")
|| rank.equalsIgnoreCase("Queen")
|| rank.equalsIgnoreCase("King")) {
++count;
if (count > 3) { // Tiny and probably useless optimization.
return false;
}
}
return count == 3;
您可以自己简单地检查代码(它包含在SDK中)。
这个equalsIgnoreCase比toUperCase()快。equals()在java 8中,代码为:
while (len-- > 0) {
char c1 = ta[to++];
char c2 = pa[po++];
if (c1 == c2) {
continue;
}
if (ignoreCase) {
// If characters don't match but case may be ignored,
// try converting both characters to uppercase.
// If the results match, then the comparison scan should
// continue.
char u1 = Character.toUpperCase(c1);
char u2 = Character.toUpperCase(c2);
if (u1 == u2) {
continue;
}
// Unfortunately, conversion to uppercase does not work properly
// for the Georgian alphabet, which has strange rules about case
// conversion. So we need to make one last check before
// exiting.
if (Character.toLowerCase(u1) == Character.toLowerCase(u2)) {
continue;
}
}
return false;
}
return true;
因此,如果比较的字符串实际上不同,它将比第一次调用toUpderCase然后等于更快,因为toUperCase将修改所有字符。此外,toUperCase中涉及的逻辑似乎比比较循环中更复杂,它在最后创建了一个新的String对象。
但你需要进行大量的比较操作才能真正看到任何差异。