服务器之家

服务器之家 > 正文

java 中HashCode重复的可能性

时间:2020-12-08 14:47     来源/作者:steeven

javaHashCode重复的可能性

今天有同事提议用String的hashcode得到int类型作为主键。其实hashcode重复的可能性超大,下面是java的缺省算法:  

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
public int hashCode() {
  int h = hash;
  if (h == 0) {
    int off = offset;
    char val[] = value;
    int len = count;
 
      for (int i = 0; i < len; i++) {
        h = 31*h + val[off++];
      }
      hash = h;
    }
    return h;
  }

但是什么情况下会重复?下面是测试代码

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
import java.util.HashMap;
 
public class Test {
 
  static HashMap map = new HashMap();
 
  private static char startChar = 'A';
 
  private static char endChar = 'z';
 
  private static int offset = endChar - startChar + 1;
 
  private static int dup = 0;
 
  public static void main(String[] args) {
    int len = 3;
    char[] chars = new char[len];
    tryBit(chars, len);
    System.out.println((int)Math.pow(offset, len) + ":" + dup);
  }
 
  private static void tryBit(char[] chars, int i) {
    for (char j = startChar; j <= endChar; j++) {
      chars[i - 1] = j;
      if (i > 1)
        tryBit(chars, i - 1);
      else
        test(chars);
    }
  }
 
  private static void test(char[] chars) {
 
    String str = new String(chars).replaceAll("[^a-zA-Z_]", "").toUpperCase();// 195112:0
    //String str = new String(chars).toLowerCase();//195112:6612
    //String str = new String(chars).replaceAll("[^a-zA-Z_]","");//195112:122500
    //String str = new String(chars);//195112:138510
    int hash = str.hashCode();
    if (map.containsKey(hash)) {
      String s = (String) map.get(hash);
      if (!s.equals(str)) {
        dup++;
        System.out.println(s + ":" + str);
      }
    } else {
      map.put(hash, str);
      // System.out.println(str);
    }
  }
}

在A-z范围内有特殊字符,从结果看,仅仅3位长度的字符串:

不处理: 138510次重复

去掉字母意外字符: 122500次重复

所有字符转小写:6612次重复(少了很多)

去掉字母意外字符,并且转小写:没有重复!4位字符串也没见重复

不难看出:

1. 缺省实现为英文字母优化
2. 字母大小写可能导致重复

可能:

长字符串可能hashcode重复
中文字符串和特殊字符可能hashcode重复

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持,如有疑问请留言或者到本站社区交流讨论,大家共同进步!

原文链接:http://www.cnblogs.com/steeven/archive/2005/03/24/124493.html

标签:

相关文章

热门资讯

2022年最旺的微信头像大全 微信头像2022年最新版图片
2022年最旺的微信头像大全 微信头像2022年最新版图片 2022-01-10
蜘蛛侠3英雄无归3正片免费播放 蜘蛛侠3在线观看免费高清完整
蜘蛛侠3英雄无归3正片免费播放 蜘蛛侠3在线观看免费高清完整 2021-08-24
背刺什么意思 网络词语背刺是什么梗
背刺什么意思 网络词语背刺是什么梗 2020-05-22
yue是什么意思 网络流行语yue了是什么梗
yue是什么意思 网络流行语yue了是什么梗 2020-10-11
暖暖日本高清免费中文 暖暖在线观看免费完整版韩国
暖暖日本高清免费中文 暖暖在线观看免费完整版韩国 2021-05-08
返回顶部