如何正确的重写hashcode()-阿里云开发者社区

开发者社区> 李子捌> 正文

如何正确的重写hashcode()

简介: 如何正确的重写hashcode()
+关注继续查看
(福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅998元/3年,立即抢购>>>:9i0i.cn/aliyun

福利推荐:阿里云、腾讯云、华为云等大品牌云产品全线2折优惠活动来袭,4核8G云服务器899元/3年,新老用户共享优惠,点击这里立即抢购>>>

1、简介

不知道大家有没有在开发中重写过hashcode方法,或者在面试中遇到相关的问题。比如一些比较基础的Java工作岗位可能会问:你有使用过对象作为HashMap的key吗?

这个问题其实考察的就是程序员对应hashcode方法重写的相关知识点,如下HashMap的put方法截图可以看出,往容器中添加元素计算hash值时,调用了key对象的hashcode方法。

image

image

如何正确的重写hashcode方法?

这其实是一个非常常见而又看似非常简单的问题,但是真正能写的很完善的程序员小捌见得确实不多。(往往越迷人的越危险,越简单的越复杂!!!)

image

大家往下瞅,看看自己属不属于那个写的很完善的程序员!

2、正文

2.1 什么时候重写

在深入研究如何重写hashcode方法之前,必须要先明白什么时候需要重写hashcode?

关于这个问题,总结起来就一句话:需要重写equals方法的类,都需要重写hashcode方法!

那这个时候你肯定会问,什么时候需要重写equals方法呢?

关于这个问题小捌已经在上一篇文章中讲过啦,需要的兄弟们可以去我的专栏《Java小知识100例》系列看看,顺便点波订阅,关注小捌学习Java不迷路哦!

image


2.2 如何重写

hashcode方法是Java的java.lang.Object提供的本地方法,这个方法在jvm中实现,它能返回当前对象在内存中地址。

// 返回对象在内存中的地址

public native int hashCode();

所以当我们的类未重写hashcode方法,且类的其余超类也未重写;那么我们在调用hashcode方法时,它将永远返回的是对象的内存地址。这可能不是你想要的结果,那我们如何来重写它呢?

思路

首先我们需要知道,我们是通过对象的域来计算hash的,在对象中域无非数组、引用类型、基本数据类型,有这么多类型的域,我们肯定不能选择某一个域的hash值来作为对象的hashcode方法的返回值;因此我们考虑将域的hash值累加起来返回!

  • 基本数据类型,大家可以参考其对应的包装类型的hashcode方法
  • 引用类型则直接调用hashcode()
  • 数组类型则需要遍历数组,依次调用hashcode()

通用实现

这是java.util.Objects提供的hash方法,用于计算hashcode。虽然这个不是一个计算hashcode的银弹,但是我们可以借鉴这种实现,而且Java JDK源码中大部分类的hashcode都是类似这种实现方式!

public static int hash(Object... values) {

? ? return Arrays.hashCode(values);

}

public static int hashCode(Object a[]) {

? ? if (a == null)

? ? ? ? return 0;


? ? int result = 1;


? ? for (Object element : a)

? ? ? ? result = 31 * result + (element == null ? 0 : element.hashCode());


? ? return result;

}

这个方法大致可以分为两步:

  1. 如果a==null,则返回hashcode为0
  2. 如果a != null,则遍历每一个域,域不为null,则调用域的hashcode方法并累加

这其中有一个非常显眼的数字 31,每次循环时会将当前result*31,这是为什么呢?

其实每次计算result*31的作用是为了,防止hash冲突!因为如果不设置一个乘积因子,result计算的结果比较小,非常容易在累加的过程后出现相同的hash值,这种情况不是我们想见到的!

那为什么是31呢?31为什么能成为JDK计算团队选中的真命天子,就不能是2?不能是1001?

其实使用31作为乘积因子是有原因的,其原因小捌觉得有三点:

  1. 31是一个不大不小的数,它不会过小导致hashcode计算的结果容易发生冲突;因为返回值是一个int整数类型也不至于过大,导致hashcode返回值溢出。
  2. 31是一个奇数,一个数与奇数相乘,不容易丢失低位;因为乘以2相当于无符号左移一位,这样会在低位补0,这样的话hashcode计算的值,就非常容易冲突了。
  3. 31对虚拟机的识别非常友好,对于虚拟机来说31 = 2^5 - 1,他能针对这种数字做优化并转换为位运算,因此相乘的时候性能较好

小捌在这里分别用乘积因子2和乘积因子31做个测试:

package com.liziba.part2;


import org.apache.commons.lang3.RandomStringUtils;


import java.util.ArrayList;

import java.util.Comparator;

import java.util.List;

import java.util.Objects;


/**

?* <p>

?* HashCode方法测试

?* </p>

?*

?* @Author: Liziba

?* @Date: 2021/10/24 11:54

?*/

public class HashCodeMethodDemo {


? ? /**

? ? ?* 计算hashcode

? ? ?*

? ? ?* @param value ? ? ? ? 需计算hashcode字符串

? ? ?* @param capacity ? ? ?乘数因子

? ? ?* @return

? ? ?*/

? ? public static int hashCode(String value, int capacity) {


? ? ? ? int hash = 0;

? ? ? ? if (Objects.nonNull(value) && value.length() > 0) {

? ? ? ? ? ? char[] chars = value.toCharArray();

? ? ? ? ? ? for (int i = 0; i < chars.length; i++) {

? ? ? ? ? ? ? ? hash = capacity * hash + chars[i];

? ? ? ? ? ? }

? ? ? ? }


? ? ? ? return hash;

? ? }



? ? /**

? ? ?* hash值冲突比较

? ? ?*

? ? ?* @param capacity

? ? ?* @param hashValues

? ? ?*/

? ? public static void conflictCompare(int capacity, List<Integer> hashValues) {


? ? ? ? Comparator<Integer> comparator = (x, y) -> (x > y) ? 1 : ((x < y) ? -1 : 0);

? ? ? ? Integer max = hashValues.stream().max(comparator).get();

? ? ? ? Integer min = hashValues.stream().min(comparator).get();

? ? ? ? long conflictNum = hashValues.size() - hashValues.stream().distinct().count();

? ? ? ? double conflictRate = conflictNum * 1.0 / hashValues.size() ;


? ? ? ? System.out.println(String.format("乘数因子capacity=%d 冲突数=%d 冲突率:%.4f%% 最大值:%d 最小hashCode:%d",

? ? ? ? ? ? ? ? capacity, conflictNum, conflictRate * 100, max, min));

? ? }


? ??

? ?

? ? public static void main(String[] args) {


? ? ? ? int num = 100000;

? ? ? ? int capacity2 = 2;

? ? ? ? int capacity31 = 31;

? ? ? ? List<Integer> hashValues2 = new ArrayList<>(num);

? ? ? ? List<Integer> hashValues31 = new ArrayList<>(num);

? ? ? ? for (int i = 0; i < num; i++) {

? ? ? ? ? ? // 生成随机数 org.apache.commons.lang3.RandomStringUtils

? ? ? ? ? ? String value = RandomStringUtils.randomAlphabetic(15);

? ? ? ? ? ? hashValues2.add(hashCode(value, capacity2));

? ? ? ? ? ? hashValues31.add(hashCode(value, capacity31));

? ? ? ? }


? ? ? ? conflictCompare(capacity2, hashValues2);

? ? ? ? conflictCompare(capacity31, hashValues31);


? ? }


}

一共测试10万个15位长的随机字符串

  • 当乘数因子为2时,冲突率接近4%
  • 当乘数因子为31时,冲突率只有0.0010%

image



那是不是重写hashcode方法的时候,都需要乘上31呢?

这肯定不是这样的啦!乘积因子31只是为了减小hash冲突的一种解决方案,当你用不上的时候肯定不需要使用乘积因子啦!

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
9473 0
使用SSH远程登录阿里云ECS服务器
远程连接服务器以及配置环境
2460 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的,?mysql的 3306,?mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建. ? have?fun! ?将编程看作是一门艺术,而不单单是个技术。
10839 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13151 0
腾讯云服务器 设置ngxin + fastdfs +tomcat 开机自启动
在tomcat中新建一个可以启动的 .sh 脚本文件 /usr/local/tomcat7/bin/ export JAVA_HOME=/usr/local/java/jdk7 export PATH=$JAVA_HOME/bin/:$PATH export CLASSPATH=.
4619 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
6882 0
阿里云服务器ECS登录用户名是什么?系统不同默认账号也不同
阿里云服务器Windows系统默认用户名administrator,Linux镜像服务器用户名root
4002 0
+关注
李子捌
简介: CSDN优秀作者、华为云专家 领域: Java框架、并发编程、分布式、微服务、Redis、HarmonyOS、中间件等技术
240
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载


http://www.vxiaotou.com