前几天写了一个分表程序,用的hash算法是crc32,分表的函数如下:
function _get_hash_table($station) { $str = crc32($station); debug($str); $hash = substr(abs($str), 0, 2); return 'table' . ($hash % 10); }
首先在本地32位window机上生成好数据并插入对应的表中。但是再把程序和数据传到服务器上(64为linux),发现查不到数据。经过排查后发现,原来服务器上crc32的结果和本地不同。再查php手册才知,crc32的接口原来和机器有关。
php手册的描述:
Because PHP's integer type is signed many crc32 checksums will result in negative integers on 32bit platforms. On 64bit installations all crc32() results will be positive integers though.
crc32返回的结果在32位机上会产生溢出,所以结果可能为负数。而在64位机上不会溢出,所以总是正值。
CRC算法是按字长位数bit进行计算的。
crc32函数会按照php中的两个常量参考计算 PHP_INT_SIZE,PHP_INT_MAX
这两个常量的定义:
整型数的字长和平台有关,尽管通常最大值是大约二十亿(32 位有符号)。PHP 不支持无符号整数。Integer值的字长可以用常量PHP_INT_SIZE来表示,自 PHP 4.4.0 和 PHP 5.0.5后,最大值可以用常量PHP_INT_MAX来表示。
输出下32位中PHP_INT_SIZE:4,PHP_INT_MAX:2147483647
输出下64位中PHP_INT_SIZE:8,PHP_INT_MAX:9223372036854775807
解决方法:
function _get_hash_table($station) { $checksum = crc32($station); //decbin($str); if (8 == PHP_INT_SIZE) {//64位机,进行移位从处理成和32机一样 if ($checksum > 2147483647) { $checksum = $checksum & (2147483647);//对64位机的先进截取后32位 $checksum = ~($checksum - 1);//取补码 $checksum = $checksum & 2147483647;//由于补码操作的修改,但是这时的checksum是正值而不是负值 } } debug($checksum . ':'); $hash = substr(abs($checksum), 0, 2);//此处的abs是完全必要的 return 'transit_dijkstra' . ($hash % 10); }