以下核心代码就是在一段文字中检索出有用的手机号,并且通过号段判断出运营商品牌、号码类型(移动电话、小灵通、固定电话)及是否为标准手机号码,如果检测到了就以数据形式返回,如果不是标准的手机号码就会自动过滤掉。
这段函数是从互联网上找的,用在毛票票的时候我已经修复了一些BUG,并补充了一些运营品牌方的号段。
function findThePhoneNumbers($oldStr = ""){ // 检测字符串是否为空 $oldStr=" ".trim($oldStr)." "; $numbers = array(); if(empty($oldStr)){ return $numbers; } // 删除86-180640741122,0997-8611222之类的号码中间的减号(-) $strArr = explode("-", $oldStr); $newStr = $strArr[0]; for ($i=1; $i < count($strArr); $i++) { if (preg_match("/\d{2}$/", $newStr) && preg_match("/^\d{11}/", $strArr[$i])){ $newStr .= $strArr[$i]; } elseif (preg_match("/\d{3,4}$/", $newStr) && preg_match("/^\d{7,8}/", $strArr[$i])) { $newStr .= $strArr[$i]; } else { $newStr .= "-".$strArr[$i]; } } // 手机号的获取 $reg='/\D(?:86)?(\d{11})\D/is';//匹配数字的正则表达式 preg_match_all($reg,$newStr,$result); $nums = array(); // * 中国移动:China Mobile // * 134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188,172,178,195,198 $cm = "/^1(34[0-8]|(3[5-9]|5[017-9]|7[28]|8[278]|9[58])\d)\d{7}$/"; // * 中国联通:China Unicom // * 130,131,132,152,155,156,185,186,171,175,176 $cu = "/^1(3[0-2]|5[256]|7[156]|8[56])\d{8}$/"; // * 中国电信:China Telecom // * 133,1349,153,180,189,170,173,174,177,181,191,199 $ct = "/^1((33|53|8[019]|7[0347]|9[19])[0-9]|349)\d{7}$/"; // foreach ($result[1] as $key => $value) { if(preg_match($cm,$value)){ $nums[] = array("number" => $value, "type" => "中国移动"); }elseif(preg_match($cu,$value)){ $nums[] = array("number" => $value, "type" => "中国联通"); }elseif(preg_match($ct,$value)){ $nums[] = array("number" => $value, "type" => "中国电信"); }else{ // 非法号码 } } $numbers["mobile"] = $nums; // 固定电话或小灵通的获取 $reg='/\D(0\d{10,12})\D/is';//匹配数字的正则表达式 preg_match_all($reg,$newStr,$result); $nums = array(); // * 大陆地区固定电话或小灵通 // * 区号:010,020,021,022,023,024,025,027,028,029 // * 号码:七位或八位 $phs = "/^0(10|2[0-5789]|\d{3})\d{7,8}$/"; foreach ($result[1] as $key => $value) { if(preg_match($phs, $value)){ $nums[] = array("number" => $value, "type" => "固定电话或小灵通"); } else { // 非法 } } $numbers["landline"] = $nums; // 有可能是没有区号的固定电话的获取 $reg='/\D(\d{7,8})\D/is';//匹配数字的正则表达式 preg_match_all($reg,$newStr,$result); $nums = array(); foreach ($result[1] as $key => $value) { $nums[] = array("number" => $value, "type" => "没有区号的固定电话"); } $numbers["possible"] = $nums; // 返回最终数组 return $numbers; }
调用示例的几种方式:
$str = "这是一段测试文字,我的手机号码是15901118888,再留下一个错误的电话1580000111,这个电话号码是少一位的,会被过滤掉。比如133开头的手机号码有13012345678,或是固定电话51919847等,小灵通010-8825011这些号码都是可以识别出来的,现在就运行一下,试试吧!"; $nums = findThePhoneNumbers($str); echo "-----------输出整体数组,包含移动电话(移动、联通、电信)、小灵通、固话的类型及运营品牌"; print_r($nums); echo "-----------以下为只返回移动电话的数组信息"; $mobile=$nums["mobile"]; print_r($mobile); echo "-----------以下为只返回移动电话的“第一个”“号码”\n"; echo $nums["mobile"][0]["number"]."\n"; echo "-----------以下为输出所有获取到的手机号码,只要号码,不要其它\n"; $mobile=$nums["mobile"]; foreach ($mobile as $tel) { echo $tel["number"]."\n"; }
运行结果:
-----------输出整体数组,包含移动电话(移动、联通、电信)、小灵通、固话的类型及运营品牌 Array ( [mobile] => Array ( [0] => Array ( [number] => 15901118888 [type] => 中国移动 ) [1] => Array ( [number] => 13012345678 [type] => 中国联通 ) ) [landline] => Array ( ) [possible] => Array ( [0] => Array ( [number] => 51919847 [type] => 没有区号的固定电话 ) ) ) -----------以下为只返回移动电话的数组信息 Array ( [0] => Array ( [number] => 15901118888 [type] => 中国移动 ) [1] => Array ( [number] => 13012345678 [type] => 中国联通 ) ) -----------以下为只返回移动电话的“第一个”“号码” 15901118888 -----------以下为输出所有获取到的手机号码,只要号码,不要其它 15901118888 13012345678