«

PHP在一段文字或字符串中提取手机号码和运营商品牌

时间:2024-3-3 10:46     作者:韩俊     分类: PHP


以下核心代码就是在一段文字中检索出有用的手机号,并且通过号段判断出运营商品牌、号码类型(移动电话、小灵通、固定电话)及是否为标准手机号码,如果检测到了就以数据形式返回,如果不是标准的手机号码就会自动过滤掉。

这段函数是从互联网上找的,用在毛票票的时候我已经修复了一些BUG,并补充了一些运营品牌方的号段。

function findThePhoneNumbers($oldStr = ""){
  // 检测字符串是否为空
  $oldStr=" ".trim($oldStr)." ";
  $numbers = array();
  if(empty($oldStr)){
return $numbers;
  }
  // 删除86-180640741122,0997-8611222之类的号码中间的减号(-)
  $strArr = explode("-", $oldStr);
  $newStr = $strArr[0];
  for ($i=1; $i < count($strArr); $i++) { 
if (preg_match("/\d{2}$/", $newStr) && preg_match("/^\d{11}/", $strArr[$i])){
  $newStr .= $strArr[$i]; 
} elseif (preg_match("/\d{3,4}$/", $newStr) && preg_match("/^\d{7,8}/", $strArr[$i])) {
  $newStr .= $strArr[$i]; 
} else {
  $newStr .= "-".$strArr[$i]; 
} 
  }
  // 手机号的获取
  $reg='/\D(?:86)?(\d{11})\D/is';//匹配数字的正则表达式
  preg_match_all($reg,$newStr,$result);
  $nums = array();
  // * 中国移动:China Mobile
  // * 134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188,172,178,195,198
  $cm = "/^1(34[0-8]|(3[5-9]|5[017-9]|7[28]|8[278]|9[58])\d)\d{7}$/";
  // * 中国联通:China Unicom
  // * 130,131,132,152,155,156,185,186,171,175,176
  $cu = "/^1(3[0-2]|5[256]|7[156]|8[56])\d{8}$/";
  // * 中国电信:China Telecom
  // * 133,1349,153,180,189,170,173,174,177,181,191,199
  $ct = "/^1((33|53|8[019]|7[0347]|9[19])[0-9]|349)\d{7}$/";
  //
  foreach ($result[1] as $key => $value) {
if(preg_match($cm,$value)){
  $nums[] = array("number" => $value, "type" => "中国移动");
}elseif(preg_match($cu,$value)){
  $nums[] = array("number" => $value, "type" => "中国联通");
}elseif(preg_match($ct,$value)){
  $nums[] = array("number" => $value, "type" => "中国电信");
}else{
  // 非法号码
}
  }
  $numbers["mobile"] = $nums;
  // 固定电话或小灵通的获取
  $reg='/\D(0\d{10,12})\D/is';//匹配数字的正则表达式
  preg_match_all($reg,$newStr,$result);
  $nums = array();
  // * 大陆地区固定电话或小灵通
  // * 区号:010,020,021,022,023,024,025,027,028,029
  // * 号码:七位或八位
  $phs = "/^0(10|2[0-5789]|\d{3})\d{7,8}$/";
  foreach ($result[1] as $key => $value) {
if(preg_match($phs, $value)){
  $nums[] = array("number" => $value, "type" => "固定电话或小灵通");
} else {
  // 非法
}
  }
  $numbers["landline"] = $nums;
  // 有可能是没有区号的固定电话的获取
  $reg='/\D(\d{7,8})\D/is';//匹配数字的正则表达式
  preg_match_all($reg,$newStr,$result);
  $nums = array();
  foreach ($result[1] as $key => $value) {
$nums[] = array("number" => $value, "type" => "没有区号的固定电话");
  }
  $numbers["possible"] = $nums;
  // 返回最终数组
  return $numbers;
}

调用示例的几种方式:

$str = "这是一段测试文字,我的手机号码是15901118888,再留下一个错误的电话1580000111,这个电话号码是少一位的,会被过滤掉。比如133开头的手机号码有13012345678,或是固定电话51919847等,小灵通010-8825011这些号码都是可以识别出来的,现在就运行一下,试试吧!";
$nums = findThePhoneNumbers($str);

echo "-----------输出整体数组,包含移动电话(移动、联通、电信)、小灵通、固话的类型及运营品牌";
print_r($nums);

echo "-----------以下为只返回移动电话的数组信息";
$mobile=$nums["mobile"];
print_r($mobile);

echo "-----------以下为只返回移动电话的“第一个”“号码”\n";
echo $nums["mobile"][0]["number"]."\n";

echo "-----------以下为输出所有获取到的手机号码,只要号码,不要其它\n";
$mobile=$nums["mobile"];
foreach ($mobile as $tel) {
    echo $tel["number"]."\n";
}

运行结果:

-----------输出整体数组,包含移动电话(移动、联通、电信)、小灵通、固话的类型及运营品牌
Array
(
    [mobile] => Array
        (
            [0] => Array
                (
                    [number] => 15901118888
                    [type] => 中国移动
                )
            [1] => Array
                (
                    [number] => 13012345678
                    [type] => 中国联通
                )
        )
    [landline] => Array
        (
        )
    [possible] => Array
        (
            [0] => Array
                (
                    [number] => 51919847
                    [type] => 没有区号的固定电话
                )
        )
)

-----------以下为只返回移动电话的数组信息
Array
(
    [0] => Array
        (
            [number] => 15901118888
            [type] => 中国移动
        )
    [1] => Array
        (
            [number] => 13012345678
            [type] => 中国联通
        )
)

-----------以下为只返回移动电话的“第一个”“号码”
15901118888

-----------以下为输出所有获取到的手机号码,只要号码,不要其它
15901118888
13012345678


标签: php php教程

热门推荐