«

php如何利用正则只匹配汉字

时间:2024-3-10 21:57     作者:韩俊     分类: PHP


这篇文章主要介绍“php如何利用正则只匹配汉字”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“php如何利用正则只匹配汉字”文章能帮助大家解决问题。


在php中,可以利用正则表达式“/[x{4e00}-x{9fff}]+/u”和preg_match_all()函数来只匹配汉字,语法“preg_match_all("/[x{4e00}-x{9fff}”。preg_match_all()函数会搜索字符串中所有可以和正则表达式匹配的结果,配合“/[x{4e00}-x{9fff}]+/u”可以过滤字符串,只获取汉字字符。

在php中,可以利用正则表达式“

/[x{4e00}-x{9fff}]+/u

”和preg_match_all()函数来只匹配汉字。


preg_match_all()函数会搜索字符串中所有可以和正则表达式匹配的结果


preg_match_all(pattern,subject,matches,flags,offset)


参数说明如下:

  • pattern:要搜索的模式,也就是定义好的正则表达式;

  • subject:要搜索的字符串;

  • matches:可选参数(多维数组),用来存放所有匹配的结果, 数组排序通过 $flags 指定;

  • flags:可选参数,可以结合下面几个标记使用(注意不能同时使用 PREG_PATTERN_ORDER 和 PREG_SET_ORDER):

    • PREG_PATTERN_ORDER:结果排序为 $matches[0] 保存完整模式的所有匹配,$matches[1] 保存第一个子组的所有匹配,以此类推。

    • PREG_SET_ORDER:结果排序为 $matches[0] 包含第一次匹配得到的所有匹配(包含子组), $matches[1] 是包含第二次匹配到的所有匹配(包含子组)的数组,以此类推。

    • PREG_OFFSET_CAPTURE:如果这个标记被传递,每个发现的匹配返回时会增加它相对目标字符串的偏移量。注意这会改变 $matches 中的每一个匹配结果字符串元素,使其成为一个第 0 个元素为匹配结果字符串,第 1 个元素为匹配结果字符串在 subject 中的偏移量。

  • offset:可选参数,$offset 用于从目标字符串中指定位置开始搜索(单位是字节)。

preg_match_all() 函数可以返回 pattern 的匹配次数(可能是 0),如果发生错误则返回 FALSE。

preg_match_all()函数配合正则表达式“

/[x{4e00}-x{9fff}]+/u
”可以过滤字符串,只获取汉字字符。


注:preg_match_all()函数会将匹配的函数字符一个个存入数组中(该数组由第三个参数指定)。


<?php
header("Content-type:text/html;charset=utf-8");
$str = "欢迎4546来到php这里。zblog,我的?#$%^天呀&())*(&^";
echo $str;
preg_match_all("/[x{4e00}-x{9fff}]+/u","$str",$arr);
var_dump($arr);
?>


此时可以使用 implode()函数将结果值拼接成一个字符串。


implode('',$arr[0])


扩展知识:implode()函数

implode() 函数返回一个由数组元素组合成的字符串。


implode(separator,array)


  • separator:可选。规定数组元素之间放置的内容。默认是 ""(空字符串)。

  • array:必需。要组合为字符串的数组。

返回值:返回一个由数组元素组合成的字符串。

还有一个和 implode() 函数功能相同的函数:join() ,join() 函数是 implode() 函数的别名。

标签: php php教程

热门推荐